시맨틱 데이터 모형화, -명확해지는 데이터-
사실 이번 책은 1장을 다 읽을 쯤 까지 데이터 시각화를 다룬다고 생가했습니다. 책의 정체를 알고 다시 제목을 보니 제가 왜 그런 말도 안되는 착각을 했는지 잘 모르겠지만 이 책은 시각화에 도움이 될 수는 있지만 큰 관련이 없는 책이었습니다.
제목 그래도 의미론적인 데이터 모형화를 다루고 있는 책입니다. Semantic 의미론적
인 시각으로 데이터에 접근해 데이터를 만지고 모형화하는 방법을 다루고 있습니다. 우리 인간의 언어는 불완전하고 모호한데다가 애매하기도 합니다. 이런 특성들은 모델의 정확도를 낮추는 원인이 되기도 합니다. 그래서 모델들에서 이런 요소를 배제하고, 기계와 사람 모두 오해없이 이해 할 수 있는 모델을 만들고, 이 모델을 평가하는 법 등을 다루고 있습니다.
지금까지 쉽게 접하지 못했던 분야의 책을 읽는건 좋은 경험이었지만 중간중간 너무 많은 용어의 병기는 책의 흐름을 다소 방해하는 요소였습니다. 철학, 언어학, 온톨로지 등 다양한 분야의 용어와 한국어로 명확히 번역되지 않는 단어들 때문에 분명 필요는 했습니다. 하지만 같은 페이지에서 같은 용어가 같은 단어로 번역이 되었는데 두 번 다 병기를 하고, 협의/관계/링크드 오픈 데이터/지식 습득 등 같은 용어들까지 병기의 필요가 있었냐는 의문이 남습니다. 너무 잦은 병기로 글자 간격이 벌어지다보니 읽는 흐름이 끊기고, 반/비는 한자로 그 다음 용어는 또 영어로 병기가 되는 경우도 있어 집중력을 많이 갉아 먹히는 기분이었습니다. 언어적 모호성을 다루면서 예제 문장의 조사 오탈자로 대소집합 관계가 아예 틀어져버린 문장이 재사용 되어 좀 아쉬웠습니다.
읽은면서 병기된 용어들이 대부분 설명이 필요로 하거나 추가적으로 찾아 볼만한 것들이 많아 원문에서 어떻게 쓰였는지 알려주는 것은 좋았지만, 조금 과한 면이 있었다고 생각됩니다. 최대한 오해를 줄이고, 명확한 설명을 위했다는 것은 확실히 느낄 수 있었습니다.
데이터 모델링에서 한 단계 더 도약을 해보고 싶다면 읽어볼 만한 가치는 충분히 있습니다. 언어학적 배경 지식 등에 따라서 난이도가 다르게 느껴질 것 입니다. 쉬운 책은 아니지만 충분히 도전해 볼 만한 데이터 서적이었습니다.
한빛미디어 2022 도서 서평단 "나는 리뷰어다"
의 일원으로 도서를 제공받아 작성한 리뷰입니다.