올해 마지막 서평을 쓸 책은 비즈니스 데이터 과학입니다. 요즘 데이터 과학 분야 책을 보면 모든 데이터는 인공지능/딥러닝으로 이어지던 흐름에서 ML/DL과 별개로 활용 가능한 데이터 가공 및 모델링 등 분화하는 듯 합니다. 이 책도 회귀로 시작해서 인공지능을 끝을 맺습니다. 인공지능 모델들이 현재까지는 데규모 데이터를 다루는데 효과적인 것은 현재까진 사실에 가까우니까요.
데이터 과학를 다루는 많은 책들이 대부분 Python 기반의 코드를 다루는 것과 대조적으로 개인적으로는 오랜만에 만나는 R로 쓰인 책입니다. 아무리 Pyhton이 쉽고 데이터 사이언스가 견인해서 컸다고는 하지만 통계계통 사용자들의 안식처인 R과 matlab의 규모를 무시할 수 없는 듯 합니다.
사실 이번 책은 1장을 다 읽을 쯤 까지 데이터 시각화를 다룬다고 생가했습니다. 책의 정체를 알고 다시 제목을 보니 제가 왜 그런 말도 안되는 착각을 했는지 잘 모르겠지만 이 책은 시각화에 도움이 될 수는 있지만 큰 관련이 없는 책이었습니다.
제목 그래도 의미론적인 데이터 모형화를 다루고 있는 책입니다. Semantic 의미론적인 시각으로 데이터에 접근해 데이터를 만지고 모형화하는 방법을 다루고 있습니다. 우리 인간의 언어는 불완전하고 모호한데다가 애매하기도 합니다. 이런 특성들은 모델의 정확도를 낮추는 원인이 되기도 합니다.