bussiness-data-science

올해 마지막 서평을 쓸 책은 비즈니스 데이터 과학입니다. 요즘 데이터 과학 분야 책을 보면 모든 데이터는 인공지능/딥러닝으로 이어지던 흐름에서 ML/DL과 별개로 활용 가능한 데이터 가공 및 모델링 등 분화하는 듯 합니다. 이 책도 회귀로 시작해서 인공지능을 끝을 맺습니다. 인공지능 모델들이 현재까지는 데규모 데이터를 다루는데 효과적인 것은 현재까진 사실에 가까우니까요.

데이터 과학를 다루는 많은 책들이 대부분 Python 기반의 코드를 다루는 것과 대조적으로 개인적으로는 오랜만에 만나는 R로 쓰인 책입니다. 아무리 Pyhton이 쉽고 데이터 사이언스가 견인해서 컸다고는 하지만 통계계통 사용자들의 안식처인 Rmatlab의 규모를 무시할 수 없는 듯 합니다.

R로 쓰여졌지만 코드를 중심으로 전개되는 책이 아니어서 R과 친하지 않으셔도 전혀 책을 읽고 공부하시는데 지장이 없을 듯 합니다. 물론 특정 언어의 기본 문법만 익히셨다면 언어 공부를 더 하긴 하셔야 코드가 이해가 갑니다.

수식과 그림이 데이터를 다루는 인사이트를 가져옵니다. 여러분이 아무리 숫자에 대한 감각이 좋으셔도 서로 다른 스케일을 가지고 있는 고차원 데이터를 보고 정규화나 시각화 없이 데이터를 이해한다는 것은 사실 불가능에 가깝다고 생각 됩니다. 가능하신 분은 이 책 구매를 고민하시면서 이 글을 읽지도 않으실테지만요.

전형적인 기술서의 번역체를 가지고 있지만 다듬어진 번역체라 읽는데 거슬리는 부분은 없었습니다. 책을 읽다가 멈추는 대부분의 장소는 수식 위 였고, 수식의 첨자가 어떤 함의를 가지고 있는지 이해를 위해서 였습니다.

R의 기반을 두고 계시면서 데이터 과학을 좀 더 공부해보고 싶었던 통계학과나 비전공자라면 입문서적으로 추천드릴 수 있습니다. 수식을 배제하지 않고 적극적으로 사용 중이기 때문에 수학과 전혀 관련없던 전공을 하셨다면 애로사항이 있으실 수 있지만, 데이터 과학을 위해선 시기의 차이일 뿐 수학은 하셔야 하기에 겸허히 받아드리셔야 합니다.

내년에도 서평을 계속 이어 갈지 아직 알 수는 없지만 내돈내산 서평도 꾸준히 이어가 보도록하겠습니다.


한빛미디어 2022 도서 서평단 "나는 리뷰어다"의 일원으로 도서를 제공받아 작성한 리뷰입니다.