chatGPTAlphaGo 이후로 다시 한 번 대중의 관심을 인공지능으로 가지고 왔습니다. prompt engineer라는 용어가 나오고 중고생들부터 학계까지 광범위하게 사용하는 도구가 되었습니다. 이런 흐름 속에 입문을 고민하면서 어쩌다 데이터 분석 with 파이썬을 찾고 계실 것 같습니다.

데이터 과학이라는 큰 범주 내에서는 가까운 사이라고 생각할 수 있지만 AI의 ML/DL(머신러닝/딥러닝)에서 필요로 하는 능력과 데이터 분석은 다소 궤가 다르다고 봐야랍니다. DL을 위해서도 데이터를 분석하고 정제하는 능력이 필요하기 때문에 DL 공부를 염두에 두셔도 볼 만한 책입니다.

데이터나 과학/수치 관련 프로그래밍을 전혀 안해봤다면 왕도라고 할 수 있는 구성으로 되어있습니다. 독학을 하다보면 numpy에서 pandas에서 matplotlib에서 또 한번 고비를 맞이합니다. 그래서 저도 pandas를 별도로 다룬 책, 데이터 시각화 책을 몇 권 가지고 있습니다.

입문 단계에서는 내가 어디가 부족하고 어떤 것을 더 봐야 할지 알기 쉽지 않습니다. 그래서 어쩌다 데이터 분석 with 파이썬을 목차에 따라 따라가기를 추천드립니다. 정말 해당 라이브러리를 다뤄보지 않은 사용자를 대상으로 쓰여진 책이라 유경험자에게는 추천드리기 다소 힘든 책입니다. 다만 체계적인 흐름없이 닥치는데로 학습을 해서 과정에 구멍이 많다고 느껴지면 추천 드릴만한 책입니다.

numpy를 통한 수치연산을 배우고 pandas로 그걸 가공하고 matplotlibseaborn으로 데이터를 시각화해 데이터의 구멍을 찾아 메우는 과정에서 데이터와 친해지시면 됩니다. 흥미가 생기신다면 kaggle 등 데이터 경진 대회도 있고, 정말 책 제목처럼 어쩌다 시작하셔도 재밌는 책입니다.

정말 입문자를 위한 책이어서 기존 입문자에게는 별로 추천드리지 않습니다. 유사한 입문서적을 가지고 계시다면 중복 투자일 확률이 높습니다. 난이도는 높지 않은 편이며, 이론에 대해서는 거의 다루지 않습니다.


한빛미디어 2023 도서 서평단 "나는 리뷰어다"의 일원으로 도서를 제공받아 작성한 리뷰입니다.