데싸노트의 실전에서 통하는 머신러닝, 머신러닝의 Cheat Sheet
골든래빗 출판사로부터 책을 제공받아 작성했습니다
데싸노트의 실전에서 통하는 머신러닝
을 선택하기 전에 반드시 아셔야 할 내용이 하나 있습니다. 머신러닝과 딥러닝은 다른 것입니다. 입문 단계에서 가장 많이 헷갈리고 혼용하는 것이 용어입니다. 동일 카테고리에서 특히 많은 혼동이 있는 듯 합니다. 이제는 조금 옛날 이야기가 되어버렸지만 새롭게 인공지능의 붐을 일으킨 알파고 이후 인공지능 == 머신러닝 == 딥러닝
으로 알고 있는 사람이 많아져 더욱 용어에 혼란을 느끼는 사람이 많은 듯 합니다. 그래서 이 책은 제목 그대로 머신러닝
만을 다루고 있습니다. CNN, RNN, transfomer, GAN 등을 기대하고 이 책을 읽으실 생각이면 다른 책을 찾으러 가셔야 합니다.
각 장은 다양한 머신러닝 알고리즘 중 선정된 10가지 알고리즘을 간단한 데이터 셋을 이용해 해당 알고리즘에 맞는 데이터 셋과 풀이 전처리에 대해서 이야기 하고 있습니다. 탑 다운 학습자와 바텀 업 학습자에게 모두 괜찮은 책입니다. 책에서 소개하는 10가지 기법 말고도 머신러닝에는 다양한 기법들이 존재하지만 책에서 다루고 있는 10가지 조차 제대로 이해하고 다룰 수 없다면 사실 다른 알고리즘을 사용하긴 쉽지 않습니다. 탑 다운 학습자의 문제는 지식에 구멍이 뚫려 있다는 것입니다. 아마 그런 문제를 해결하고 싶으셔서 이 책을 고민하고 계실겁니다. 써보긴 했는데 정확히 이렇게 쓰는게 맞는건가 싶기도 하고, 데이터 셋을 좀 더 잘 만져보고 싶으신 분들에게 준 레퍼런스용으로 괜찮다고 생각합니다.
위 이미지처럼 사용할 알고리즘과 데이터 셋, 평가지표 등 요소를 한 눈에 볼 수 있는 편집 덕에 바텀 업 학습자들에게 특징과 어떤 결과를 얻어내기 위해 분석하고 알고리즘을 사용하는지 이해하기 용이 했습니다.
또 데이터 셋을 막상 열었고, 예제를 따라하고는 있지만 각 특징들의 의미를 이해 못한 채 타자 연습만 하기도 하고, 각 특징들을 분석하면서 설명은 해주지만 한 눈에 가시화가 안되서 답답했던 경험이 있었어서 이런 편집에 가산점을 주고 싶습니다. 이런 특징들의 세부 내용을 알고 분석하기 위해선 해당 도메인 지식이 어느정도 수반되기는 하지만 고민 할 수 있는 기회를 한 번 더 주기 때문에 만족스러운 책의 특징이었습니다.
마지막으로 이 책의 장점으로 해당 장에서 새롭게 나온 함수들을 이렇게 정리해줘서 봤던거 같은데?로 해당 함수를 빠르게 찾을 수 있다는 것입니다. 이미지에 나온 함수들의 경우 데이터 분석을 좀 해보신 분들이라면 저게 뭐 그리 어려운 함수라고 그러지라고 생각하실 수도 있습니다. 하지만 처음 학습하는 학습자에게는 익숙해지기 전까지 볼 때마다 새로운게 함수고, 한 번 더 정리해서 볼 수 있고, 필요에 따라선 전 장에 정리 된 함수를 모아서 일종의 Cheat Sheet를 만들 수 있는 유용한 요소 였습니다.
3줄 요약
- 머신러닝과 딥러닝이 다르다는 것을 명심하고 해당 도서는 머신러닝 책이다
- 탑다운, 바텀업 모두에게 추천 할 만 하다
- 데이터 셋 및 목표 요약, 데이터 셋 분석, 함수 정리는 이 책의 큰 편집적 장점이다.