연구자, 실무자 모두를 위한 머신러닝 도서 -머신러닝 파워드 애플리케이션 -

mysql

작년에 출간 소식을 접했을 땐 막연히 박해선 역자님의 신간이 출시 되었네 한 번 읽어봐야겠다라고 생각했던 책이었습니다. 출간 이벤트 때 책과 연이 닿지 않았고, 당장 필요한 책은 아니어서 찜 목록에 잠들어 있었습니다. 3월 리뷰 도서 리스트에서 다시 만났을 때도 제목만 보고 뭐 서빙 도구들을 연결하고, 연구와는 다른 접근법이 필요하다 정도의 상투적인 내용이지 않을까 지레짐작하며 희망 도서 3권 중 한 권으로 선택했습니다. 택배 파업으로 다소 늦게 선정 된 도서를 받았고, 책을 머릿말과 베타리더들의 추천사를 읽으면서 내가 짧은 식견으로 책을 섣불리 판단하고 만나지 못 할 뻔 한것을 깨달았습니다.

책의 부제는 완성된 제품까지를 이야기하면서 상품으로 완성돼가는 머신러닝모델을 이야기하고 있습니다. 이 책을 꼭 제품이나 서비스 구축을 위해서가 아니라 머신러닝을 이제 막 시작한 프로그래머, 좀 더 깊게 부딪히려는 초보 연구자 등 다양한 스펙트럼의 사람들에게 필요하단 생각이 들었습니다.

파트 1의 제목인 올바른 머신러닝 접근 방법 모색은 이 분야에 종사하는 모두가 알아야하는 내용이라고 생각합니다. 이 전 글들에서 한 두 번 언급한 내용이지만 2016년 알파고 이 후 인공지능/머신러닝 관심도가 수직 상승해 이제는 비전공자도 단어 정도는 익숙해진게 지금의 20년대입니다. 투자와 관심이 늘었지만, 머신러닝이 단 하나의 만능열쇠인줄 알고 사용하거나 요구하는 경우가 아직도 너무 많습니다. 전통적인 방식이 성능과 리소스 면에 우수하지만 인공지능을 써야만 한다면서 때로는 너무 과한 리소스와 복잡도를 감수하는 경우가 있습니다. 혹자는 NLP는 다 같은 언어 모델이라고 생각해 저 모델로 저건 되는데 이건 못 할게 뭐 있냐면서 분류와 기능을 구분짓기를 어려워 하기도 합니다. 제가 인공지능을 처음 배울 때 교수님 강조 하셨던 것은 이 문제를 인공지능이 아닌 다른 방법으로 풀 수 있는지 먼저 고민해라 이었습니다.

제품화하는 것은 연구 단계와는 다른 치열함을 가지고 있습니다. 때로는 연구보다 더 엄격하고 깐깐한 잣대를 들이밉니다. 돈을 받고 누군가에서 재화를 제공하는 일은 그렇습니다. 그래서 이 책에서 다루고 있는 내용은 단순히 점수가 잘 나오는 모델을 만드는 법이 아니라 당장 사용할 수 있게 단단하게 쌓여 올려가는 과정을 다룹니다. 단순히 모델 가중치를 어떻게 웹으로 보여주고 이걸 서비스하는 방법이 아니라 서비스를 위한 데이터를 어떻게 수집하고, 검증하고 모델을 그에 맞춰 발전시켜가는 방법을 다루고 있습니다. 연구는 하나의 지표에서만 성능이 잘 나와도 괜찮은 경우가 있습니다. 속도는 다소 떨어져도 정확도가 높은 모델, 같은 정확도로 경량화 된 모델 등등 연구 초점에 따라 중요시 여기는 포인트들이 다르고 해당 포인트들만 만족시키면 됩니다. 하지만 서비스 되는 모델들은 이렇게 연구실에게 만들어지고 다듬어진 모델들을 곧장 쓰기에는 여러문제에 봉착합니다. 그러한 문제를 어떻게 접근해서 풀어갈지 푼 이후에는 이제 파이프라이닝을 하고 모니터링까지 모델을 서비스에 적합하게 만들어 낸 이후 서비스를 최소 단위에서부터 점차 키워나가고 있습니다.

이 책은 연구와 서비스를 위한 모델은 어떻게 다르며, 머신러닝이라는 풀이법을 어떻게 들고 접근해야하는지 나누고 있습니다. 저는 이 책을 인공지능 분야에 종사하는 모두가 읽어보면 좋겠다고 생각합니다. 연구와 서비스는 분명 결이 다르고, 누가 더 힘들고 어려운 일을 하냐는 판가름 낼 수 있는 영역은 아닙니다. 연구의 성과가 있기에 서비스를 위해 튜닝과 재설계가 가능하고, 여러 모델들의 집합체이기 때문에 제 글의 일부 표현 때문에 연구자 분들에게 상처가 되지 않았으면합니다.

난이도: 중
추천대상: 인공지능 및 머신러닝 종사자 전반

한빛미디어 2022 도서 서평단 "나는 리뷰어다"의 일원으로 도서를 제공받아 작성한 리뷰입니다.