“한국어 텍스트 분석 책이 없으면 영어 텍스트 분석하는 방법이랑 똑같이 하면서 글자만 한글로 바꾸면 되는 거 아닌가?”
하지만 처음 시작하는 사람은 한글이 깨져 보이면 ‘UTF-8 인코딩’이란 단어를 검색해야 하는 것을 모른다. 또한, 어떤 데이터로 시작해야 할지도 막막하고, 책이나 강의에서는 잘 돌아가는 코드가 내가 하면 에러가 나는 이유를 매번 누군가에게 물어보기도 어렵다. 누구나 그렇다. 아는 사람이 보면 아주 낮은 턱이라도 모르는 사람은 넘기가 어렵다.
이 책은 한국어로 된 다양한 텍스트를 다루면서, 데이터를 바꾸면서 달라지는 부분을 익히고, 같은 부분은 반복하면서 자연스럽게 넘파이, 판다스, 사이킷런을 익힐 수 있도록 고심해서 구성했다. 그런데도 3장에서 4장으로 넘어갈 때 난이도가 점프한다는 느낌을 받을 것이다. 하지만 6장을 넘어서면 드디어 2년 차 직장인처럼 “아! 비슷비슷하구나!” 하고 느낄 수 있기를 소망한다.
버전이 안 맞아서 안 되는 부분은 스스로 수정한 후 깃허브에 올려 보면 공부하는 데 도움이 많이 될 것이다. 잘 안 되어도 포기하지 말고 문의를 남겨 해결한 뒤 계속 공부하기를 바란다. 창의적인 부분에도 도전하면서 수동적 독자가 아닌 적극적 동반자로 함께하기를 바란다. 그 후에는 텍스트 분석의 방법이 딥러닝의 블랙박스를 밝히는 데도 도움이 될 것이다.