이번 글은 오픈 소스 프로젝트 중에 한국어 처리에 대한 내용입니다. 한글 형태소 분석? 구분화? 정규화? 토큰화? 어근화? 와 관련된 내용입니다. 저도 솔직히 한글 분석과 정규화에 대한 이론은 무지합니다. 그러 한글이 있다면 이 한글에 대해서 어떻게 분석할수 있는가를 고민하다가 웹 서치로 찾은 내용입니다. 그런데 생각보다 잘되어 있습니다. 물론, 보완이 좀더 되면 좋겠지만, 이정도라도 어디입니까? https://github.com/open-korean-text/open-korean-text open-korean-textOpen-source Korean Text Processor / 오픈소스 한국어 처리기 (Official Fork of twitter-korean-text)Scala/Java library..