형태소 분석 회사 목록 및 매뉴얼
고어 형태소 분석기와는 달리, 현대어 형태소 분석기는 매우 많은 회사들이 개발하였다.
처음엔 눈에 띄지 않았는데, 내가 개발하는 엔진이 약간 돌아가는 시점에서 많은 회사들의 제품들이 눈에 들어왔다.
대학 연구소쪽은 국내 AI의 황제들을 통해서 많이 찾아봤다.
내일 아침부터 아무 일도 못하는데, 오늘은 하루 종일 구글링만 했다....
1) 크리스탈인포 : 네이버에 있을 때 개발한 형태소 분석 시스템이라고 하는데, 지금도 쓰이는지는 알 수 없다.
메인 개발자였던 분이 운영하는 블로그다. 1차 버전 개발기간 3개월, 상용화까지 1년이상 소요되었다고 한다. 한번 만나보고 싶을 정도로 대단한 실력의 소유자인 것 같다.
2) 모란소프트 : 다음 커뮤니케이션즈와 엠파스에 제공된 형태소 분석 시스템이라고 한다.
CJK 형태소분석기의 매뉴얼이다. 내가 개발한 엔진의 매뉴얼과 API가 상당히 유사하다. 일단, Pure C로 만들어졌기 때문에 API가 내게 매우 친숙하고, 확률정보를 이용하는 방법도 유사하다. API 자체만으로도 분석해볼 대상인 듯하다.
3) 더자랩 : 드림아이커뮤니케이션즈에서 사용하는 검색엔진을 제작한 회사라고 한다. 1차 형태소분석 시스템을 2004년에 개발했다. 데모 페이지의 결과는 학술적으로 이용하기는 그다지 적합하지 않다. 분석 속도에 중점을 둔 듯하다.
4) MACH : 심광섭(성신여대 컴공) & 양재형 (강남대) 분들이 함께 개발한 Supersonic 형태소 분석기이다. 상용화탑재가 된 적이 있는지는 잘 모르겠다. 데모 시스템은 돌아가지 않고 있다.
5) 고려대학교 자연어처리연구실 : 학술적으로 개발했거나, 21세기 세종계획의 코퍼스 구축에 쓰인 도구인 듯하다. 코퍼스 구축에서 여러가지 후보를 내는 것이 목적같다. 데모 사이트에서 결과를 볼 수 있다.
6) 국민대학교 자연어처리연구실 : 서열로 따지자면 가장 상위에 올라가야 하는 대표적인 형태소분석 사이트지만, 검색하다보니 아래에 위치하게 됐다. 강승식 교수님이 만든 KLT(구,HAM) 형태소분석기 사이트이다. 한글 스펠러는 나모 웹 에디터에 장착되어 있다.
7) 부산대학교 한국어정보처리연구실 : 권혁철 교수님의 지도하에 있는 국가지정연구실이다. 온톨로지를 포함한 많은 사이트들을 개발했는데, 작년까지로 진행과제들이 모두 종결된 듯하다. 현재 진행과제는 알 수 없고, 데모사이트가 없어서 안타깝다.
나라인포테크도 이 연구실과 밀접하다.
8) 워드워즈 : 재작년에 설립된 언어처리 회사로 CMU 출신들을 중심으로 모여있다.
현재 대표로 계신 서승현 선생님의 (고요한 하늘님이 잘못되었다고 알려주셨습니다. 감사합니다.) 서승현 선생님과 친분이 있는 분의 블로그다.
9) 쓰리소프트 : 지능형 검색 솔루션 및 형태소 분석 시스템을 개발한 회사다. 연혁도 오래되었고, 정보검색 쪽에서는 가장 큰 회사가 아닐까 싶다. 형태소분석기의 소개 사이트이다.
10) 울산대학교 한국어처리연구실 : 옥철영 교수님의 지도하에 다양한 언어처리 솔루션을 개발한다. 데모 사이트는 제작중이라 보기 힘들다.
11) 충북대 자연어처리 연구실 : 서영훈 교수님의 지도하에 언어처리 솔루션 개발중이다.
12) 서강대 자연어처리 연구실 : 서정연 교수님의 지도하에 있고, 다이퀘스트라는 검색회사를 설립했다. 다이퀘스트는 현재 접속불가능하다.(AnonymousY 님이 알려주셨습니다. 감사합니다.)
13) 포항공대 자연어처리연구실 : 이근배 교수님의 지도하에 있다.
14) 경북대 언어정보처리연구실 : 이상조 교수님의 지도하에 있다.
15) 포항공대 지식언어공학연구실 : 이종혁 교수님의 지도하에 있다. 세종전자사전의 전산처리를 담당하고 있다.
세종사전을 이용한 형태소분석기를 개발한 바 있다. 데모시스템은 공개하지 않았다.
검색을 해도 업계의 동향을 모르면 놓치는 게 많다.... 다이퀘스트 기업홍보란에서 퍼온 기사다.
http://itnews.inews24.com/php/news_view.php?g_serial=316355&g_menu=020200