http://www.ibm.com/developerworks/kr/interview/2007_08_1.html
이번 인터뷰에서는 오픈소스 검색엔진인 루씬을 기반으로 블로그리더라는 검색 서비스를 개발중인 권영길 님을 만났습니다. ‘플랫폼으로서의 검색’과 검색의 미래에 대한 권영길 님의 생각을 들어보시죠.
권영길 | 그루터 대표 |
||||
검색엔진 개발은 어떻게 시작하셨나요. 원래 경제학을 전공했고 1996년에 직장 생활을 시작하면서 통계 업무를 했습니다. 당시 사용하던 도구들이 주로 비주얼 베이직으로 만들어진 것이었는데 쓰다 보니 불편한 점들이 눈에 띄더군요. 코드를 보니 if, else, then밖에(?) 없어 보이고 '나도 할 수 있겠다' 싶어 1997년부터 프로그래밍을 독학하기 시작했습니다. 검색 쪽에 관심이 생긴 건 1999년 모니터링 시스템 개발을 하면서부터입니다. 모니터링 시스템에는 자료가 많아 검색엔진이 필요했고 그 때부터 그야말로 '삽질'을 시작한 거죠. 전공자들은 학교에서 배울 수 있었지만 전 그런 상황은 아니라 인터넷을 열심히 뒤지면서 '검색은 이런 것일 거야' 하며 코드를 짜기 시작해 지금까지 이르렀습니다. 본격적으로 시작한 건 2000년이었는데 제가 만든 검색엔진 자체는 그다지 좋지 않았고 검색에 대한 감을 잡아간 때였죠. 2003년부터 검색 서비스를 해보려고 구상하고 있었는데 검색엔진, 특히 대용량 검색에 대해 별로 자신이 없었습니다. 1000만 건이 넘어가면 엔진이 죽는 상황을 겪다가 루씬(lucene, http://lucene.apache.org/)이란 걸 알게 됐습니다. 루씬을 테스트해 보고 '이게 바로 내가 찾던 것이고 이보다 더 잘 만들 수 없다'고 생각하고 그 이전까지 제가 만들던 것을 버렸습니다. 몇 가지 사소한 단점이 있지만 성능이나 기능 면에서는 여느 검색엔진 못지 않은 것 같습니다. 그 이후로는 루씬을 기반으로 이런 저런 실험을 해보고 있습니다. | ||||
검색 분야 개발은 '철인 N종 경기'라는 느낌이 드는데 어떻게 생각하시나요. |
현존하는 검색 기법이나 알고리듬 들이 언제까지 유효할까요. | ||||||||||||
인터뷰어가 애매한 질문을 하면 인터뷰이가 답을 하기 어렵듯이 검색엔진도 마찬가지라는 생각이 듭니다. | ||||||||||||
일반 사용자들은 검색 연산자를 쓴다든지 하는 걸 아직까지는 좀 어려워 하는 것 같은데... | ||||||||||||
검색엔진 개발 못지 않게 성능이나 운영 문제도 중요해 보입니다. | ||||||||||||
검개그(검색엔진개발자그룹 http://irgroup.org/) 운영자로 활동중이신데 검개그에 대해 소개 부탁 드립니다. | ||||||||||||
검색엔진 개발자 수는 상대적으로 적어 보이던데... | ||||||||||||
주의 깊게 지켜보는 검색 관련 서비스나 기술이 있다면. | ||||||||||||
지금 개발중이신 블로그리더에 대해 소개해 주세요. | ||||||||||||
루씬에서 개선하고 싶은 부분은 있다면 무엇인가요. | ||||||||||||
검색원으로서 국내 웹을 어떻게 보시나요. | ||||||||||||
'검색으로 인간을 이롭게 한다'는 신조는 얼마나 이루셨나요.
|