월례발표회 자료
2018년 4월: 최재웅 (고려대)
관리자 2018.04.19 833

숫자로 표상된 의미: 기계학습 도구 Word2Vec 사용기

최재웅 (고려대학교)



발표에서는 우선 언어학에서의 의미표상의 관점에서 의미의 수량화 문제를 간략히 살펴본 뒤에, 그러한 방향의 대표적 기법인 단어벡터화/단어임베딩 모형을 이용한 의미표상 의미조작 방법론을 소개한다. 이러한 배경을 바탕으로 최근에 각광을 받는 단어임베딩 모형 도출 기법인 기계학습 도구 Word2Vec 한국어 자료에 적용해본 결과를 중심으로 언어학적 활용 가능성을 타진해 본다. 구체적으로 Word2Vec 도출 결과물인 어휘/형태소 유사도 목록, 어휘 클래스별 목록, 어휘간 추론/유추 목록 등을 살펴본다. 아울러 단일 형태소/어휘를 넘어서 탄력적으로 어휘간 관계를 확대해 있는 기법을 활용한 결과도 검토해 본다.

×