본 프로젝트는 2020년 Deep&High Learning(AI 스쿨 3기)에서 강의를 수강하면서 진행하였던 특허 관련 프로젝트로서, 특허업계에서 근무하고 있는 필자의 관심 주제인 특허 문헌을 통해 Doc2Vec 모델을 구축/평가한 레포트의 내용을 본 포스트에 옮겨보았다. Doc2Vec을 이용한 특허 IPC 코드의 분산 표현[Distributed Representations of International Patent Classification Code with Doc2Vec] - 김승래(kingjoy87@gmail.com) 0. 요약 본 연구는 토픽이 계층적으로 분류되어 있는 방대한 특허 문헌 데이터에서, 텍스트를 비롯한 주제 토픽(IPC 코드)을 벡터로 취급하여 Doc2Vec 모델을 생성/학습시키고, ..