인공지능(AI)/자연어처리(NLP)

[NLP] 단어 표현 방법(Word Representation)

계속지나가기 2021. 10. 13. 11:31
반응형

자연어처리에서 사용하는 단어의 표현 방법

Word Representation Tree


국소 표현(Local Representation)

국소표현이란? 해당 단어 그 자체만 보고, 특정값을 매핑하여 단어를 표현하는 방법

국소표현의 종류

  • One-hot vector
  • N-gram
  • Count Based
    • Bag-of-Word, BoW(DTM) : 단어의 빈도수를 카운트하여 단어를 수치화하는 표현 -> Bow란?

 

분산 표현(Continuous Representation)

분산 표현이란? 분산 표현 방법은 그 단어를 표현하고자 주변을 참고하여 단어를 표현하는 방법

분산 표현의 종류

  • Prediction Based
    • Word2Vec(FastText) : 예측을 기반으로 단어의 뉘앙스를 표현 -> Word2Vec란?
    • Doc2Vec: Word2Vec에서 확장된 개념
  • Count based
    • Full Document
      • LSA : 단어의 뉘앙스를 반영하는 연속 표현
    • Windows
      • Glove : 예측과 카운트 두 가지 방법 모두 사용함
반응형