인공지능(AI)/자연어처리(NLP)
[NLP] 단어 표현 방법(Word Representation)
계속지나가기
2021. 10. 13. 11:31
반응형
자연어처리에서 사용하는 단어의 표현 방법
국소 표현(Local Representation)
국소표현이란? 해당 단어 그 자체만 보고, 특정값을 매핑하여 단어를 표현하는 방법
국소표현의 종류
- One-hot vector
- N-gram
- Count Based
- Bag-of-Word, BoW(DTM) : 단어의 빈도수를 카운트하여 단어를 수치화하는 표현 -> Bow란?
분산 표현(Continuous Representation)
분산 표현이란? 분산 표현 방법은 그 단어를 표현하고자 주변을 참고하여 단어를 표현하는 방법
분산 표현의 종류
- Prediction Based
- Word2Vec(FastText) : 예측을 기반으로 단어의 뉘앙스를 표현 -> Word2Vec란?
- Doc2Vec: Word2Vec에서 확장된 개념
- Count based
- Full Document
- LSA : 단어의 뉘앙스를 반영하는 연속 표현
- Windows
- Glove : 예측과 카운트 두 가지 방법 모두 사용함
- Full Document
반응형