반응형
자연어처리에서 사용하는 단어의 표현 방법
국소 표현(Local Representation)
국소표현이란? 해당 단어 그 자체만 보고, 특정값을 매핑하여 단어를 표현하는 방법
국소표현의 종류
- One-hot vector
- N-gram
- Count Based
- Bag-of-Word, BoW(DTM) : 단어의 빈도수를 카운트하여 단어를 수치화하는 표현 -> Bow란?
분산 표현(Continuous Representation)
분산 표현이란? 분산 표현 방법은 그 단어를 표현하고자 주변을 참고하여 단어를 표현하는 방법
분산 표현의 종류
- Prediction Based
- Word2Vec(FastText) : 예측을 기반으로 단어의 뉘앙스를 표현 -> Word2Vec란?
- Doc2Vec: Word2Vec에서 확장된 개념
- Count based
- Full Document
- LSA : 단어의 뉘앙스를 반영하는 연속 표현
- Windows
- Glove : 예측과 카운트 두 가지 방법 모두 사용함
- Full Document
반응형
'인공지능(AI) > 자연어처리(NLP)' 카테고리의 다른 글
[LM 평가지표] Perplexity, PPL (0) | 2022.02.04 |
---|---|
[NLP] 워드투벡터(Word2Vec) (2) | 2021.10.13 |
[NLP] 단어 표현 방법 : Bag-of-Word Model(Bow) (0) | 2021.10.13 |
[논문리뷰] Transformer(Attention is All you Need) 이해하기 (0) | 2021.05.07 |
[NLP 개념] 언어모델(Language Model) (0) | 2021.05.03 |