[NLP] 단어 표현 방법(Word Representation)

2021. 10. 13. 11:31·인공지능(AI)/자연어처리(NLP)

자연어처리에서 사용하는 단어의 표현 방법

Word Representation Tree


국소 표현(Local Representation)

국소표현이란? 해당 단어 그 자체만 보고, 특정값을 매핑하여 단어를 표현하는 방법

국소표현의 종류

  • One-hot vector
  • N-gram
  • Count Based
    • Bag-of-Word, BoW(DTM) : 단어의 빈도수를 카운트하여 단어를 수치화하는 표현 -> Bow란?

 

분산 표현(Continuous Representation)

분산 표현이란? 분산 표현 방법은 그 단어를 표현하고자 주변을 참고하여 단어를 표현하는 방법

분산 표현의 종류

  • Prediction Based
    • Word2Vec(FastText) : 예측을 기반으로 단어의 뉘앙스를 표현 -> Word2Vec란?
    • Doc2Vec: Word2Vec에서 확장된 개념
  • Count based
    • Full Document
      • LSA : 단어의 뉘앙스를 반영하는 연속 표현
    • Windows
      • Glove : 예측과 카운트 두 가지 방법 모두 사용함
반응형

'인공지능(AI) > 자연어처리(NLP)' 카테고리의 다른 글

[LM 평가지표] Perplexity, PPL  (0) 2022.02.04
[NLP] 워드투벡터(Word2Vec)  (2) 2021.10.13
[NLP] 단어 표현 방법 : Bag-of-Word Model(Bow)  (0) 2021.10.13
[논문리뷰] Transformer(Attention is All you Need) 이해하기  (0) 2021.05.07
[NLP 개념] 언어모델(Language Model)  (0) 2021.05.03
'인공지능(AI)/자연어처리(NLP)' 카테고리의 다른 글
  • [LM 평가지표] Perplexity, PPL
  • [NLP] 워드투벡터(Word2Vec)
  • [NLP] 단어 표현 방법 : Bag-of-Word Model(Bow)
  • [논문리뷰] Transformer(Attention is All you Need) 이해하기
계속지나가기
계속지나가기
NLP Engineer
  • 계속지나가기
    코딩스뮤
    계속지나가기
  • 전체
    오늘
    어제
    • 코딩스뮤:)
      • Algorithm
        • 백준 문제풀이
        • 프로그래머스 문제풀이
        • 알고리즘 이론
        • 자료구조
        • SW Expert Academy
      • 인공지능(AI)
        • LLMs
        • 자연어처리(NLP)
        • 컴퓨터비전(CV)
        • 딥러닝(DL)
        • 머신러닝(ML)
        • 인공지능기초수학
        • 선형대수학
      • 컴퓨터 세팅
      • Computer Science
        • 유닉스프로그래밍
        • 프로그래밍언어론
        • 디자인패턴
        • 클린코드
        • SW 영어
        • 리눅스
        • 논리회로
      • Server
        • Docker
  • 블로그 메뉴

    • 홈
    • Who Am I(CV)
    • 태그
  • 링크

    • 깃허브 주소
  • 공지사항

  • 인기 글

  • 태그

    MaximumFlow
    알고리즘
    군집화
    SIFT
    LM
    머신러닝
    에지검출
    경사하강법
    networkflow
    디지털이미지처리
    패턴인식
    DigitalImageProcessing
    DIP
    machinelearning
    손실함수
    선형회귀
    언어모델
    비용함수
    파이썬 클린코드
    ML
    비지도학습
    최대유량
    기계학습
    ComputerVision
    NLP
    지도학습
    네트워크플로우
    결정경계
    컴퓨터비전
    f1-score
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
계속지나가기
[NLP] 단어 표현 방법(Word Representation)

티스토리툴바