[NLP] 단어 표현 방법(Word Representation)

2021. 10. 13. 11:31·인공지능(AI)/자연어처리(NLP)

자연어처리에서 사용하는 단어의 표현 방법

Word Representation Tree


국소 표현(Local Representation)

국소표현이란? 해당 단어 그 자체만 보고, 특정값을 매핑하여 단어를 표현하는 방법

국소표현의 종류

  • One-hot vector
  • N-gram
  • Count Based
    • Bag-of-Word, BoW(DTM) : 단어의 빈도수를 카운트하여 단어를 수치화하는 표현 -> Bow란?

 

분산 표현(Continuous Representation)

분산 표현이란? 분산 표현 방법은 그 단어를 표현하고자 주변을 참고하여 단어를 표현하는 방법

분산 표현의 종류

  • Prediction Based
    • Word2Vec(FastText) : 예측을 기반으로 단어의 뉘앙스를 표현 -> Word2Vec란?
    • Doc2Vec: Word2Vec에서 확장된 개념
  • Count based
    • Full Document
      • LSA : 단어의 뉘앙스를 반영하는 연속 표현
    • Windows
      • Glove : 예측과 카운트 두 가지 방법 모두 사용함
반응형

'인공지능(AI) > 자연어처리(NLP)' 카테고리의 다른 글

[LM 평가지표] Perplexity, PPL  (0) 2022.02.04
[NLP] 워드투벡터(Word2Vec)  (2) 2021.10.13
[NLP] 단어 표현 방법 : Bag-of-Word Model(Bow)  (0) 2021.10.13
[논문리뷰] Transformer(Attention is All you Need) 이해하기  (0) 2021.05.07
[NLP 개념] 언어모델(Language Model)  (0) 2021.05.03
'인공지능(AI)/자연어처리(NLP)' 카테고리의 다른 글
  • [LM 평가지표] Perplexity, PPL
  • [NLP] 워드투벡터(Word2Vec)
  • [NLP] 단어 표현 방법 : Bag-of-Word Model(Bow)
  • [논문리뷰] Transformer(Attention is All you Need) 이해하기
계속지나가기
계속지나가기
NLP Engineer
  • 계속지나가기
    코딩스뮤
    계속지나가기
  • 전체
    오늘
    어제
    • 코딩스뮤:)
      • Algorithm
        • 백준 문제풀이
        • 프로그래머스 문제풀이
        • 알고리즘 이론
        • 자료구조
        • SW Expert Academy
      • 인공지능(AI)
        • LLMs
        • 자연어처리(NLP)
        • 컴퓨터비전(CV)
        • 딥러닝(DL)
        • 머신러닝(ML)
        • 인공지능기초수학
        • 선형대수학
      • 컴퓨터 세팅
      • Computer Science
        • 유닉스프로그래밍
        • 프로그래밍언어론
        • 디자인패턴
        • 클린코드
        • SW 영어
        • 리눅스
        • 논리회로
      • Server
        • Docker
      • 바이브 코딩
        • 클로드 코드
  • 블로그 메뉴

    • 홈
    • Who Am I(CV)
    • 태그
  • 링크

    • 깃허브 주소
  • 공지사항

  • 인기 글

  • 태그

    디지털이미지처리
    최대유량
    언어모델
    결정경계
    패턴인식
    networkflow
    ComputerVision
    SIFT
    네트워크플로우
    경사하강법
    컴퓨터비전
    machinelearning
    ML
    에지검출
    기계학습
    비용함수
    f1-score
    LM
    손실함수
    MaximumFlow
    알고리즘
    선형회귀
    DigitalImageProcessing
    파이썬 클린코드
    DIP
    군집화
    지도학습
    머신러닝
    비지도학습
    NLP
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
계속지나가기
[NLP] 단어 표현 방법(Word Representation)

티스토리툴바