mino28 님의 블로그

  • 홈
  • 태그
  • 방명록

IDF 1

벡터화

1. 단어 사전단어 사전(Vocabulary)은 자연어 처리에서 사용되는 모든 고유한 토큰(단어, 서브워드, 문자 등)을 모아 각 토큰에 고유한 인덱스(ID)를 매핑한 집합입니다. 문장을 토크나이징한 뒤 만들어지는 단어 사전은 텍스트를 정수 시퀀스로 변환하는 기준이 되며, 모델이 문자열을 직접 처리할 수 없는 한계를 극복하게 해줍니다. 또한 단어 사전에는 학습 시 사용된 모든 토큰뿐 아니라, 사전에 없는 새로운 단어를 처리하기 위한 OOV(Out-Of-Vocabulary) 토큰 같은 특수 기호도 포함될 수 있어 실제 모델 학습과 추론 과정에서 중요한 역할을 합니다. OOVOOV(Out-Of-Vocabulary) 문제는 자연어 처리 모델이 학습 과정에서 본 적 없는 단어나 토큰이 입력에 등장했을 때 발생하..

인공지능/자연어 처리 2025.08.22
이전
1
다음
더보기
프로필사진

mino28 님의 블로그

mino28 님의 블로그 입니다.

  • 분류 전체보기 (170)
    • Basic (1)
    • 인공지능 (98)
      • 파이썬 (37)
      • LLM 서비스 개발 (7)
      • 데이터 분석 (10)
      • 딥러닝 (13)
      • 컴퓨터 비전 (9)
      • 생성형 AI (3)
      • 자연어 처리 (10)
      • AI Agent (8)
      • 로봇 시스템 개발 (1)
    • 백엔드 (37)
      • Node.js (9)
      • Java (24)
      • SpringBoot (4)
    • 프론트엔드 (34)
      • HTML , CSS (13)
      • Javascript (21)
      • React (0)
      • Swift (0)

Tag

반복문, 디코더, DataLoader, CNN, 컴퓨터 비전, 데이터셋, GRU, 분류, 제어문, softmax, length, 오버라이딩, 파이토치, 바운딩 박스, Transformer, 패딩, 인코더, DataSet, 트랜스포머, yolo,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바