mino28 님의 블로그

  • 홈
  • 태그
  • 방명록

WLASL 1

수화 인식 데이터

1. 동영상 데이터컴퓨터 비전에서 동영상 데이터는 연속된 이미지 프레임들의 집합으로, 단순히 공간적 정보(픽셀, 객체의 위치, 형태 등)뿐만 아니라 시간에 따른 변화(움직임, 동작, 상호작용)를 함께 포함한다는 점에서 정적인 이미지와 구별됩니다. 이러한 시공간적 특성을 활용하여 객체 추적, 행동 인식, 장면 이해, 비디오 요약 등의 다양한 응용이 가능하며, 처리 과정에서는 프레임 간 상관관계와 움직임 정보를 효과적으로 추출하는 것이 핵심 과제입니다. 2. 동영상 분석 기법1. 시계열 분석 (3D CNN)시계열 분석에서 사용하는 3D CNN은 동영상 데이터를 단순히 독립된 이미지 프레임으로 보지 않고, 공간(가로·세로) + 시간 축(프레임 순서)을 함께 고려하여 특징을 추출하는 방법입니다. 즉, 2D C..

인공지능/컴퓨터 비전 2025.09.15
이전
1
다음
더보기
프로필사진

mino28 님의 블로그

mino28 님의 블로그 입니다.

  • 분류 전체보기 (170)
    • Basic (1)
    • 인공지능 (98)
      • 파이썬 (37)
      • LLM 서비스 개발 (7)
      • 데이터 분석 (10)
      • 딥러닝 (13)
      • 컴퓨터 비전 (9)
      • 생성형 AI (3)
      • 자연어 처리 (10)
      • AI Agent (8)
      • 로봇 시스템 개발 (1)
    • 백엔드 (37)
      • Node.js (9)
      • Java (24)
      • SpringBoot (4)
    • 프론트엔드 (34)
      • HTML , CSS (13)
      • Javascript (21)
      • React (0)
      • Swift (0)

Tag

DataSet, 트랜스포머, 인코더, 바운딩 박스, 데이터셋, GRU, 패딩, 반복문, yolo, 파이토치, CNN, 오버라이딩, 디코더, softmax, 컴퓨터 비전, DataLoader, 제어문, Transformer, length, 분류,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바