6-1. 이미지 데이터
1. 이미지 데이터
이미지 데이터
- 이미지 데이터를 이용한 데이터 분석 및 모델링에서 중요한 포인트:
- Domain: 의료, 교통, 사물, 풍경, 사람, 패션, ...
- Task: Classification, Detection, Segmentation, Generation, Feature Extraction, ...
- Quality: 적절한 데이터셋
- +) 추가 수집 과정, Fine Tuning을 위한 데이터 전처리도 중요
이미지 데이터 EDA
- 문제 정의, 도메인 지식 습득 이후 EDA 진행
- Target 중심: 분포 위주의 초기 비교 (정형 데이터 해석)
- Input 중심: 이미지 데이터의 개별 비교 (도메인 지식)
- Process 중심: [전처리-모델-결과해석] 반복
이미지 데이터 수집
데이터 수집 시 고려할 사항
- 수집 경로
- 데이터의 한계
- 데이터 학습 비용 (메모리, 연산 비용, 시간)
이미지 데이터 포맷
Color Space
![[Pasted image 20240823095725.png]]
(https://learn.microsoft.com/ko-kr/windows/win32/wic/jpeg-ycbcr-support)
- RGB: 빛의 삼원색의 합으로 색을 표현 (컴퓨터 그래픽에 활용)
- HSV: 인간의 색인지와 유사 (Hue 색상, Saturation 채도, Value 명도)
- CMY(K): RGB의 보색으로 인쇄에 용이