5. Object Detection 주요 Dataset 소개 & PASCAL VOC Dataset의 이해

인프런 ‘[개정판] 딥러닝 컴퓨터 비전 완벽 가이드’ 강의를 수강하며 공부한 내용을 정리한 글입니다.

Object Detection과 Segmentation을 위한 주요 Dataset

주요 Dataset 소개

주요 Dataset 소개

MS COCO: PASCAL VOC보다 다양, 실제 이미지에 더 가깝다. (1개 이미지에 1개 json은 아쉽다…)

많은 Detection과 Segmentation 딥러닝 패키지가 아래 Dataset들을 기반으로 Pretrained 되어 배포 (주로 MS COCO 사용)

PASCAL VOC 2012

PASCAL VOC 2012

PASCAL VOC 2012

주로 2012버전 사용

Annotation

Annotation

이미지의 Detection 정보를 별도의 설명 파일로 제공되는 것을 일반적으로 Annotation 이라고 함.

Annotation은 Object의 Bounding Box 위치Object 이름등을 특정 포맷으로 제공함.

PASCAL VOC Dataset 구조

PASCAL VOC Dataset 구조

Annotations: Xml 포맷이며, 개별 xml파일은 한 개 image에 대한 Annotation 정보를 가지고 있음. 확장자 xml을 제외한 파일명은 image 파일명(확장자 jpg를 제외한)과 동일하게 매핑
ImageSet: 어떤 이미지를 train, test, trainval, val에 사용할 것인지에 대한 매핑 정보를 개별 오브젝트별로 파일로 가지고 있음.
JPEGImages: Detection과 Segmentation에 사용될 원본 이미지
SegmentationClass: Semantic Segmentation에 사용될 masking 이미지
SegmentationObject: Instance Segmentation에 사용될 masking 이미지

출처