728x90
반응형
PASCAL VOC
XML format
20개의 오브젝트 카테고리
MS COCO
json Format
80개의 오브젝트 카테고리
Google Open Images
csv Format
600개의 오브젝트 카테고리
* 많은 detection과 segmentation 딥러닝 패키지가 위의 dataset을 기반으로 pretrained 되어 배포됨
Annotation이란?
=> 이미지의 detection정보를 별도의 설명 파일로 제공되는 것을 일반적으로 annotation이라고 함. ( 주석, 설명
annotation은 object의 bounding box 위치나 object이름 등 특정 포맷을 제공함
<annotation>
<folder>VOC2012</folder>
<filename>2007_000032.jpg</filename> # file에 대한 정보를 가짐
<source>
<dataset>the VOC2007 Database</dataset>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size>
<width>500</width>
<height>281</height>
<depth>3</depth>
</size>
<segmented>1</segmented>
<object> # 개별 object 정보
<name>aeroplane</name>
<pose>Frontal</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>104</xmin>
<ymin>78</ymin>
<xmax>375</xmax>
<ymax>183</ymax>
</bndbox>
</object>
<object>
<name>aeroplane</name>
<pose>Left</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>104</xmin>
<ymin>78</ymin>
<xmax>375</xmax>
<ymax>183</ymax>
</bndbox>
</object>
</annotation>
VOCdevkit
- VOC2012
-- annotations : xml format이며, 개별 xml file은 1개 image에 대한 annotation 정보를 가짐. 확장자 xml을 제회한 파일명은 image file명과 동일함 mapping
-- imageset : 어떤 image를 train, test, trainval, val에 사용할 것인지에 대한 mapping 정보를 개별 object별로 파일로 가지고 있음
-- JPEGimages : detection과 segmentation에 사용될 원본 image
-- segmentationClass : semantic segmentation에 사용될 masking 이미지
-- segmentationObject : instance segmentation에 사용될 masking 이미지
반응형
'Computer_Science > Computer Vision Guide' 카테고리의 다른 글
2-3. MS-COCO DATASETS (0) | 2021.09.21 |
---|---|
2-2. pascal dataset 살펴보기 (0) | 2021.09.21 |
1-9~10. 성능평가지표 mAP - 정밀도, 재현율 (0) | 2021.09.17 |
1-8. Non Max Suppression (0) | 2021.09.17 |
1-7. IoU 성능평가 [colab] (0) | 2021.09.11 |