728x90
반응형

PASCAL VOC

XML format

20개의 오브젝트 카테고리

MS COCO

json Format

80개의 오브젝트 카테고리

 

Google Open Images

csv Format

600개의 오브젝트 카테고리

 

* 많은 detection과 segmentation 딥러닝 패키지가 위의 dataset을 기반으로 pretrained 되어 배포됨

 

 

Annotation이란?

=> 이미지의 detection정보를 별도의 설명 파일로 제공되는 것을 일반적으로 annotation이라고 함. ( 주석, 설명

annotation은 object의 bounding box 위치나 object이름 등 특정 포맷을 제공함

<annotation>

	<folder>VOC2012</folder>
    <filename>2007_000032.jpg</filename>  # file에 대한 정보를 가짐
    <source>
    	<dataset>the VOC2007 Database</dataset>
    	<annotation>PASCAL VOC2007</annotation>
    	<image>flickr</image>
	</source>

	<size>
    	<width>500</width>
    	<height>281</height>
    	<depth>3</depth>        
	</size>    
    <segmented>1</segmented>    

	<object>                          # 개별 object 정보
    	<name>aeroplane</name>
    	<pose>Frontal</pose>
    	<truncated>0</truncated>        
    	<difficult>0</difficult>
        <bndbox>
	        <xmin>104</xmin>
	        <ymin>78</ymin>
	        <xmax>375</xmax> 
	        <ymax>183</ymax>            
        </bndbox>        
	</object>
    
    <object>
    	<name>aeroplane</name>
    	<pose>Left</pose>
    	<truncated>0</truncated>        
    	<difficult>0</difficult>
        <bndbox>
	        <xmin>104</xmin>
	        <ymin>78</ymin>
	        <xmax>375</xmax> 
	        <ymax>183</ymax>            
        </bndbox>        
	</object>    

</annotation>

VOCdevkit

- VOC2012

-- annotations : xml format이며, 개별 xml file은 1개 image에 대한 annotation 정보를 가짐. 확장자 xml을 제회한 파일명은 image file명과 동일함 mapping

-- imageset : 어떤 image를 train, test, trainval, val에 사용할 것인지에 대한 mapping 정보를 개별 object별로 파일로 가지고 있음

-- JPEGimages : detection과 segmentation에 사용될 원본 image

-- segmentationClass : semantic segmentation에 사용될 masking 이미지

-- segmentationObject : instance segmentation에 사용될 masking 이미지

 

 

 

반응형

+ Recent posts