728x90
반응형

- Feature Extractor Network

VGG, RESNET, INCEPTION 등

보통 imageNet dataset 기반으로 pretrained 됨

img classification model 은 원본 img보다는 size가 적지만 상대적으로는 큰 feature map이 만들어지고,

size는 점점 줄어들지만 channel(depth)의 수는 늘어남, feature map이 작아질수록 핵심적인 feature로만 추상화됨

 

- object detection network

pascal VOC / MS-COCO

Dataset 기반으로 pretrained 됨

별도의 network로 구성됨

scale 맞누는 것이나 bounding box 맞추는 것이나, classification을 하는 것

그래서 fully connected 여부나 bounding box regression를 어떻게 할건지를 조절

multiscale, feature pyramid 등 고려

 

# image Resolution, FPS, Detection 성능 상관 관계

높은 image Resolution => 높은 detection 성능 => 낮은 FPS

배열이 크기 때문에 제한된 성능으로 오랜기간 탐색

mAP <> 1/ FPS

FPS가 빨라야 하는 요구사항 => 낮은 Detection 성능

 

=> 상황에 맞게 조절해야 한다.

빠른 속도를 요구하면 precision과 fps로

 

맞추는게 중요하면 recall과 성능으로

반응형

'Computer_Science > Computer Vision Guide' 카테고리의 다른 글

3-2. RCNN Training과 Loss  (0) 2021.09.24
3-1. RCNN - region proposal 기반 OD  (0) 2021.09.24
2-6. OpenCV 영상처리  (0) 2021.09.23
2-4~5. OpenCV 개요  (0) 2021.09.21
2-3. MS-COCO DATASETS  (0) 2021.09.21

+ Recent posts