728x90
반응형
Compound Scaling
- 너무 거대한 backbone, 여러겹의 fpn, 큰 입력 이미지의 크기 등의 개별적인 부분들에 집중하는 것은 비효율적
- EfficientNet에서 개별 요소들을 함께 Scaling 하면서 최적 결합을 통한 성능 향상을 보여줌
- EfficientDet에서도 backbone, BiFPN, Prediction Layer, 입력 이미지 크기를 Scaling 기반으로 최적 결합 하여 D0~D7 모델 구성
Backbone Netwrok
- EfficientNet B0~B6 로 Scaling 그대로 적용
BiFPN Network
- depth는 BiFPN 기본 반복 block을 3개로 설정하고 scaling 적용
Dbifpn = 3 + o
- width 채널 수는 {1.2, 1.25, 1.3, 1.25, 1.4, 1.45} 중 grid Search를 통해 1.35로 Scaling계수를 선택하고 이를 기반으로 Scaling 적용
Wbifpn = 64x(1.35^o)
Prediction Network
- width 채널수는 BiFPN채널 수 와 동일
- Detth는 아래식을 적용
Dbox = Dclass = 3 + [o/3]
입력 이미지 크기
Rinput = 512 + ox128
EfficientDet 기타 적용 요소 및 성능 평가
기타 적용 요소
- activation : siLU(swish)
- Loss : Focal Loss
- augmentation : horizontal flip 과 scale jittering
- NMS : soft nms
반응형
'Computer_Science > RetinaNet' 카테고리의 다른 글
11-2~3. tensorflow hub의 efficientDet 모델을 이용한 inference 실습 (0) | 2021.11.30 |
---|---|
11-1. AutoML EfficientDet 패키지 소개 (0) | 2021.11.25 |
10-6. EfficientNet (0) | 2021.10.29 |
10-4~5. EfficientDet (0) | 2021.10.28 |
10-1~3. RetinaNet 이해 (0) | 2021.10.27 |