728x90
반응형

Compound Scaling

- 너무 거대한 backbone, 여러겹의 fpn, 큰 입력 이미지의 크기 등의 개별적인 부분들에 집중하는 것은 비효율적

- EfficientNet에서 개별 요소들을 함께 Scaling 하면서 최적 결합을 통한 성능 향상을 보여줌

- EfficientDet에서도 backbone, BiFPN, Prediction Layer, 입력 이미지 크기를 Scaling 기반으로 최적 결합 하여 D0~D7 모델 구성

Backbone Netwrok

- EfficientNet B0~B6 로 Scaling 그대로 적용

BiFPN Network

- depth는 BiFPN 기본 반복 block을 3개로 설정하고 scaling 적용

Dbifpn = 3 + o

- width 채널 수는 {1.2, 1.25, 1.3, 1.25, 1.4, 1.45} 중 grid Search를 통해 1.35로 Scaling계수를 선택하고 이를 기반으로 Scaling 적용

Wbifpn = 64x(1.35^o)

Prediction Network

- width 채널수는 BiFPN채널 수 와 동일

- Detth는 아래식을 적용

Dbox = Dclass = 3 + [o/3]

입력 이미지 크기

Rinput = 512 + ox128

 

 

EfficientDet 기타 적용 요소 및 성능 평가

기타 적용 요소

- activation : siLU(swish)

- Loss : Focal Loss

- augmentation : horizontal flip 과 scale jittering

- NMS : soft nms

 

반응형

+ Recent posts