728x90
반응형

MASK RCNN

instance segmentation의 대표적인 모델

- Faster RCNN과 FCN 기법 개선 및 결합

   * ROI-Align

   * 기존 bounding box regression과 classification에 binary mask prediction 추가

- 비교적 빠른 detection 시간과 높은 정확도

- 직관적이고 상대적이고 쉬운 구현

 

 

ROI align

segmentation에서 roi pooling 문제점 : masking을 해야해서 아주 정확해야 함

- roi pooling에서 quantization을 하면서 문제 발생

소수점이 생겨서 들어오는 사이즈가 정확하게 매칭이 되지 않음

 

- ROI를 소수점 그대로 매핑하고 roi의 개별 grid에 4개의 point를 균등하게 배열

- 개별 point에서 가장 가까운 feature map Grid를 고려하면서 포인트를 weighted sum으로 계산

- 계산된 포인트를 기반으로 max pooling 수행

 

 

영상처리 bilinear interpolation 예제

https://blog.naver.com/PostView.nhn?isHttpsRedirect=true&blogId=dic1224&logNo=220882679460&categoryNo=0&parentCategoryNo=207&viewDate=&currentPage=1&postListTopCurrentPage=1&from=search

Bilinear Interpolation을 이용한 ROI-align

확대하면 깨지게 됨, 대신 빈공간을 유추해서 보정함

 

거리에 맞게 계산해서 채워줌

그상태에서 pooling

 

 

mask rcnn Feature Extractor : Resnet + FPN

Loss function

- k개의 정해진 class에 대해서 그 class에 pixel이 속하는지 그렇지 않은지 sigmoid로 결정 binary-cross-entropy-loss

- mask rcnn에서 mask prediction

- prediction후 resize해서 원본 이미지에 적용

 

 

반응형

'Computer_Science > Mask RCNN' 카테고리의 다른 글

13-2. Semantic Segmentation FCN  (0) 2021.10.31
13-1. Segmentation  (0) 2021.10.27

+ Recent posts