728x90
반응형

1) 구글 이미지 웹스크래핑을 함
18,222개

2) 걸러내기
- 의도와 상관없는 이미지 제거
- 중복이미지 제거
4,098여개

3) bnd box labeling
- labelimg를 통한 레이블링
* 향후 augmentation 데이터 확보

4) 데이터셋 확보
코랩 업로드

5) TFrecord 변환
- target label 일치화
- 경로 재설정
- debugging
* image format not jpeg error가 있어서 로컬 원본 데이터셋에서 png 검색했을 때 1장이 나옴
https://discuss.tensorflow.org/t/valueerror-image-format-not-jpeg/2143/10

ValueError: Image format not JPEG

Sure, @fredy_rivas. Feel free to find the code in the repository linked below.

discuss.tensorflow.org

확장자명은 jpg이지만 png로 인식되어서 해당 이미지와 annotation 삭제


6) tfrecord로 학습

반응형

'Debugging' 카테고리의 다른 글

Git 라이브러리 쓰는 법  (0) 2021.12.29
Image Custom Dataset 파일명 변경하기  (0) 2021.12.21
한셀 데이터로드 오류  (0) 2021.06.29
Pandas Excel 데이터로드  (0) 2021.06.28

+ Recent posts