728x90
반응형
1) 구글 이미지 웹스크래핑을 함
18,222개
2) 걸러내기
- 의도와 상관없는 이미지 제거
- 중복이미지 제거
4,098여개
3) bnd box labeling
- labelimg를 통한 레이블링
* 향후 augmentation 데이터 확보
4) 데이터셋 확보
코랩 업로드
5) TFrecord 변환
- target label 일치화
- 경로 재설정
- debugging
* image format not jpeg error가 있어서 로컬 원본 데이터셋에서 png 검색했을 때 1장이 나옴
https://discuss.tensorflow.org/t/valueerror-image-format-not-jpeg/2143/10
확장자명은 jpg이지만 png로 인식되어서 해당 이미지와 annotation 삭제
6) tfrecord로 학습
반응형
'Debugging' 카테고리의 다른 글
Git 라이브러리 쓰는 법 (0) | 2021.12.29 |
---|---|
Image Custom Dataset 파일명 변경하기 (0) | 2021.12.21 |
한셀 데이터로드 오류 (0) | 2021.06.29 |
Pandas Excel 데이터로드 (0) | 2021.06.28 |