재활복지공학회_학회논문_최종본.pdf
프로젝트 개요 및 주제
시각장애인들의 생활여건 개선에 도움을 줄 수 있는 딥러닝 기반 물체 탐지, 텍스트 탐지 및 인식과 깊이 측정 카메라를 통한 물체 방향 및 거리 인식, 스피커를 통한 음성 출력과 마이크를 통한 음성 입력 방식을 통합한 임베디드 시스템 개발.
통합 임베디드 시스템
통합 임베디드 시스템 모식도
데이터 준비
물체 탐지 모델
학습 결과
모델: Yolov5
- 타 모델에 비해 성능 대비 연산 속도에 큰 장점이 있기 때문에 선정
- MS COCO 데이터셋과 직접 제작한 농기구 데이터셋 사용
- 실제 환경에서의 인식률 개선을 위해 데이터 재생성 방법 적용
텍스트 탐지 및 인식
고려 모델: Vedastr, EasyOCR, Tesseract
사용 모델: EasyOCR
- Vedastr
- Classification 기반 텍스트 탐지 모델
- 다른 모델들에 비해서 연산 속도가 매우 우수
- 하지만 학습 진행 후 테스트 결과 성능이 떨어지는 것 확인
- Tesseract
- EasyOCR
- OCR framework
- 정답률과 연산 속도를 고려 했을 때 가장 적합하다고 판단하여 체택