Q. 매달 진행되는 계약건에 대해서 엑셀로 간편 정리하고 싶은데 가능한 툴이 있을까요?
A. 아래의 내용은 자동차보험증권의 이미지 파일에서 OCR로 데이터를 추출하는 방법을 설명하고 있습니다. 참고하세요.
- 데이터 추출 형식에 따른 차이점
|
|
|
|
|
|
|
|
|
|
|
이곳에서는 PDF 데이터 추출은 논외로 하고, 이미지 데이터 추출에 한해서 설명하기로 한다. PDF 데이터 추출은 등기부등본 데이터 추출을 참조하세요.
자동차보험증권의 원본은 PDF이나, 고객의 사진 촬영한 이미지 또는 이미지 버전 PDF에서 데이터를 추출한다는 가정임
- 데이터 추출 위치가 고정된 것인지 여부에 따른 구분
주민등록증과 같이 포맷이 정해진 곳에서 추출하는 방식을 정형데이터 추출이라고 하며, OCR판독의 기본임
자동차과태료와 같이 포맷이 정해지지 않은 곳에서 데이터를 추출하는 방식을 비정형 OCR데이터 추출임
손보사에서 읽고 싶은 자동차보험 증권은 기본적으로 각 손보사별로 다른 양식을 사용하기 때문에 비정형 데이터 추출방식을 사용해야 하나, 손보사는 현재 17개로 정형화된 포맷으로 OCR판독을 할 수 도 있음
|
|
|
|
|
|
||
|
|
|
|
|
|
|
(손보사 리스트 - 삼성화재,현대해상,DB손해보험,KB손해보험,메리츠화재,한화손해보험,흥국화재,NH농협손해보험,롯데손해보험,MG손해보험,코리안리재보험,SGI서울보증,AXA손해보험,AIG손해보험,하나손해보험,카카오페이손해보험,신한EZ손해보험)
(자동차보험증권 이미지 3종 - 문서 끝에 있습니다.)
현재 금융위원회에서 제공하는 API(무료)와 전문 API 플랫폼에서 제공하는 다양한 자동차관련 정보를 취득하여 사용할 수 있음 (아래 참조) 즉, OCR정보와 API정보를 통합해서 사용하면 보다 정확한 데이터 추출이 가능하고, 자동차보험 증권에 기재되지 않은 정보까지 관리 할 수 있는 장점이 있음
단, 개발기간이 더 소요되고, 추가 비용이 발생함
가. OPEN API - 금융위원회_자동차보험가입정보 - 무료
|
|
|
|
|
|
* 개인정보관련 직접 정보는 제공하지 않음
나. 자동차 관련 API 데이터 추출
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(요금은 2024년 5월 기준으로 변동될 수 있습니다.)
- 사용자가 3명 이하이며 물리적 근무지가 같은 경우에는 Local 시스템에서 직접 처리하는 방식으로 사용(시스템 비용없음)
- 사용자가 다수 이며, 원격지에서 시스템을 사용하는 경우에는 Web버전을 개발해야 하며, 시스템 도입비용 발생할 수 있습니다.
- 개발요건에 따라 정해집니다.
- 간단한 OCR판독 후 데이터를 엑셀로 만드는 것이라면 1개월도 가능합니다.
- 개발비용은 계약시 50%, 완료시 50% 지급 방식입니다.
댓글로 의견을 남겨주세요. 감사합니다.
PDF파일이나 이미지 파일에서 텍스트를 추출해서 엑셀로 정리하는 툴을 제공중입니다.
관련 내용을 아래 게시글 참조 바랍니다.
https://pycell.net/pdf_plus/404