OCR +

  • 실제 데이터로 살펴보는 데이터 보정기능 

     

    - 보정대상 리스트 전체

    보정대상 리스트 전체.png

     

     

  • 전자납부번호를 OCR엔진에서 잘 못 읽는 경우

    (전자납부번호는 숫자 19자리로 이루어진 댓쉬(하이픈)과 같은 패턴을 사용하고 있지 않음, 따라서 OCR엔진에서 오류판독이 많은 사례임)

    또한, 단순 숫자로만 이루어져 있기 때문에, 과태료 OCR장표 특성상 연속된 숫자가 많은 것이 특징임. 따라서 추출도 쉽지 않음

    더욱, 정확성 판별을 위한 체크 디짓과 같은 정보가 없어서(체크 디짓 정보가 있다고 하더라도, 발행기관이 다수라서, 현실적으로 체크하기 어려움) 정합성 판별도 어려운 상태임

     

    OCR 데이터 추출(보정전)

    47113222361530666769 47113-2-22-36-15-306667-6 (20)

     

    OCR 데이터 추출(보정후) - 불필요한 숫자 2 삭제 후 확정된 전자납부번호

    4711322361530666769 47113-2-23-61-53-066676-9 (19)

     

    해당 이미지

    해당이미지-포항시.png

     

     

     
  • 보정전 (53-뒤에 빨간색으로 표시된 2자가 2번 OCR엔진에서 오류 처리됨)

    41590223615322911964 41590-2-23-61-53-229119-6 (20)

     

    보정후 

    4159022361532911964 41590-2-23-61-53-291196-4 (19)

     

    실제 이미지 파일

    실제 이미지 파일 - 동탄.png

     

     

  • 보정전

     

    zz이미지 015.png

     

    보정후 - 보정없음

    보정후 보정없음 - 포항.png

     

  • pycell3 2024.05.08 12:09 글쓴이

    zz이미지 017.png

     

    5번째 숫자 0이 의심스러운 상황을 표시함

    실제 이미지 점검결과 2중 인쇄된 곳의 숫자를 0이 아닌 6으로 읽은 경우

     

    이미지 085.png

     

     

  • pycell3 2024.05.08 12:09 글쓴이

    zz이미지 019.png

    2-30 으로 적힌 곳은 2-23 이 일반적임, 왜냐하면 23은 2023년도를 뜻하는 자리로 사용되기 때문임.

    실제 고지서 확인결과 2-30으로 기록됨. 이건 재확인이 필요함

     

    이미지 086.png

  • 다니엘 2024.05.24 15:21

    좋은 정보입니다.

사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 용량 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )

Board Pagination Prev 1 Next
/ 1