OCR 전문기업 레티아가 국내 1위 온라인리서치 회사인 마크로밀엠브레인에 영수증 인식을 위한 OCR 솔루션을 공급하였습니다. 마크로밀엠브레인은 모바일 앱으로 주로 대형마트, 편의점 등을 대상으로 한 영수증을 촬영하여 영수증 내 데이터를 수집 및 추출 하여 DB화 하는 작업을 필요로 하였습니다.

영수증 인식을 위한 OCR 솔루션은 모바일에서 촬영 후 OCR에 적합한 이미지를 생성하기 위한 레티아 모바일캡처 SDK 솔루션과 촬영된 영수증 이미지를 서버 사이드에서 인식하기 위한 ABBYY FlexiCapture 솔루션으로 구성됩니다.

※영수증을 처리하기 위한 기본적인 프로세스

▶ 이미지 획득 – 모바일 촬영, 스캔 모두 지원

▶ 서식 분류 – 입력 이미지가 100여종의 영수증 중 어떤 종류인지 구분

▶ 필드 검출 – 확인된 영수증 종류에 맞는 인식 대상 필드의 위치 검출

▶ 필드 인식 – 필드로 구분된 각 영역에 대해 OCR 수행

▶ 결과 저장 – 필드의 종류 구분 및 OCR 수행 결과 텍스트 저장

1. 모바일 촬영

사용자가 직접 촬영할 경우 OCR에 적합한 이미지가 생성되도록 이미지 전처리 작업을 진행해야 하며 이러한 처리를 위해 ABBYY Mobile Capture 기술 기반의 레티아 모바일캡처 SDK를 제공합니다.

 

1) 자동 촬영 기능 제공

모바일 카메라에서 촬영 시 영수증의 경계를 자동으로 검출하여 촬영 조건이 될 경우 자동으로 촬영한 후 보정기능을 수행하여 OCR에 적합한 이미지를 획득하는 통합 기능을 제공합니다.

2) OCR에 적합한 이미지 인지 판단하는 기능 제공

촬영된 이미지에서 포커싱 및 블러 검출을 통해 OCR에 적합한지 판단하는 기능을 제공합니다.

3) Auto Crop

영수증의 경계를 자동으로 검출한 후 잘라내어 원본 이미지와 동일하게 유지되도록 하는 기능을 제공합니다. 이미 촬영된 이미지 로드시 사용할 수 있습니다.

 

2. 서식 분류

모바일 촬영 후 OCR 시스템에 입력될 경우 입력된 이미지가 100여종의 영수증 중 어떤 영수증인지 판단하는 로직이 포함됩니다.

영수증의 서식 종류에 대한 판단에 사용되는 방법은 다음과 같습니다.

1) 이미지 기반 분류 – 이미지 형태 및 패턴을 그대로 분류에 사용합니다.

2) 텍스트 기반 분류 – OCR을 통해 분석된 텍스트 구성을 통해 분류를 진행합니다.

3) 룰 기반 분류 – 일부 유사한 서식일 경우 분석된 여러 Object들(텍스트, 이미지, 라인 등)에 대한 상관 관계를 이용해 분류를 진행합니다.

 

ABBYY FlexiCapture 솔루션에서는 별도의 문서 분류기를 제작할 수 있는 툴을 제공하고 있으며 머신러닝을 통해 분류 성능을 향상시킬 수 있습니다.

3. 필드 검출

영수증 서식의 종류 구분 후 해당 서식의 인식 대상 필드를 추출하기 위해 ABBYY FlexiCapture 솔루션의 FlexiLayout Studio를 통해 제작된 영수증 인식 템플릿을 적용합니다. FlexiLayout은 OCR을 통해 분석된 이미지 상의 모든 오브젝트를 이용하여 반정형 양식에서 인식 대상 필드를 추출할 수 있습니다.

 

4. OCR

분류된 서식 종류와 추출된 필드를 이용하여 실제 OCR 처리를 진행합니다. OCR 작업은 문서정의라는 프로젝트를 제작하여 진행되며 각 필드 별 데이터 형식 및 후처리 기능을 포함합니다. 아래는 문서정의를 통해 실제 OCR 완료된 결과입니다.

 

5. 결과 저장

인식된 결과 데이터에는 추출된 필드의 종류 및 OCR 완료된 데이터가 페어로 유지되며 결과 저장 방식에 따라 데이터베이스, 엑셀, CSV, XML 등 다양한 방식으로 Export 될 수 있습니다.

데이터베이스를 통한 Export는 ODBC 드라이버를 통해 이루어 지며, 데이터 베이스의 종류에는 제한이 없습니다.

레티아 모바일캡처 SDK 바로가기

ABBYY FlexiCapture 바로가기

블로그 이미지

OCR 전문기업 레티아 OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

댓글을 달아 주세요

안녕하세요. 레티아 입니다.

이랜드리테일에서 운영하는 E맘클럽을 아시나요? 레티아가 이랜드리테일 앱에서 E맘클럽 가입을 편리하게 할 수 있도록 OCR솔루션을 공급했습니다.

E맘클럽은 만 12세 이하 자녀를 둔 이랜드리테일 멤버십 회원을 대상으로 맘고객을 위한 맞춤 혜택을 제공합니다. 온라인 가입은 이랜드리테일 앱에서만 가능하며 자녀확인 증빙서류(주민등록등본)를 제출해야 합니다. 아래 스크린샷을 참고해주세요.

이랜드리테일 앱 설치 > 회원가입 > E맘클럽 가입 >

약관에 동의 > 등본 출력 가이드와 등본 촬영 안내사항 확인 후

위의 화면 처럼 등본을 스캔 하면 촬영 버튼을 누르지 않아도 자동적으로 사진이 찍히게 됩니다.

"레티아 모바일캡처 SDK"가 제공하는 오토캡처 기능을 적용하여 촬영버튼을 누르지 않고 자동으로 사진을 촬영하고 이미지를 아래와 같이 보정합니다.

"ABBYY FlexiCapture"가 이미지 문서에서 자녀 이름, 생년월일 등 회원가입에 필요한 데이터를 자동으로 추출합니다.

자녀확인 증빙서류(주민등록등본)을 촬영 하면 아이들 이름과 생년월일을 바로 보여줍니다. 맞게 인식이 되었는지 확인하고 완료 버튼을 눌러주면 가입 완료 입니다.

ABBYY FlexiCapture 바로가기

ABBYY FlexiCapture 는 문서 이미지에서 필요한 데이터만 지능적으로 추출하여 DB화 할 수 있는 지능형 데이터 캡처 솔루션입니다. 간단한 서식부터 복잡한 서식의 문서도 처리할 수 있으며, 여러 서식이 섞여 있어도 자동으로 서식의 종류를 식별하고 분류 할 수 있습니다.

레티아 모바일캡처 SDK 바로가기

레티아 모바일캡처 SDK는 모바일에서 촬영한 문서의 특정 데이터 인식 기능, 명함 인식, 바코드 인식, 이미지 보정 기능 등 모바일 단말 카메라로 촬영 된 문서 이미지를 보정하는 기능을 올인원으로 제공합니다. '레티아 모바일캡처 SDK'는 세계적인 OCR 브랜드 ABBYY 의 모바일 솔루션을 탑재하고 있으며, 국내 최고의 OCR 전문 기업 레티아가 자체적으로 개발한 모바일캡처 엔진 및 레티아 카메라 라이브러리로 구성되어 있습니다.

감사합니다.

블로그 이미지

OCR 전문기업 레티아 OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

댓글을 달아 주세요

안녕하세요! 레티아 입니다.

대한민국 대표 문화상품권 발행업체 한국문화진흥이 운영하는 컬쳐랜드 모바일 앱을 알고 계신가요? 컬쳐랜드 앱에서는 문화상품권 충전 / 사용 / 선물하기가 가능하며, 모바일에서도 간편하게 문화상품권 사용이 가능합니다.

한국문화진흥은 모바일에서 문화상품권을 사용하기 위해 앱을 실행 후 상품권/영수증 번호를 손으로 일일이 입력해야하는 번거로운 이전의 방법에서 벗어나 편리한 사용자 인터페이스 제공을 위해 모바일에서 카메라로 문화상품권의 핀번호 또는 영수증의 핀번호를 촬영하면 자동으로 번호를 입력 받는 방법을 모색하였고, 자체적인 솔루션 검증을 통하여 OCR 솔루션 전문기업 레티아의 '레티아 모바일캡처 SDK'를 선정하여 어플리케이션에 탑재하였습니다.

문화상품권 충전하는 방법은 아래와 같이 이루어집니다.

컬쳐랜드 앱 설 치 후 로그인 > 상품권 바코드 숫자(16자리) 스캔 > 충전완료

1. 문화상품권 핀번호 스캔

<레티아 모바일캡쳐 SDK가 적용된 ‘컬쳐랜드’앱의 문화상품권 스캔 화면>

2. 영수증 핀번호 스캔

<레티아 모바일캡쳐 SDK가 적용된 ‘컬쳐랜드’앱의 영수증 스캔 화면>

사용자는 앱 실행 후 카메라를 통해 번호를 스캔 하기만 하면 되고, 번거롭게 입력하지 않아도 됩니다.

또한 상품권/영수증 인식은 카메라 프리뷰 화면에서 실시간으로 진행됩니다. ‘레티아 모바일캡처 SDK’는 문화상품권을 “촬영”하지 않고 카메라만 비추면 실시간으로 인식하는 라이브(LIVE) 인식 기능을 제공하기 때문에 촬영 후 인식 대기시간이 필요하지 않고, 인식 결과도 기존 촬영 방식 대비 훨씬 더 정확합니다.

레티아에서 자체 개발한 ‘레티아 모바일캡처 SDK’는 글로벌 OCR 마켓 점유율 및 성능 1위 ABBYY의 Mobile Capture 엔진 기반으로 하며, OCR 전문기업 레티아의 전문 기술 노하우가 결합되어 최고의 인식률을 제공합니다.

레티아 모바일캡처 SDK 바로가기

블로그 이미지

OCR 전문기업 레티아 OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

댓글을 달아 주세요