ABBYY OCR SDK 샘플 프로젝트 4탄 - 문서 자동 분류 



글로벌 점유율 및 성능 1위 OCR 전문 벤더 ABBYY 의 OCR 엔진 'ABBYY FineReader Engine 11' 본격 탐구! 샘플프로젝트 시리즈 4탄입니다. 


저희 레티아에서 시리즈로 'ABBYY FineReader Engine 11'의 샘플 프로젝트에 대해 소개해드리고 있는데요, 이 엔진은 설치 즉시 다양한 동작을 확인할 수 있는 샘플 프로젝트를 제공합니다! 개발자 분들께서는 이 샘플 프로젝트를 꼭 확인하셔서 OCR API를 활용하시는데 도움을 되기를 바랍니다! 





지난 포스팅에서 다룬 내용 


1탄 - 프로세싱 프로파일 바로가기

2탄 - 멀티코어 프로세싱 바로가기

3탄 - PDF Export 프로파일 바로가기 





이번 4탄에서는 문서분류(Classification) 기능에 대해 알아볼텐데요,

아마 많은 분들께서 궁금해하셨던 내용이 아닐까 싶습니다. 



(↑ ABBYY FineReader Engine 11 (SDK) 문서 분류 기능 ) 




ABBYY FineReader Engine 11이 이미지 문서분류에 어떻게 사용될 수 있는지 설명할텐데요, 

FineReader Engine을 활용하면 이미지 배치에 대한 분류작업을 할 수 있습니다. 

선 트레이닝된 분류 모델(Pretrained Classification Model) 은 다음 언어에 적용됩니다. 


영어 / 한국어/ 중국어 / 일본어 / 프랑스어 / 독일어 / 이탈리아어 / 포르투갈어 / 스페인어 / 러시아어 




어떻게 동작하는 지, 동작 방식에 대해 알아보겠습니다. 


선트레이닝된 분류기 (Pretrained Classifier)를 이용해서 문서를 분류하려면 


1. 분류할 이미지의 폴더를 선택합니다.

2. 인식 언어를 설정합니다. *classified document windows 에서 언어리스트를 볼 수 있습니다. 

3. Classification 버튼을 클릭합니다. 










문서 분류를 위해서 FineReader Engine 을 트레이닝 하려면 


1. 분류를 원하는 모든 타입의 이미지가 포함된 데이터베이스를 생성합니다. 

데이터베이스 생성은 Help 파일의 “Classifying Documents “를 참고 하시기 바랍니다. 

이미지를 문서 타입으로 명명된 폴더들에 모으고 모든 폴더를 하나의 폴더에 넣습니다. 

2. 문서의 언어를 선택합니다.  

3. “Train” 버튼을 클릭합니다.

4. “다이얼로그 박스에서 폴더 위치를 지정합니다. 

5. 분류 클래스의 목록을 확인하고 “Training”을 클릭합니다.  

6. 분류 트레이닝이 끝나면 문서를 새로 만들어진 분류기(Classifier)로 분류 할 수 있습니다. “User –trained classified”를 선택한 후 “Classification”을 클릭합니다.  





↑ 유튜브 동영상 바로가기 : https://youtu.be/ZsTYhmeBBgU


이미지 문서 분류 사용에 관한 자세한 내용은 동영상으로도 확인하실 수 있습니다^^  









A comprehensive OCR SDK for software developers.


More value for your software solution!!! 


시험판 신청 및 제품 소개 바로가기 

 







블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,