ABBYY OCR SDK 샘플 프로젝트 3탄 - PDF Export 프로파일 



글로벌 점유율 및 성능 1위 OCR 전문 벤더 ABBYY 의 OCR 엔진 'ABBYY FineReader Engine 11' 본격탐구! 샘플프로젝트 시리즈 3탄입니다. 


OCR 엔진하면 어렵게 생각하시는 개발자님들이 많으실텐데요. ABBYY의 OCR 엔진은 설치 후 즉시 동작을 확인할 수 있는 쉽고 간단한 샘플프로젝트를 다양하게 제공하고 있습니다. 이 샘플프로젝트를 통해서 개발자분들께서  OCR엔진(ABBYY FineReader Engine)에 대해 좀 더 쉽게 이해하실 수 있습니다. ^^


레티아에서 알려드는 샘플 프로젝트 놓치지 마세요~ 





지난 포스팅 

1탄 - 프로세싱 프로파일 바로가기

2탄 - 멀티코어 프로세싱 바로가기





3탄 포스팅은 바로 <PDF Export 프로파일>입니다.


이 샘플프로젝트는 OCR 엔진으로 인식 후, PDF 포맷으로 저장할 때 

PDF Export 프로파일을 사용하면 어떤 장점이 있는지 보여줍니다. 


이 샘플은 특정 폴더의 이미지들을 처리한 뒤 

그 결과를 일부 파라미터가 최적화된 PDF포맷으로 저장합니다. 


(예 : 품질이 가장 좋은 파일, 가장 빠른 속도로 생성된 파일, 

파일 사이즈가 가장 작은 파일 및 모든 파라미터가 균형이 잡혔을 때 생성되는 파일 등) 



각 파일의 사이즈와 각각의 처리 속도를 비교하고, 비교 결과는 다이어그램으로 표시됩니다. 







동작하는 방식은 크게 아래의 단계로 나눠집니다. 


1. 인식할 이미지 폴더를 선택합니다.


2. 인식할 이미지의 인식언어를 선택합니다. 


3. PDF 포맷 저장의 파라미터 설정합니다. 

 

- Text export mode  :

 페이지 이미지 위에 텍스트, 

페이지 이미지 밑에 텍스트,

 이미지만 저장, 텍스트만 저장 등을 선택할 수 있습니다. 


- Colority : 

원본 이미지의 색상을 유지 또는 그레이로 저장 선택할 수 있습니다. 


- 그림 해상도 : 

원하는 해상도를 설정할 수 있습니다. 


-  압축 여부 : 

ABBYY OCR 엔진이 지원하는 고품질 MRC 압축 사용 여부를 선택할 수 있습니다. 


- PDF/A 준수 :

 PDF, PDF/A-1a, PDF/A-1b 포맷을 지원합니다. 


5. 이제 Start 버튼을 눌러 작업을 실행합니다. 


5. <파일생성시간 비교 다이어그램> 아래 각각의 저장 시나리오와 결과 밑의 

'open file' 을 눌러 결과파일을 볼 수 있습니다. 






↑유튜브 동영상 바로가기 : https://youtu.be/Ke1QhbB3-JY


좀 더 자세하게 보고싶으시다면, 데모 동영상으로 확인해보세요 ^^ 









A comprehensive OCR SDK for software developers.


More value for your software solution!!! 


시험판 신청 및 제품 소개 바로가기 

 






 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


ABBYY 개발자 인터뷰 2탄


ABBYY PDF Transformer+ 

Change For The Better        












by Ivan Korneev, 

ABBYY Development Manger 



"더 나은것을 위한 변화"




새로운 제품의 디자인에 참여하는 것은 마치 진행중인 '전후' 스토리와 같다고 생각합니다. 인생의 다른 많은 일들처럼 초기 목적과 계획은 변화하거나 증가합니다. 최종 결과물이 반드시 원래 의도한 기능과 일치하지 않는다고 표현할 수 있겠네요. 



예를 들어, ABBYY PDF Transformer+ 는 원래 디지털 서명 추가 기능을 제공하지 않았습니다.

그러나 지금 디지털 서명(전자 서명) 기능은 ABBYY PDF Transformer+가 제공하는 주요 기능 중 하나가 되었죠. 


(레티아 추가설명: ABBYY PDF Transformer+의 디지털 서명기능은 PDF문서에 디지털 방식으로 서명하고, 디지털 서명의 유효성을 검사할 수 있습니다. 서명을 위해선 디지털 인증서가 필요하기 때문에 종이문서에 수기로 작성된 서명과 마찬가지로 문서에 서명한 사람의 신원을 보증하는 목적, 서명된 문서가 변조되지 않았음을 확인하는 목적으로도 이용할 수 있습니다)










(↑ ABBYY Precise Scan 기술) 



또 다른 계획되지 않았던 기능은 무엇인지 궁금하시나요? 바로 우리가 'Precise Scan' 이라고 부르는 기능입니다. 이 기능도 상품 개발의 매우 늦은 단계에서 추가된 기능입니다.



이 기술은 스캔한 이미지로 만들어진 PDF파일이 깨끗하게 보이도록 도와주며 OCR에 더 적합하게 만들어줍니다. 좀 더 간단히 말하자면 이미지를 벡터화해서 확대하고 가장자리를 부드럽게 처리하고 노이즈를 제거하는 기능입니다. 그 후 이미지를 원래 크기로 변경해서 더 또렷하고 깨끗하게 보이도록 만들어줍니다. 


단언컨대 정말 대단한 기능이죠? 







'ABBYY Precise Scan' 기능은 유튜브 동영상으로 생생하게 확인하실 수 있습니다.  

바로가기 https://youtu.be/wqJigsDGVvM






ABBYY 개발자 인터뷰는 계속됩니다 

기대해주세요 ^^ 


- 레티아 드림 



    






What is ABBYY PDF Transformer+ ?


 시험판 다운로드 및 사용 리뷰 보러가기 







블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



ABBYY 개발자 인터뷰 1탄


ABBYY PDF Transformer+ 

Arab Awakening: Bringing a New Language to PDF Transformer+         















by Maksin Pikhenko, 

ABBYY Head of PDF Tools Development Group  





"제가 가장 보람을 느끼는 경험 중 하나는 제가 개발자로서 'ABBYY' R&D센터에서 아랍어 연구에 관계하고 있다는 점입니다. "


저는 ABBYY의 R&D 센터에서 ABBYY PDF Transformer+ 의 아랍어 PDF문서를 편집, 협업 등을 할 수 있게 처리하는 작업을 맡았습니다. 

이는 사실 쉬운일은 아니었습니다. PDF소프트웨어가 올바르게 동작하고, 사용자들이 PDF문서를 쉽게 작업할 수 있으려면 한 언어의 모든 규칙을 이해하는 것이 필요합니다. 예를 들면, 한 단어에 한 글자를 변경하는 것은 문장 자체를 비 문법적으로 만들기 때문에 전체 문장을 변경해야 하니다. 여기에 추가로 아랍어에서는 대부분의 글자들이 단어 내에 세가지 방법으로 위치할 수 있으므로 각기 다른 위치에 대한 변경도 필요합니다. 


처음에는 이런 미묘한 차이에 대한 중요성을 몰랐습니다. 

(현재의 ABBYY의 OCR 엔진은 아랍어 인식에서 높은 정확도를 보이는 것으로 유명합니다.^^)









오른쪽에서 왼쪽으로 읽는 언어에서의 '커서' 제어가 미치는 영향을 포함하면서 새롭게 아랍어에 적용하려면 이러한 미묘한 점들을 배우는 것이 필요했습니다. 이런 맥락에서, 입력 키를 저장해놓지 않으면 백스페이스키와 같이 아주 간단하게 보이는 것들도 예측할 수 없는 움직임을 만들어 낼 수 있습니다. 



추측하셨겠지만 저는 아랍어를 공부하고 있습니다. 단순히 소프트웨 코드를 위한 아랍어 텍스트 편집이 필요한 것이 아니라, 아랍어를 쓰고 읽는 사람들의 사고방식을 배우는 것이 필요하기 때문입니다. 





이런 모든 점을 감안할 때 아랍어로 잘 작동하는 PDF소프트웨어를 찾는다는 것이 드물다는건 절대 놀라운 일이 아닙니다우리의 앞으로의 주요 목표는 ABBYY PDF Transformer+가 Microsoft Word 처럼 잘 동작하게 하는 것입니다. 우리는 현재 버전에서 이미 아랍어 편집 기능에 대한 성공을 얻었습니다. 그리고 더 많은 것을 성취할 수 있다는 사실을 알고 있습니다. 


저는 ABBYY R&D 연구센터에서 일을 하면서 세상에서 가장 수학적으로 구조화된 언어를 배울 수 있었습니다. 이것은 정말 멋진일입니다!! 





ABBYY 개발자 인터뷰는 계속됩니다 

기대해주세요 ^^ 


- 레티아 드림 



    






What is ABBYY PDF Transformer+ ?


 시험판 다운로드 및 사용리뷰 보러가기 








블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



ABBYY OCR SDK 샘플 프로젝트 2탄 - 멀티코어 프로세싱 




최고의 성능을 자랑하는 OCR 전문 개발엔진

 'ABBYY FineReader Engine 11' 의 기능에 대해 알아보겠습니다. 

1탄에서는 프로세싱 프로파일을 알아보았는데요 1탄 바로가기 







ABBYY FineReader Engine 11은 

세계최고의 글로벌 OCR 밴더 ABBYY사의 

OCR 소프트웨어 개발 툴킷입니다. 








ABBYY FineReader Engine 11은 

설치 후 즉시 동작을 확인할 수 있는 

다양한 샘플 프로젝트를 제공하고 있는데요~ 


이번 글에서는 여러개의 샘플프로젝트 중 2탄 

<멀티코어 프로세싱>을 소개합니다. ^^ 

 

이 샘플은 싱글 프로세스로 문서를 인식할때와 비교해서 여러개의 인식 프로세스로

멀티 페이지 문서를 인식할때 얼마나 속도가 빨라지는지 보여줍니다. 







인식을 위해서는 FineReader Document 객체의 메소드를 사용하게 됩니다. 

 이때 


- 이미지 파일들은 특정 위치로부터 FineReader  Document 객체에 하나씩 차례로 추가됩니다.

- 모든 이미지가 추가되었을때 병렬 인식이 시작됩니다.

- 모든 페이지가 인식된 다음, 문서 전체의 결과에 접근이 가능하게 됩니다. 






스크린샷에서 보시는 것처럼 싱글프로세스 처리 시 보다 

멀티프로세싱 인식을 수행할 때 속도가 빠른 것을 알 수 있습니다 






* 참고사항 

Core2 Duo T9800, 2,9 GHz, Windows 7, 4 GB RAM 32bit이 탑재된 PC에서 동작하였습니다. 

샘플이미지는 ABBYY FineReader 엔진 설치 시 저장되는 이미지를 사용하였습니다. 







좀 더 자세하게 설명해드릴게요~ 

샘플은 특정 폴더로부터 문서를 처리하고 
필요한 경우 PDF 포맷으로 결과를 저장합니다. 

또, 싱글 쓰레드로 처리 할 때와 병렬 쓰레드 사용시의 속도를 비교하며, 
결과는 다이어그램으로 보여줍니다. 

동작 방식은 다음과 같습니다. 



1. 인식 이미지들이 있는 폴더를 선택합니다.  

2. 처리할 문서의 인식 언어를 설정합니다.

3. 테스트에 사용할 CPU 코어 수를 설정합니다. 기본 설정은 가능한 최대 수의 코어 와 같습니다. 
코어 하나에 대한 테스트는 자동으로 기록됩니다.

4. 텍스트로 저장할 지 설정합니다. 
결과를 저장하면 처리에 필요한 모든 과정(Analysis, Recognition, Synthesis, Export)에 걸리는 시간이 모두 측정됩니다. 
결과를 저장하지 않으면 Analysis와Recognition 시간만 측정이 됩니다. 

5. “Start”를 클릭해서 샘플을 동작시킵니다.





아직 잘 모르시겠다면 데모 동영상으로 확인하실 수 있습니다. 

 


레티아 유튜브 동영상 바로가기 





본 SDK 제품의 소개자료가 필요하시거나, 시험판을 원하실 경

레티아 홈페이지의 SDK 제품 소개 페이지를 방문해주세요! 


바로가기 






블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



ABBYY OCR SDK 샘플프로젝트 1탄 - 프로세싱 프로파일 



최고의 OCR프로그램 'ABBYY FineReader' 에 대해 아시는 분들 많으실거에요~ 


그렇다면 'ABBYY FineReader Engine' 이란 무엇일까요? 



ABBYY FineReader Engine 은 API 형태로 제공되며 

FineReader 패키지 프로그램에 모든 기능을 API를 통해 접근 할 수 있는

 소프트웨어개발툴킷입니다. 







ABBYY FineReader Engine은 지원하는 기능이 굉장히 다양하고 내용도 많아

 사용하기 어렵다고 생각하시는 개발자님들이 꽤 있으실것 같은데요! 


사실 전혀 그렇지 않습니다. ㅎㅎ 

엔진을 설치하면 즉시 동작을 확인할 수 있는 여러가지 샘플 프로젝트를 포함하고 있습니다. 


오늘은 샘플 프로젝트중 첫번째로 ' 프로세싱 프로파일 ' 기능에 대해 알아보겠습니다. 







ABBYY FineReader Engine은 미리 지정된 프로세싱 프로파일로 

사용 목적에 따라 쉽게 엔진 설정을 할 수 있습니다. 


인식 작업 전에 인식 시나리오에 적합한 프로파일을 선택하기만 하면 

FineReader Engine이 자동으로 최적의 상태로 설정 됩니다.


샘플을 실행하면 다음 결과를 볼 수 있습니다.





ABBYY FineReader Engine 11 샘플 프로젝트 


Document Conversion Profiles: 

 Accuracy vs. Speed


문서 변환 프로파일 

정확도 VS 속도 







ABBYY FineReader Engine 11 샘플 프로젝트 


Text Extraction (Speed) vs Book Archiving (Speed)


텍스트 추출 (속도) vs 저장 (속도) 




(참고 : * Quad i7-3720QM, 2,6 GHz, Windows 7, 16 GB RAM, 64 bi이 탑재된 PC에서 동작하였습니다. 

샘플 이미지는 엔진 설치 시 저장되는 이미지 사용하였습니다) 







좀 더 자세하게 설명 드릴게요!! 


이 샘플에서는 특정 폴더의 이미지 샘플을 두 가지의 서로 다른

 Processing Profile을 사용하여 처리 할 때의 차이를 보여주는데요~ 




각 프로파일이 적용 되었을 때 속도의 차이와 인식 Element 수의 차이를 보여 줍니다. 


테스트 한 결과는 도표와 테이블로 표시가 됩니다

 

 


샘플을 동작 시키는 방법에 대해 알아볼까요?   



1. 처리할 이미지가 저장된 폴더를 선택합니다. 

2. 처리할 문서의 인식 언어를 선택합니다. .

3. 비교할 프로세싱 프로파일 두 가지를 지정합니다.  

4. Go 버튼을 클릭합니다. 

5. 세팅을 변경하고 “Recalculate”을 클릭하면 새로운 통계를 얻게 됩니다. 





아직 잘 모르시겠다면 데모 동영상으로 확인하실 수 있습니다. 

 


레티아 유튜브 동영상 바로가기 





본 SDK 제품의 소개자료가 필요하시거나, 시험판을 원하실 경

레티아 홈페이지의 SDK 제품 소개 페이지를 방문해주세요! 


바로가기 









블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

[종이문서검색 가능한 PDF파일로 보관하기]



요즘 ABBYY PDF Transformer+에 대해서 다양한 리뷰를 알려드리고 있는

 레티아 이주임입니다 ^^ 벌써 다섯번째 리뷰인데요~ 


종이문서를 스캔해서 검색 가능한 PDF파일로 변환하는 방법에 대해서 알아보겠습니다. 





이 문서를 스캔해볼건데요~ 






위 그림과 같은 원리로

이미지는 그대로 두고 인식된 텍스트가 이미지 아래로 들어가게 됩니다. 


겉으로 볼땐 똑같은 스캔 이미지 인데, 

ABBYY PDF Transformer+로 스캔하면

 

검색 및 텍스트 복사가 가능한 PDF파일이 되는거죠! (중요^_^) 






ABBYY PDF Transformer+ 실행 후 <스캔> 을 누른 화면입니다. 


텍스트 인식/ 비틀린 텍스트라인 교정 / 페이지 방향 교정 등 

다양한 스캔 옵션을 제공합니다. 






문서를 스캔해볼게요~ 




 



스캔이 완료되었습니다! 



스캔 후 곧바로 텍스트 검색, 복사가 가능합니다. 

마우스로 텍스트를 드래그한 채 캡처해보았습니다. 





더 좋은 기능은, 이 파일을 워드파일로도 바꿀 수 있는데요 




 



ABBYY PDF Transformer+를 사용하여, 

이미지를 스캔해서 PDF파일로 만들고, 워드파일로까지 변환해보았습니다! 






앗 그리고, 많은 분들이 엑셀 변환에 대해서도 물어보시는데요~ ^^


물론 가능합니다.


위 그림처럼 표 형식이 있는 PDF 파일을 열어보았어요 

위 빨간 동그라미 속 <다음으로 변환> 메뉴에서 '엑셀' 만 선택해 주시면 됩니다. 







변환 결과입니다.

잘 인식된 것을 확인할 수 있습니다. 와우!! 







문서언어는 기본적으로 <한국어 및 영어>로 설정되어있는데요


일본어, 중국어 등을 인식하시려면 

<변환 설정> 으로 들어가셔서 <문서언어>에서 설정해주시면 됩니다. 




ABBYY PDF Transformer+는 

한글 영어 중국어 일본어를 포함하여 


전세계 189개 주요언어를 모두 인식할 수 있습니다. 


놀라우시죠..?! 


또한 여러개의 언어를 조합하여 인식할 수도 있습니다. 


예를들어, 원본 PDF문서에 영어+중국어+프랑스어 가 섞여 있다면, 

문서언어를 3가지를 선택하여 인식할 수 있습니다! wow !!! 






여러분도 지금 바로 이 프로그램을 사용해보실 수 있답니다! 




ABBYY PDF Transformer+ 무료 시험판은 

ABBYY 공식 한국 파트너인 레티아 홈페이지에서 받으실 수 있습니다. 


아래 아이콘 또는 링크를 클릭하세요. 



ABBYY PDF Transformer+ 시험판은


레티아 홈페이지에서 받으실 수 있습니다.


바로가기 


감사합니다. 







블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

PDF파일을 워드파일로 변환

ABBYY PDF Transformer+ 사용 리뷰 



안녕하세요 ^^ 

다시 한번 알찬 리뷰로 돌아온 레티아 이주임입니다! 


문서 작업 후 PDF 파일로 저장 후 원본 워드파일을 지운 경우 있으시죠? 

  PDF파일을 수정하거나, 다시 워드로 바꿔야 할 때 꼭 필요한 소프트웨어를 소개합니다. 


ABBYY PDF Transformer (PDF 트랜스포머) 라는 프로그램 들어보셨나요? 

이 프로그램으로 모든 변환 작업이 가능합니다.

 
마우스 클릭 한번으로 PDF 파일을 워드로 변환 가능합니다.

워드뿐만 아니라 엑셀 문서, 텍스트 파일 /파워포인트/ 검색가능한 PDF 파일 등으로 변환할 수 있습니다.




 PDF트랜스포머를 설치 후 실행 첫 화면입니다. 

빨간 박스를 한번 볼게요~ 

여러 아이콘이 있는데 변환을 원하는 파일 포맷을 선택하면 됩니다.

 Word로 변환을 원하시면 맨 처음 W 모양의 아이콘을 누르시면 됩니다. 






워드로 변환하고 싶은 PDF파일을 선택한 후 '열기' 를 눌러볼게요 





이렇게 <변환> 창이 뜨면서 자동으로 변환을 시작합니다. 





변환이 끝나고 자동으로 워드 문서가 열립니다. 

 
단순히 텍스트만 인식하는 것이 아니라, 

문단, 표, 그림 등 원본 문서의 포맷을 유지하면서 변환해줍니다. 

인식률도 정말 우수합니다. (ABBYY OCR 기술은 글로벌 1위


이제 텍스트 편집이 가능하니 필요한 부분을 마음껏 편집하세요! 

 




이번에는 스캐너에서 스캐닝한 이미지를 PDF로 만든 파일입니다. 

사실 스캔 PDF 파일이 가장 난감하시지 않나요? ㅠㅠ

 

 워드에서 만들어진 일반 PDF 파일은 드래그라도 되서, 텍스트를 긁어올 수 있는데 

이런 스캔이미지로 만들어진 PDF파일은 전혀 텍스트 복사가 안되니까요 




ABBYY PDF트랜스포머로는 OCR(문자인식) 기술로
스캔 PDF파일도 Word 파일로 변환할 수 있습니다





위에서 해본 방법과 똑같은 방법으로 변환할 PDF파일만 선택하시면 됩니다. 




너무 쉽게 변환 완료. 
변환율 최고!!  



ABBYY PDF Transformer+의 장점, 

한눈에 보면 알 수 있는 직관적인 인터페이스! 

정말 정말 편리합니다. 




프로그램 사용 시 인터페이스의 역할이 정말 어마어마한데요! 

한눈에 메뉴가 들어오지 않고, 원하는 기능 바로바로 찾기 힘들면

프로그램 사용하시기 힘드시잖아요~ ㅠㅠ  


ABBYY PDF Transformer+ 프로그램은 직관적인 인터페이스로

누구나 쉽게 사용하실 수 있답니다! 

정말 강력 추천합니다~! 






원본 파일이 없어도 더이상 번거롭게 다시 타이핑 하지 마시고 

PDF트랜스포머를 사용하셔서 변환 작업을 해보세요.

 타이핑 하는것보다 몇백배는 빠르고, 무엇보다 사용 방법이 너무 쉽습니다.  

또 이 프로그램은 PDF파일을 엑셀이나 파워포인트, 전자책포맷(EPUB)으로도 변환할 수 있답니다.  




ABBYY PDF Transformer+ 무료 시험판은 

ABBYY 공식 한국 파트너인 레티아 홈페이지에서 받으실 수 있습니다. 


아래 아이콘 또는 링크를 클릭하세요. 



ABBYY PDF Transformer+ 시험판은

레티아 홈페이지에서 받으실 수 있습니다.


바로가기 


감사합니다. 




블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

손쉬운 PDF 파일 수정편집 


ABBYY PDF Transformer+ 사용 리뷰 




ABBYY 공식 한국파트너 레티아입니다! 세번째 리뷰로 찾아왔습니다~

저는 레티아의 이주임이라고 불러주세요 


ABBYY PDF Transformer+ 프로그램 기능을 소개해드릴텐데요. 

손쉽게 PDF파일을 편집하는 방법에 대해 알아보겠습니다.



1. PDF 파일의 오타를 수정 

 


PDF파일에 오타를 수정하고 싶으세요? 그런데 원본 파일은 이미 지우셨다구요..? ㅠㅠ 

더 이상 난감해하지 않으셔도 됩니다~ 


<편집> 아이콘만 눌러주시면, PDF파일이 편집모드로 바뀌면서 '커서' 가  생깁니다.  




'PDP' 라는 오타를 'PDF'로 손쉽게 수정하였습니다 ~ 



물론 텍스트 글꼴 크기를 키우거나, 줄일 수도 있고 



다른 폰트로 수정도 가능합니다. 





2. 스캔한 이미지 PDF 파일 수정 




종이 문서를 스캔해서 만들어진 PDF파일인 경우 (=그림 PDF 파일)


 


스캔한 PDF파일은 <텍스트 상자> 아이콘을 누르고 <배경 색 감지> 기능을 체크해주세요





수정을 원하는 부분에 텍스트를 입력해볼까요?  




보시다시피 배경은 그대로 유지하면서 텍스트만 수정이 되었습니다. 

이렇게 수정된 텍스트는 모든 PDF 뷰어에서 검색하거나, 드래그해서 텍스트를 복사할 수 있습니다. 





3. 내마음대로 페이지 순서 바꾸기  





페이지 삭제 




페이지 추가 




페이지 추가시, 꼭 PDF파일이 아니어도 됩니다.

이미지 파일이나, 워드파일등을 곧바로 추가할 수 있답니다. 



4. 이미지 추가 / 삭제 / 회전







다양하게 원하는 대로 이미지 편집. 






이미지 추가하기. 








그냥 그림판 '지우개' 가 아니죠~ 

배경 유지하면서 원하는 부분만 지우는 ABBYY PDF Transformer+만의 특별한 기능!





6. PDF파일 표 추출 





PDF파일에 < 이미지 표 >가 있다구요? 문제 없습니다. 

표 형식 그대로 복사 가능! (=추출 가능!!!) 

워드나, 엑셀로 편리하게 표 형식 그대로 옮겨 보세요~ 

 



물론 텍스트 복사도 가능해요~ 

OCR(문자인식) 기술이 포함되어 있어서 스캔 PDF 파일에서도 텍스트 복사가 가능하답니다 ^^ 


ABBYY PDF Transformer+ (애비 피디에프 트랜스포머 플러스)의 편집 기능에 대해 알아보았습니다 ^^ 


이 외에도 정말 다양한 기능이 있는데요, 직접 시험판으로 테스트해보실 수 있답니다! 

궁금하신 점이 있다면 레티아 이주임을 찾아주세요 ~~~ ! 


그럼 무료 시험판 다운로드 정보를 알려드리면서 오늘 포스팅을 마치겠습니다. 

읽어주신 모든 분들께 감사드려요~! 





ABBYY PDF Transformer+ 시험판은

레티아 홈페이지에서 받으실 수 있습니다.


바로가기 


감사합니다. 








블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

안녕하세요 ABBYY 공식 한국파트너 레티아입니다. 저는 레티아 이주임이에요~^_^v 

 

요즘 ABBYY의 문자인식 프로그램을 회사,학교, 공공기관부터 가정에서까지 정말 정말 많이 사용하시는데요~ 

하지만 아직 완벽하게 대중화된 프로그램은 아니기 때문에 문자인식 프로그램이 어떤 기능을 담고 있는지 궁금해 하시는 분들도 많으실것 같아요!


알아두면 쓸 곳이 정말 많은 편리한 문자인식 프로그램! 


그래서 오늘은 간단하게 문자인식 프로그램 'ABBYY FineReader ' 의 사용 방법을 보면서 어떤 상황에서 유용한지, 얼만큼 쉽게 문서 처리를 할 수 있는지 알아보도록 하겠습니다. 


간단 정리! 문자인식 프로그램이란? 


= OCR 프로그램 

OCR 이란 Optical Character Recognition  즉 광학문자인식의 약자입니다. '광학적인 음영을 통해 문자를 판독' 하는 기술을 말합니다. 이러한 OCR 기술을 이용하여 스캔한 문서, 그림파일 등의 이미지문서에서 텍스트를 추출하여 편집이 가능한 파일로 만들어 주는 프로그램을 OCR 프로그램(문자인식프로그램) 이라고 합니다. 


 

문자인식 프로그램 활용 첫번째!!

이미지 PDF파일을 검색가능한 PDF파일로 변환해보자! 


텍스트 복사 / 드래그가 불가한 PDF 파일을 

가능하게 만들어보겠습니다. 

 



 

 

 스캐너에서 스캔된 이미지를 PDF파일로 저장한 파일입니다. 이미지 PDF 파일이라고도 하죠.말그대로 <그림이미지>로 된 PDF 파일이기 때문에 텍스트 복사는 물론 검색도 불가능합니다.  (텍스트 드래그가 안되는걸 확인 하고자 드래그를 한 채로 캡처해봤습니다) 

 

문자인식프로그램을 사용하면, 이런  이미지형태의 그림 PDF 파일을 간단하게 검색이 가능한 PDF 파일 (Searchable PDF) 로 바꿀 수 있습니다.   

 


 

 

 

 ABBYY FineReader (이하 파인리더) 를 실행하면 위와 같이 빠른 작업창이 뜹니다.  여기서 파일을 PDF/A로 변환을 선택해보겠습니다. 

 

위 작업창은 빠른작업창이기 때문에  원하는 작업을 선택해서 파일을 열기만 하면 자동으로 검색가능한 PDF 파일로 변환되어 PDF 뷰어에서 열리는 작업까지 합니다. 

 


 

 

 

오른쪽이 원본이미지, 왼쪽이 텍스트를 추출한 이미지입니다.

(이주임 TIP : 오른쪽의 화면을 곧바로 워드나 엑셀로 저장할 수도 있어요^^)



 



 

검색 가능한 PDF 파일로 변환된 모습입니다. 텍스트 드래그를 해보았는데요~ 

텍스트 복사/ 검색 모두 가능합니다. >_< 

FineReader 는 직관적이고도, 사용자 친화적인 인터페이스를 자랑하는데요~ 누구나 쉽게 작업하실 수 있는 점이 큰 장점입니다! 


또 요즘, 소장하고 있는 책을 스캔해서 PDF로 만드신 후 스마트폰이나 태블릿에서 보시는 분들이 굉장히 많으신데요~ 


일반 이미지 PDF 파일이 아닌 ABBYY FineReader를 사용하여' 검색 가능한 PDF 파일' 로 만들어보세요~ 원하는 단어를 즉시 검색할 수 있고, 태그 PDF로 저장할 수 있어 모든 휴대기기에서 동일하게 문서를 확인하실 수 있답니다 ^^ 



문자인식 프로그램 활용 두번째!!

PDF 파일을 워드파일로 변환해보자!! 


(이주임 TIP : PDF파일뿐만 아니라, JPG, PNG, BMP 등 거의 모든 이미지 포맷의 파일을 워드파일로 바꿀 수 있습니다) 




 

자 , 다음은 PDF 파일을 워드로 변환해보겠습니다. (샘플 파일 찾기가 힘드네요ㅠ_ㅠ) 

여러분,학교나 직장에서 문서를 PDF파일로 받는 경우 많으시죠? 문서를 새로 편집하거나, 인용해서 사용해야 할 때마다  이 PDF 파일이 워드파일이었으면 좋겠다!!  라고 생각하신 적 많으셨을거에요~ 파인리더로 간단하게  PDF를 워드파일로 바꿔볼게요~ 






 

마찬가지로 빠른 작업창에서 "파일을 Microsoft Word로 변환" 을 선택해주시면 됩니다.

문자인식 프로그램 파인리더는 직관적인 인터페이스로 빠른 작업창 만으로도 원하는 작업을 할 수 있습니다.


(이주임 TIP : 조금더 세세한 설정, 예를 들어 '이미지 보정, 편집, 텍스트 인식 영역 설정' 등을 원할 경우 빠른 작업창을 닫고 작업해보세요~) 




 

그럼 이렇게 파일 열기 창이 뜨는데요, 워드로 바꾸길 원하는 파일을 선택해주세요. 여기서 잠깐!! 이주임이 알려드리는 파인리더 사용팁~ ^^


빨간 네모칸을 주목해주세요 총 3가지의 옵션이 있는걸 확인할 수 있는데요


1. 페이지 방향검색: 말 그대로 페이지의 방향을 검색하는 옵션, 거꾸로 뒤집힌 이미지등 이미지의 방향을 자동으로 검색하여 정방향으로 바꿔줍니다. 


2. 이미지 전처리 사용:  자동으로 해상도를 조정하고, 기울어진 이미지를 조정하는등 자동으로 똑똑하게 이미지를 OCR에 적합하게 보정해줍니다.

 

3. 맞붙은 페이지 분할: 2페이지가 같이 붙어있는 이미지의 경우 자동으로 페이지를 분할해줍니다. 


필요하신 경우 체크하시고 사용하세요^^






파인리더 실행화면입니다. 왼쪽화면은 원본(이미지)~ 오른쪽 화면은 (텍스트) 즉 변환된 결과입니다. 한눈에 보기 쉽죠~ 


또 빠른 작업창으로 작업을 선택했기 때문에  아래와 같이 워드로 변환된 결과(워드 창)까지 뜹니다   







워드로 변환한 결과를 한번 볼까요? ABBYY FineReader 가 완벽하게 변환해주었네요! 원본 문서와 레이아웃도 동일하고, 이미지는 이미지대로 텍스트는 텍스트로 출력해주었습니다. PDF를 워드로 바꾸는 방법 정말 간단하죠? 

빠른 작업창을 통해서 작업하는것도 좋구요, 여러가지 옵션들을 사용하면서 작업해보시는것도 좋습니다~  여러분들에게 더 맞는 방법으로 활용해보세요 ^^ 

1. 일반 PDF 파일을 검색 가능한 PDF 파일로 변환하는 방법과,
2. PDF 파일을 워드파일로 변환하는 방법을 알아봤는데요. 

참고로 "워드" 뿐만 아니라  엑셀(excel), 이북(EPUB), 파워포인트 등으로도 변환이 가능합니다. 파인리더 다재다능하죠? 



추가로 앞에서 잠깐 언급했던 '지능형 이미지 사전처리 기능' 과 
알아두면 굉장히 써먹을데가 많은 ^^ < PDF파일을 이미지파일로 저장> 하는 기능을 소개해드리면서 오늘 포스팅 마무리할게요~ 


 

PDF파일을 파인리더로 열어보았습니다. 본문에서 "이미지 편집" 기능을 소개했는데요. 조금 더 자세히 알아볼까요 ?




다양한 기능들이 나타납니다. 음 예를들어, 저는 위 이미지에 "ABBYY FineReader 작업" 이란 글씨가 맘에 안들어요. 한번 지워볼까요? 지우개를 클릭하고 원하는 부분을 지워보세요~ 


일반 그림판, 포토샵의 지우개와 같은 기능이랍니다. PDF파일의 수정이 난감할때 사용하면 좋겠죠?? 





자 이번엔 빨간 네모칸을 봐주세요~ 원하는 "페이지" 에서 마우스 우클릭 하신 후 선택 이미지 저장을 누르면 이렇게 수정한 파일을 PDF, JPG, BMP 등등 다양한 이미지 파일로 이미지 그대로 저장할 수 있습니다~ 

PDF파일을 이미지파일로 저장해야 될 때, 파인리더를 활용하세요 ^^ 전 정말 많이 쓰고 있답니다 ㅎㅎ 




그리고 워드파일로 저장할때는 한가지 모드로만 저장하는 게 아니라 \
<정확한 사본> , <편집가능한 사본> , <일반 텍스트> 등 원하는 대로 다양하게 저장할 수 있답니다~ 





레티아에서 30일 무료 시험판을 받으실 수 있습니다. 아래 링크에서 다운로드 받으세요~ 





감사합니다. 레티아 이주임이었습니다 ^_^V 
궁금하신 내용은 언제든지 문의주세요 ~ 




블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,







ABBYY란?


ABBYY는 1989년 설립되었으며, 러시아 모스크바에 본사를 둔 IT 기업이자 OCR 관련 글로벌마켓 점유율 & 성능 1위를 자랑하는 세계적인 브랜드입니다. ABBYY 그룹은 혁신적인 언어 및 인공지능 기반의 기술로 수많은 정보를 지식으로 변환하는 솔루션과 서비스를 개발,공급하고 있습니다. 







▲ 모스크바에 위치한 ABBYY 본사



ABBYY그룹은 북미/서유럽/동유럽/러시아에 본부(Headquarters)를 두고 있는 글로벌 기업입니다.독일, 영국, 미국, 캐나다,프랑스,스페인,아랍에미리트,우크라이나, 사이프러스,호주, 일본,대만에 16개 국가에 지사를 두고 있습니다. 연구 및 개발 프로젝트의 대부분은 모스크바에서 실시하고 있다고 합니다.  




▲ ABBYY Eastern Euopean HQ in Kiev 

▲ ABBYY North American HQ in Milpitas, CA


 

또한 미국, 러시아, 호주 등의 정부에서 ABBYY그룹의 제품을 사용하고 있으며 캐논, EMC/Captiva, MS, HP,삼성전자등에서 ABBYY의 기술 라이선스를 사용하고 있습니다. 또 세계 최고의 장비업체 엡손, 후지쯔,후지제록스,도시바등에 기술이 탑재되어 전 세계에 제공되고 있습니다. 선도적인 모바일 제조업체 노키아, 삼성, LG, HTC, 팬택, Voxtel 도 ABBYY의 기술을 사용합니다. 




▲ ABBYY FlexiCapture (플렉시캡처) 솔루션 인포그래픽 

ABBYY의 데이터 캡처 솔루션의 역사를 설명합니다. 




전 세계 150여개의 국가에서 ABBYY의 제품을 사용하며, 수천 개의 기업에서 ABBYY 기술을 사용하여 연간 93억 페이지 이상의 문서와 폼 서식을 처리합니다. 또한 ABBYY 제품은 세계 각종 IT 매거진으로부터 제품의 혁신성, 정확성, 용이성 등을 인정받아 240개 이상의 수상 경력을 자랑합니다. 








레티아 소개 


레티아는 Recognition Technologies and Innovation Ace의 약자로 혈관/신경네트워크를 의미하는 Rate의 복수형이기도 합니다.

문자인식 및 이미지 정보화 기술 시장의 핵심 역할을 하고자 하는 의미를 담고 있습니다. 



레티아는 ABBYY의 OCR, ICR, 데이터 캡처 기술 제품을 국내에 독점 공급하는 Country Partner 입니다. 레티아는 자사만의 기술사업 역량을 인정받아 ABBYY사의 국내 지사 역할을 수행하고 있으며, 혁신적인 최적의 OCR 솔루션을 국내의 많은 기업 및 기관에 제시해드리고 있습니다. 



감사합니다. 







블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,