PDF문자인식 (PDF OCR) 손쉽게 사용하기 



안녕하세요! 레티아입니다.

워드, 엑셀, 한컴오피스 문서 뿐만 아니라 요즘에 PDF 문서도 정말 많이 사용하시죠? 회사에서, 학교에서, 기관에서~ PDF 문서를 사용하지 않는 곳을 찾기가 더 어려울 정도인데요. 



가볍고, 공유하기 좋고, 보관하기 좋고 모든 사람들이 동일한 결과물로 볼 수 있는 다 좋은 PDF 문서! 문제는 이렇게 좋은 PDF 문서가 가끔 우리들을 당황하게 만든다는 것...!! (T__T) 바로 PDF 문서가 가진 "편집이 제한적인" 성격과, 디지털PDF와 이미지PDF라는 구분하기 쉽지 않은 두 가지 형식이 알게 모르게 존재하는 점..... 때문인데요. ABBYY FineReader 14(이하 파인리더14) 는 이런 PDF 문서 작업에 필요한 모든 문제를 척척 해결해준답니다! 



무료 시험판은 레티아 홈페이지에서 다운로드 받으실 수 있습니다.








워드, 엑셀, 파워포인트 같은 오피스문서 프로그램에서 만들어진 PDF파일은 생성될 때 부터 텍스트 레이어를 가지고 있지요~ 이런 PDF문서는 편집이나 텍스트 추출(마우스로 텍스트를 드래그하여 복사하는 것)이 문제가 없답니다. 







우리가 당황하게 되는 순간은 바로 이런 "이미지PDF" 스캔PDF라고도 부르죠? 이런 이미지PDF를 만났을 땐데요. 분명 PDF파일이라고 했는데, 텍스트 편집도 안되고.. 수정도 안되고.. 심지어 드래그 해서 복사도 안된다니... 



파인리더 14는 일반PDF문서 작업은 물론이거니와, 위 그림과 같이 이미지PDF를 포함한 모든 PDF문서의 텍스트를 수정하거나 편집하고 문자인식 할 수 있습니다! 바로 이렇게요~ 







 위 PDF는 스캔이미지로 만들어진 PDF문서입니다. 

텍스트 드래그 및 복사가 되지 않습니다. 



자 그럼 ABBYY 파인리더 14로 정말 정말 쉽게~ PDF파일을 문자인식하여 수정하는 법을 알아보겠습니다. 





- 파인리더 14 실행 후 "PDF문서열기" 를 눌러 수정할 PDF파일을 선택합니다. 




- '편집' 아이콘을 클릭합니다. 





- 위 화면에서 보시는 것처럼 편집가능한 영역이 표시됩니다. 




- 커서가 생기고, 워드처럼 텍스트를 편집할 수 있습니다. 텍스트를 수정하거나 글꼴을 바꾸거나 폰트사이즈를 바꿀 수 있습니다. 





- 짜잔 스캔PDF파일 속 텍스트가 감쪽같이 수정되었습니다. 







움짤로 확인해보세요 > ㅁ < 









ABBYY 파인리더 14는 이렇게 PDF문서에서 곧바로 텍스트를 수정할 수도 있지만, 

문서에서 텍스트 자체를 복사할 수 도 있습니다. 


많은 분들이 'PDF텍스트 추출' 이라고 부르시는 기능인데요, 한번 확인해보실까요? 





사실 사용방법 이랄 게 없구요 ㅠㅠ 

그저 PDF파일을 열고, 마우스로 원하는 부분을 '드래그' 하면 텍스트가 추출됩니다. 


파인리더 14는 모든 PDF파일 (스캔PDF포함)이 열리자마자 

자동으로 백그라운드 문자인식 작업을 합니다. 


그저 우리는 PDF파일을 <열기> 만 하면 됩니다!! 

 



이런 기능을 찾으셨던 여러분들께 도움이 되길 바라며, 여러분들도 지금 시험판으로 테스트를 해보시거나 

필요로 하셨던 업무에 유용한 도움이 되길 바랍니다! 마지막으로 시험판 링크 다시 안내해드릴게요~ 감사합니다. 



파인리더 14는 무료 시험판으로 30일동안 사용 가능합니다. 

(총 100페이지 변환 가능하고 한번에 3장까지 저장할 수 있도록 제한되어 있습니다) 








 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,


똑같은 PDF 형식인데 

어떤 PDF문서는 텍스트 복사도 되고, 검색도 되고..

어떤건 아예 텍스트 드래그가 안되고..  

더이상 난감해 하지마세요! 


우리에겐 ABBYY의 이미지 문자인식 기능이 있으니까요 






1번의 경우 텍스트와 이미지로 이루어져있는 디지털PDF인데요.

워드나 엑셀과 같은 오피스프로그램의 가상프린터 기능(인쇄) 을 통해 만들어집니다. 이렇게 만들어진 PDF파일은 텍스트정보/그림이 다 포함되어 있기 때문에 사실상 큰 문제가 없죠. 



2번의 경우가 문제겠죠? 2번 PDF파일은 일종의 '스냅샷' 입니다. 

텍스트레이어(층)가 전혀 없이 진짜 '이미지' 만 있습니다! 


사진을 PDF로 만들었거나,

스캐너에서 스캔한 이미지를 PDF로 만든 경우, 

또는 PDF 원 생성자가 의도적으로 PDF 레이어를 삭제한 경우! 



이 경우 'PDF문자인식' (이미지 문자인식) 기능을 사용하시면 됩니다. 

곧바로 텍스트를 검색하거나, Microsoft Word, Excel 등으로 손쉽게 바꿀 수 있답니다. 




<2번 PDF : 텍스트레이어가 없는 PDF 예. > 




ABBYY PDF Transformer+를 사용하면 

이미지 문자인식 기술을 사용하실 수 있는데요. 


이미지 문자인식 기술이란? 단어 그대로 '이미지에서' 글자와 그림을 구분하고, 찾아내 텍스트로 바꿔주는 기술입니다. 


그림PDF를 편집 가능한 워드,엑셀,파워포인트로 변환할 수 있습니다. 




<PDF트랜스포머, 워드로 변환 실제 데모>


 



<PDF트랜스포머, 엑셀 변환  실제 데모>






또한 '검색가능한pdf'파일을 생성하는 기능도 제공하는데요! 



검색 가능한 pdf파일이란? 

위 그림과 같이 우리의 눈에는 똑같이 pdf이미지가 보이는데, 

보이지 않는 형태로 (히든 텍스트) 

인식된 텍스트가 포함된 pdf파일을 말합니다. 





만능 pdf편집 프로그램 pdf트랜스포머를 사용하시면 

pdf 편집/수정 뿐만 아니라 이렇게 이미지문자인식 기능도 사용해보실 수 있습니다. 







인식률 높기로 소문난 ABBYY OCR 문자인식 기술을 지금 바로 경험해보세요!


* 무려 전세계 190개 언어 인식을 지원합니다. 

* OCR 기술분야의 글로벌 넘버원 기업으로, 최고의 한글인식률을 지원합니다! 



무료 시험판 바로가기 








블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,