안녕하세요, 레티아입니다.

이번 포스팅에서는 텍스트 검색, 드래그가 안되는 PDF 문서를 PDF변환프로그램으로

검색이 가능하도록 변환해보겠습니다.


더 쉽고 빠르게 확인하실 수 있도록 동영상으로도 제작해봤습니다~^^ 

아래 링크를 클릭하시면 유튜브 동영상을 바로 확인하실 수 있습니다.




레티아 유튜브 보기 : https://youtu.be/GMxaogdPTbw









검색 가능한 PDF 파일이란 뭔지 조금더 자세히 알아볼까요? 


어떤 PDF파일은 마우스로 드래그하면 텍스트가 복사되서 자유롭게 사용할 수 있는반면 


텍스트 드래그 자체가 안되는 PDF파일도 있습니다. 


이유는 바로 PDF파일의 생성 방법에 따라 달라지는데요, 


크게 3 가지 종류로 PDF파일을 분류 할 수 있습니다. 



 

1. 디지털 PDF 


2. 이미지 PDF


3. 검색가능한 PDF 




1. 디지털 PDF 




워드, 엑셀, 파워포인트, 한컴오피스 등과 같은 오피스 프로그램(문서작성 프로그램)에서 손쉽게 PDF 파일을 만들 수 있습니다

이렇게 만들어진 파일을 '디지털 PDF파일' 이라고 합니다

 

디지털 PDF 파일은 이미지 래스터와 텍스트 레이어를 모두 갖고 있습니다

따라서 PDF 파일을 워드로 바꾸기도 쉽구요

텍스트 검색, 복사가 모두 가능해서 가장 쉽게 사용할 수 있는 PDF 파일입니다

유료 PDF 소프트웨어로 텍스트 수정 편집도 쉽게 가능합니다






2. 이미지 PDF 



'이미지 PDF파일' '스캔 PDF 파일' 은 동일하다고 할 수 있는데요

이미지 PDF 파일은 쉽게 말해 이미지를 PDF 포맷으로 변경한 파일입니다

스크린샷, 카메라 촬영 이미지를 PDF 라는 확장자로 생성했다고 보시면 됩니다

마찬가지로 스캔PDF파일 역시 스캐너/복합기에서 스캔한 문서를 PDF 파일로 만든 것입니다

 

이러한 PDF파일은 하나의 이미지로 이루어져있기 때문에 텍스트 레이어 가 없습니다

따라서 텍스트 복사, 검색 등이 불가능합니다

 

(하지만 PDF트랜스포머 프로그램으로 가능하게 만들수 있습니다.) 

 


 


3. 검색 가능한 PDF 






우리 눈에는 위에서 살펴본 2번 이미지 PDF 파일과 똑같이 보여집니다

하지만 '검색 가능한 PDF' 파일은 우리 눈에 보이지 않게 이미지 아래 텍스트 레이어가 포함되어 있습니다

 

텍스트 레이어가 있기 때문에 텍스트 검색, 복사가 가능합니다하드 카피본을 전자 문서로 만들 때 많이 사용합니다



PDF트랜스포머의 OCR 기능으로, 이미지형 PDF를 검색가능한 파일로 변환할 수 있습니다. 


OCR로 이미지 PDF의 텍스트를 인식하고, 인식된 텍스트 좌표값이 동일하게 저장되었기 때문에 텍스트 드래그, 복사도 가능합니다. 







스캔한 pdf 파일을 검색 가능한 pdf 파일로 변환하는 데모 영상입니다보시다시피, 정말 원 클릭으로 한번에 변환을 완료합니다.


쉽고 직관적인 인터페이스로 모든 분들이 별도 교육 없이 바로 사용할 수 있는 점도 장점인데요

 

PDF 트랜스포머 프로그램에서만 검색이 가능한게 아니라, ~ PDF 뷰어에서 PDF를 검색할 수 있도록 파일을 변환해줍니다~~ 

 

정말 유용하실 거에요~~ 

  

 







 

조금이나마 도움이 되셨나요?


소개된 ABBYY PDF Transformer+ (애비 PDF 트랜스포머 플러스)는 

레티아 홈페이지에서 무료 시험판으로 누구나 사용해보실 수 있습니다. 


레티아 홈페이지 ABBYY PDF Transformer+ 소개 및 시험판 다운로드 바로가기 




감사합니다. 






블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,





PDF파일이란?


PDF파일은 문서 포맷 중 하나입니다. PDF파일로 문서를 저장하면 어떤 기기, 어떤 운영체제에서든지 작성자가 만든 파일 형태 그대로 파일을 볼 수 있습니다. 

 









PDF파일을 사용하나요? 


아시다시피 PDF 파일 포맷이 출시된 시기는 그리 길지 않습니다. 하지만 PDF 파일이 선보인 이후부터 기업 및 기관 뿐만 아니라 개인 사용자까지 PDF문서 사용이 기하 급수적으로 늘었다고 해도 과언이 아닌데요, PDF파일을 사용하는 가장 주된 목적은 문서에 대한 신뢰도가 높고 파일 공유가 쉬우며, 전자문서로 보관이 가장 적합하기 때문입니다.    








PDF파일은 문서의 보안이 가능하고, 호환성이 뛰어나 어떤 환경에서 PDF파일을 보더라도 원본 형태 그대로 볼 수 있기 때문에 문서에 대한 정확성을 보장합니다. 언제 어디서 누가 어떤 기기, 어떤 운영체제에서 PDF문서를 보더라도 작성자가 만든 동일한 형태로 볼 수 있습니다. 








또한 PDF파일은 텍스트, 그림, 오디오 등 모든 소스파일을 그대로 저장 및 유지하거나, 암호로 보호할 수 있습니다. 뿐만 아니라 파일 용량도 조정할 수 있기 때문에 문서 보안 및 보관 솔루션으로 가장 많이 사용되는 파일이라고도 할 수 있습니다







특히 국제표준화기구(ISO)에서 PDF/A 포맷을전자문서의 표준 포맷으로 지정하였습니다. 따라서 수많은 기업과 공공 기관에서 문서 보관 시 더 이상 보관을 위한 공간(장소)이 필요하고, 관리가 어려운 종이 문서로 보관하지 않고 PDF파일로 보관을 하고 있습니다.









PDF파일에 OCR이 필요한가요? 

 






단순한 PDF뷰어 프로그램은 스캐너로 만든 PDF파일을 처리할 수 없습니다. 







1. 책, 종이 문서를 스캔해서 만든 PDF 파일이나 

2. 카메라로 찍은 사진을 PDF로 만들어서 보관한 경우 

3. JPG, PNG등 이미지 파일을 PDF로 만든 경우 

4. 파워포인트 등에서 PDF 생성 시 텍스트 레이어가 포함되지 않은 경우



등등의 PDF파일은, 원본과 동일한 형태로 읽을 수는 있지만 원하는 내용을 검색할 수 없고,텍스트를 드래그해서 복사할 수도 없는 불편한 점이 있는데요. '전자문서' 로서 해야할 역할을 해내지 못한다고 보면 되겠죠?      



ABBYY사에서 500개 이상의 중대형 기업을 대상으로 설문조사 한 결과, 81% 이상이 이런 PDF 파일을 작업할 때 어려움을 느꼈다는 대답을 했다고 합니다. OCR(광학문자인식)으로 이런 부분들은 해결할 수 있는데요~ OCR 프로그램으로 이미지 속 텍스트를 인식하고, 이미지 PDF 파일에 새로운 텍스트 레이어를 포함시킬 수 있습니다.  








OCR 프로그램(ABBYY FineReader 12)을 사용해서 문서를 스캔하면, 

단순 스캔이미지파일이 아니라 검색 가능한 PDF로 저장할 수 있습니다.

쉽게 말해 스캔문서의 모든 내용을 PDF 뷰어에서 검색할 수 있을 뿐만 아니라 

북마크, 하이퍼링크 유지 및 기타 PDF 포맷의 장점을 그대로 모두 사용할 수 있습니다.

 


특히 디지털 문서의 장기 보관용으로 쓰이는 PDF/A 포맷으로 저장할 경우, 사용자가 수 시간(몇 년? 몇 십년? 아니면 그 이상이 될 수도 있겠죠~^^)이 흐른 후 문서를 열 때 보관 당시와 똑같은 모양을 유지할 수 있으며, 문서의 모든 내용을 복사하여 재 사용하거나 특정 정보를 재빠르게 찾는데 사용될 수 있습니다. 


개인도 OCR 프로그램만 있다면 너무 쉽고 간편하게 종이문서를 디지털화 할 수 있고 전자 문서(국제표준기관에서 인정한^^)로 보관할 수 있습니다.  







ABBYY FineReader 12로는 어떤 PDF 작업을 할 수 있나요? 


OCR프로그램 ABBYY FineReader 12(애비 파인리더 12) 를 사용하면 여러분도 전문가 못지 않게 OCR을 사용해 PDF 작업을 할 수 있는데요. 그러면 제가 실제로 작업했던 문서들을 보여드릴게요~  






카메라로 촬영한 사진 OCR

  



1. 스마트폰, 디지털 카메라로 문서를 촬영 





2. ABBYY FineReader 12 실행, 프레임 조정(자동 감지 가능 또는 수동으로 조정)





3. ABBYY FineReader 12로 경사, 기울기 보정 및 OCR 문자인식 




4. 어떤 PDF 뷰어에서도 전체 텍스트 검색 가능 






스캔문서 OCR 및 이미지 보정

  



1. 종이 문서를 스캔해서 만든 PDF파일을




2. ABBYY FineReader로 OCR 하여 텍스트 레이어를 추가하고 





3. 이미지 보정까지 완료하여 깨끗하고 검색과 드래그가 가능한 PDF파일로 변환 가능. 






흐릿하고 스캔 품질이 좋지 않은 이미지를 



마치 오피스 문서에서 작성한것처럼 이미지 품질을 높일 수 있습니다.  





원하는대로 자유롭게 PDF 압축  







ABBYY FineReader 12는 다양한 PDF 압축 옵션을 제공합니다. 

원할 경우 압축 없이 최상 품질로 PDF를 저장하거나, 공유 목적으로 PDF용량을 대폭 줄일 수도 있습니다.

 또한 이미지의 균형을 유지하며 압축하는 MRC라는 기능도 제공합니다. 







똑같은 PDF 파일을 FineReader에서 제공하는 4가지의 옵션을 사용하여 압축해보았습니다~ 

크기가 각각 달라지는걸 보실 수 있죠? 필요한 상황에 따라 자유자재로 PDF파일을 압축해보세요. 




다양한 PDF 저장 옵션   





또 ABBYY FineReader 12에서는 다양한 PDF 저장모드를 지원하는데요 


원본 이미지입니다. 잘봐주세요~ 




↑'페이지 이미지 밑에 텍스트' 로 저장한 PDF 파일 

원본과 동일하게 보이죠? 하지만~ 



짠~ 텍스트 레이어가 보이지 않게 추가된 상태입니다.(hidden text) 

모든 PDF 뷰어에서 텍스트 드래그, 복사, 검색이 가능합니다. 




↑'페이지 이미지 위에 텍스트' 로 저장한 PDF파일 

원본과 비슷하게 보이지만, 텍스트를 보시면 좀 다른걸 알 수 있는데요.

 (문서의 그림파일은 그대로 두고, 인식된 텍스트가 이미지 위로 저장됨) 

PDF에서 보여지는 폰트를 바꾸는 것도 가능하고,

모바일 태블릿 등 기기에서 확대를 해도 텍스트가 깨지지 않겠죠~?  






PDF파일의 장점 및 PDF파일을 사용하는 이유 부터, PDF파일과 OCR의 결합으로 얻을 수 있는 장점까지 한번 알아보았는데요~ 혹시 궁금하신 점이 있다면 댓글로 문의주세요~ 


소개된 ABBYY FineReader 12 OCR 프로그램은 레티아 홈페이지에서 셰어 버전 (30일 무료)을 다운로드 받으실 수 있으니, 필요로 하시는 분들께서는 꼭 한번 테스트해보시기 바랍니다. 



레티아 홈페이지 ABBYY FineReader 12 소개 및 시험판 다운로드 바로가기



감사합니다. 





블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,



ABBYY PDF Transformer+ 

마스킹/교정 기능 사용 

민감한 개인정보를 한번에 완벽하게 제거 





ABBYY PDF Transformer+는 PDF문서 작업에 쓰이는 필수적인 기능을 모두 제공하는 PDF 전문 소프트웨어입니다. (가성비 좋은 소프트웨어로 유명하죠 ^^) PDF트랜스포머가 제공하는 수많은 유용한 기능 중 교정(Redact) 기능에 대해 알아보겠습니다. 


주민등록번호나 계좌번호, 비밀번호, 기타 노출되면 안되는 중요한 데이터를 포함하는 PDF 문서를 작업하신 적 종종 있으시죠? 개인정보 보호의 필요성이 높아지면서 이런 민감한 정보가 들어있는 문서를 작업하거나, 공유할 때 각별한 주의를 기울여야 하는데요.   


여러분은 개인정보 마스킹 어떻게 처리하시나요? ABBYY PDF Transformer+ 는 특정 정보를 손쉽게 제거할 수 있는 편리한 기능을 제공합니다. 간단하게 마우스 클릭 한번으로 쉽게 마스킹 처리가 가능합니다.  







PDF문서 속 민감한 개인정보 마스킹 






ABBYY PDF Transformer 실행 후 위와 같이 <편집x> 아이콘을 누르면 교정 모드를 사용할 수 있습니다. 







이렇게 마우스 옆에 <페인트> 모양이 생기는데요~ 






개인정보 등 지우고 싶은 데이터를 마우스로 드래그로 가릴 수 있습니다.  단순히 검은색으로 색칠만 되는게 아니라 텍스트 레이어도 제거되기 때문에 검색/복사가 불가능합니다. 즉 PDF 문서에서 해당 데이터 자체가 완전히 제거니다. PDF 문서에 주민등록번호가 기재되어 있다거나, 기타 비밀번호 등 민감한 정보가 포함된 경우에 아주 유용하겠죠? 







만약 제거할 정보가 많다면? 

동일한 데이터를 한번에 모두 제거할 수 있습니다.  






왼쪽 검색 및 편집 창에서 지우고자 하는 데이터를 검색합니다. (68개의 데이터가 검색되었네요) 






<교정 적용>을 눌러주세요. 





교정이 완료되었습니다. 

똑같은 단어를 검색해보니 <검색어와 일치하는 항목을 찾지 못함> 이라는 문구가 보입니다. 


68개의 데이터를 한번에 모두 제거 하였습니다. 






개인정보 보호 기타 민감한 정보 문서보안



PDF트랜스포머의 <숨겨진 데이터 제거> 기능의 설정 창입니다. 숨겨진 텍스트와 개체를 모두 제거 하고 문서를 이미지 전용 PDF로 저장하거나, 북마크, 첨부파일 등을 제거할 수 있습니다. 


ABBYY PDF 트랜스포머로 PDF 파일 속 중요하거나 민감한 정보를 얼마든지 아주 안전하게 제거할 수 있습니다. 









ABBYY PDF 트랜스포머는 30일동안 시험판으로 무료로 사용하실 수 있으며, 더 다양한 기능이 궁금하신 분들은 아래 레티아 홈페이지를 방문해주세요 


레티아 홈페이지 ABBYY PDF Transformer+ 바로가기 


감사합니다. 



 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,

 

 

OCR 전문 프로그램 ABBYY FineReader 12가 제공하는 수 많은 기능 중 잘모르고 그냥 지나치셨을 법한 유용한 기능 5가지에 대해 알아보겠습니다. 

파인리더라는 프로그램을 오늘 처음 아신 분부터, 파인리더를 이미 구매하여 사용중이신 분들도 "엇, 이런 기능이? " 또는 "이렇게 활용하는 거였어? " 라고 하실 수도 정도로 도움이 되는 유용한 팁이니, 아래 다섯가지 내용 꼭 확인해보시기 바랍니다.   

 

우리가 살고 있는 시대를 스마트 시대라고 하지만 아직 회사에서는 종이 문서를 빼고는 일을 진행 할 수 없을 정도로, 각종 계약서/인증서/신고서 등 업무상 수 많은 종이 문서를 사용하게 되는데요, 

 

1. 종이 문서 및 PDF 파일에서 원하는 부분을 빠르게 텍스트 or 표 복사. 

 

 

프린트한 문서에서 필요한 데이터나, 문구가 있을 경우. 키보드로 다시 입력할 필요가 없습니다. 

파인리더(FineReader)에서 마우스로 필요한 부분을 드래그만 하세요~ 그러면 자동으로 위 그림과 같이 복사 버튼이 나타납니다. '복사'를 누르면 클립보드에 '표' 또는 '텍스트'로 복사가 되고, word / excel에서 붙여넣기만 하면됩니다. 번거롭게 재 타이핑할 필요없이 원하는 부분을 마우스로 손쉽게 긁어 올 수 있습니다.  

 

 

↑ 파인리더에서 복사 후, 엑셀에서 붙여넣기 한 결과. 표 형식 그대로 복사가 가능합니다. 

 

 

2. 스캔품질이 좋지 않은 PDF 파일을 깨끗하게 보정 

 

 

워드나 엑셀에서 저장한 PDF파일외에,스캔한 이미지로 만들어진 PDF파일도 많이 사용하시죠? 

어떻게 스캔하냐에 따라 위와 같이 글자가 흐릿하거나 뒷 페이지 글자가 비치는 등 낮은 품질의 문서로 스캔될 수 있는데요,  

 

 

 

FineReader로 깔끔하고 새로 스캔한것처럼 완벽한 문서로 보정하실 수 있습니다. 

- PreciseScan 기술로 글자를 매끄럽게 보정 가능 

- 균일한 흰 배경 만들기. 문서 배경의 그림자 등 보정 가능 

 

 

3. 카메라로 찍은 이미지를 완벽한 PDF 파일로 생성 

 

 

FineReader는 스캐너로 스캔한 문서외에도 카메라로 촬영한 사진 속 글자도 인식할 수 있는데요!  

단순히 사진에서 텍스트를 추출하는 것도 가능하지만 만약 PDF파일로도 저장을 하셔야한다면 아래 화면처럼 고르게 보정된 파일로 저장할 수 있습니다. 

 

 

 

이미지 보정 작업은 자동으로 처리됩니다. 대부분의 경우 아마도 FineReader가 자동으로 처리한 이미지의 결과를 만족하실 겁니다.

하지만 그래도, 좀 더 정교한 처리를 원하실 경우에는 수동으로 직접 이미지의 기울기 등을 보정하는 옵션을 사용하실 수 있습니다.  

 

 

4. 태블릿 또는 이북(e-book)리더에서 읽기 편한 포맷으로 변환 

 

혹시 7인치 태블릿에서 A4 풀사이즈 크기의 파일을 읽어 본 적이 있으신가요? 아마도 이리저리 화면 비율 조정하기 힘드셨을텐데요.  

ABBYY FineReader 12는 이미지파일, PDF파일을 EPUB, FB2 포맷으로 변환할 수 있으며,특별한 PDF 타입도 지원합니다.Tagged PDF.A 등은 휴대용 기기와 같은 작은 화면에서 읽기 편한 포맷으로 화면에서 자동으로 폭이 조정되는데요, 

캔한 종이문서, 이미지pdf파일을 이북리더, 태블릿에서 읽기 편한 포맷으로 손쉽게 저장할 수 있습니다. 

 

 

5. 낙서 또는 메모를 제거

 

 

마음에 드는 책에 낙서가 있거나, 메모를 한 경우도 많으시죠? 

오래오래 보관할 목적의 전자문서로 저장할 경우, 좋은 이미지 품질로 당연히 저장하고 싶으실텐데요~ 

 

 

  

ABBYY FineReader는 펜으로 만들어진 유색 스탬프나, 마크를 감지하여 제거하는 기능을 제공합니다. 

방법도 아주 간단합니다. FineReader가 제공하는 이미지편집 기능에서 클릭 한번으로 색상 마크를 제거할 수 있습니다. 마음에 드는 책 낙서가 되어있다고 상심하지 마시고, 낙서되기 전 초기 모습으로 이미지를 복원 후 전자문서로 오래오래 보관하세요~

 



 

ABBYY FineReader 12가 제공하는 유용한 작업 다섯가지에 대해 알아보았습니다. 

 

 

아시다시피 ABBYY FineReader는 종이문서, 이미지 PDF,사진 등을 텍스트 복사&편집 & 찾기 등이 가능한 파일로 변환해주는 OCR 전문 소프트웨어입니다. 여러 단의 문단, 표, 그림 이 있어도 문서 포맷 그대로 복원할 수 있어 문서 편집 시간을 획기적으로 줄여주는 프로그램인데요. 또한 인식 결과를 원본화면과 나란히 대조하면서 교정할 수 있어 편리합니다. 

 

 


 

아래 레티아 홈페이지를 방문하시면 100페이지까지 직접 무료로 변환해보실 수 있는 시험판을 다운로드 받으실 수 있습니다. 

 

 

 

앞으로도 레티아 블로그 많이 찾아주세요! 감사합니다. 

 

 

 

 

 

 

블로그 이미지

OCR전문기업 레티아

OCR프로그램, PDF변환프로그램 리뷰를 포함하여 ABBYY의 OCR엔진, 모바일, 데이터캡처 솔루션, 서버형 솔루션, 명함인식 솔루션 등 다양한 정보를 제공합니다.

,