오래된 책들을 몽땅 PDF로 만들어 보자

 

Shine Ultra Pro

오래전부터 몇권씩 사서 보던 책들이 쌓이게 되면서 책꽂이도 늘어나고, 일년에 한번도 보지 않는 책들은 대부분 이미 버렸습니다. 그래도 밑줄 그어 가면서 열심히 공부하던 책들이나, 어떤 책은 가끔 참고하려고 들춰보기도 하니까 그냥 모조리 버리기는 아까워서 망설였던 적이 있어요. 

하지만, ‘북 스캐너’가 그리 대중적인 제품이 아니라서 그런건지, 상당히 비싸더군요. 게다가, 책을 전단기로 잘라서 페이지 별로 스캐하는 방식이라, 별로 내키지 않았던 것도 있구요.

 

북 스캐너 사다

2019년 말 인디고고 (www.indiegogo.com)에서 CZUR란 회사에서 책을 뜯지 않고도 페이지 단위로 스캔하여 디지털 문서(PDF나 워드 파일)로 만들 수 있는 ‘북 스캐너’를 만들어 판매한다고 해서 150불에 얼리버드로 신청, 주문했는데, 7개월이 지난 이제야 도착했네요 (세계적인 코로나 바이러스 펜데믹 상황 때문에 생산과 배송이 지연되었다는군요. 그나마 다행이죠, 론칭도 못하고 망한 창업자들도 많았을 텐데...)

 

열어 보니

일요일 아침, 배달 온 소포를 보니, 박스가 약간 너덜너덜 해진 것 같네요. 아무래도 비행기 배송은 포기하고 해운으로 배송을 하면서 창고와 세관 이곳 저곳을 거쳐서 배송이 마무리 된 듯 하네요.

그래도, 박스 안은 산뜻한 검은 박스에 포장된 제품이 있었고 상태도 양호했습니다. 내부 충격을 막아주는 완충제도 신경을 많이 써서 포장은 한 느낌이네요. 

책 페이지를 넘기는 건 손으로 하고, 스캔 시작 신호는 페달을 밟아서 할 수 있도록 페달이 같이 들어 있네요.

 

개봉한 상태에서 스캐너는 접혀 있지만 90도로 회전시켜 펼치면, 상단에는 두개의 LED 조명과, 카메라가 하단으로 향하게 들어 있습니다.

노란 플라스틱 핸들은 책 페이지를 손으로 잡아 더 평평하게 스캔할 수 있도록 도와주는 기구 입니다. 책이 많이 두꺼울때, 처음 시작해서 페이지 양쪽으로 자연스럽게 펼쳐질 때까지 사용하면 되겠군요. 손잡이에 검은 표식들은 스캔한 다음에도 각 페이지에 흔적이 남지 않게 하는 기능이 들어 있습니다. 

 

설치

설치는 무척 간단합니다. 동봉된 CD-ROM에서 소프트웨어를 설치/실행하고, 같이 딸려 온 USB 케이블로 스캐너와 컴퓨터를 연결하면 끝입니다.

 

 

소프트웨어는 윈도우와 맥용이 함께 포함되어 있는데, CD-ROM에 있는 소프트웨어를 설치해도 되지만, 혹시 업데이트된 버전이 있을 것 같아, 회사 홈페이지에서 직접 다운로드해서 설치했구요. 설치하고 실행하면 제품 일련번호를 물어보는데, 스캐너 밑면에 있는 시리얼 번호를 입력하면 됩니다.

 

책을 스캔해야죠

우선, 프로그램을 실행하면 (맥에서 사용하는 방법을 설명하지만, 윈도우용도 사용법은 동일)  다음과 같은 화면이 나옵니다. 

화면 오른쪽 하단에 있는 동그란 스캔 버튼을 누르면, 잠시 후 스캐너 화면이 나옵니다. 책을 원하는 위치에 놓고, 페달을 밟아 한 페이지마다 스캔해 나갑니다.



 

양면 스캔 모드로 셋팅하면, 스캔된 페이지가 자동으로 두 페이지로 분리되어 좌우 페이지로 나뉘어 저장됩니다. 

스캔된 이미지 리뷰

원하는 페이지를 모두 스캔하고 나면, 좌측 상단의 ‘돌아가기’ 버튼을 눌러 스캔된 페이지들의 이미지를 확인합니다. 제대로 스캔이 되지 않은 페이지가 있다면 ‘재스캔’ 버튼을 눌러 그 페이지만 대체할 수 있습니다. 필요없는 공백 페이지가 있다면 ‘삭제’ 버튼을 눌러 제거해 버립니다.

  

문자 인식 (OCR), PDF로 저장

이제 스캔한 페이지들을 하나의 문서로 만드는 작업을 할 수 있습니다. 마이크로소프트 워드어도비 PDF, TIFF 형식으로 변환할 수 있습니다. ‘Searchable PDF’로 저장하면, 문서를 텍스트로 검색할 수도 있고, 그냥 PDF보다는 파일크기도 작아서 제일 적당한 것 같습니다. 그림이나 도표가 많이 포함된 책 같은 경우에는, 마이크로소프트 워드 문서로 변환했을 때, 도표의 레이아웃이 그다지 삐뚤빼뚤 해지는 단점이 있습니다.

포함된 문자인식 소프트웨어의 인식 품질도 나름 괜찮았던 것 같습니다. (뭐 너무 기대치가 높지 않아서 그랬던 건지도 모르겠어요) 한글 문자 인식도 나름 기대 이상이었습니다. PDF로 저장된 문서에서 책의 내용을 검색하면, 생각보다 상당히 높은 정확도로 내용을 검색할 수 있었습니다. 




예를들어, 본문에서 ‘인터페이스'를 찾아보면 정확하게 그 단어가 있는 곳을 검색할 수 있음을 알 수 있습니다.

 

 

정리

전반적으로 제품의 완성도는 생각했던 것보다 좋았습니다. 책을 전단기로 분리해서 스캔하는 타 제품의 가격이 50만원을 상회하는 것을 감안하면, 가격과 성능 모두 나름 만족하는 편입니다. 

책을 파쇄하지 않고 스캔할 수 있으니까, 교과서, 학교교재, 기타 서류 등을, PDF 버전으로 변환하여, 마음대로 밑줄 그어가면서 공부하고, 원본 책은 깨끗하게 보관할 수도 있겠구요. 

몇가지 개선되었으면 하는 점도 있는데, 우선 간혹 페달을 밟고 나서 보면, 스캔된 페이지가 찌그러져 보이는 경우도 있었는데요. 주로 두꺼운 책을 스캔할 때, 스캐너에 내장된 페이지 표면 곡선 보정기능이 과도하게 작용한 결과가 아닌가 싶네요. 이런 경우, 우선 페이지를 다 스캔하고, 문서인식 전에 전체 페이지를 리뷰하면서, 해당 페이지만 다시 스캔하도록 하는 ‘재스캔’ 버튼 이 있으므로 뭐 크게 불편한 건 아니었어요. 향후, 소프트웨어 업데이트가 되면 나아질 거 같기도 하구요. 

도표가 많은 책을 스캔해서 마이크로소프트 워드 파일로 변환할 때, 레이아웃이 흐트러지는 것도 보이는데, 이건 뭐 개선의 여지가 별로 없을 것 같아요. 다른 OCR 소프트웨어에서도 비슷한 결과일 것 같아서요. 그냥 ‘Searchable PDF’ 가 더 나은 방법일 것 같습니다.

이사할 때마다 책들을 버리기도 많이 버렸는데요. 아직까지 버리지 못한 책들을 스캔해서 PDF 디지탈 책꽂이를 만들고, 과감히 종이 책과는 결별을 하는 선택을 할 시간이 되었구나 싶습니다. 뿐만 아니라, 태블릿 하나에 모든 책을 소장할 수 있으니, 필요할때 어디서든지 검색해서 책 내용을 참조할 수도 있어서 더 편리할 것 같습니다 (현재 아이패드에 ‘노터빌리티Notability 라는 유료앱을 사용하고 있습니다. 모든 필기 노트, 회의록, 그리고 이렇게 변환된 책들이 들어 있어 아이패드 하나로 모든 걸 ‘퉁’ 치고 있습니다. 윈두우 사용자들에게는 ‘원노트’가 무료인데다가 맥과 윈도우 동시에 지원하니 훨씬 더 유용하겠군요)

이제, 책꽂이가 있던 공간에는 화분을 놓거나, 그림이나 하나 걸어 놔야할 것 같습니다. <끝>

 

Comments


Comments are closed