近日,维护的网站要修改一批页面,也相应的给了一批的PDF,大概有十余个页面左右吧!
费话不说开始做吧,打开PDF,文字不能复制,一个电话给客户,然后就收到对方的一个光盘,打开,直接晕了,这叫什么跟什么啊,整个什么 格式的文件给我,还是不行。还有两天时间就要完成,不等了,我先google 一把,Yeah,发现个好东东,可以识别pdf里面文字的好玩意,贴出来分享一个。
想知道的往下看吧!
这个神奇的东西就是CAJViewer,下载地址:http://www.skycn.com/soft/41564.html
老规矩,说一下怎么用的吧,安装好以后,用CAJViewer打开pdf,然后工具——选择图像,右击——文字识别,OK,文字出来了。贴几张图片看看吧:


不过这个小工具也有一个bug,就是识别的东西不一定很准(比如:它会把co2识别成coz),不过也不是很差劲的!
Tags: 小工具
