PDF文字拷贝不出来,怎么办!

近日,维护的网站要修改一批页面,也相应的给了一批的PDF,大概有十余个页面左右吧!

费话不说开始做吧,打开PDF,文字不能复制,一个电话给客户,然后就收到对方的一个光盘,打开,直接晕了,这叫什么跟什么啊,整个什么  格式的文件给我,还是不行。还有两天时间就要完成,不等了,我先google 一把,Yeah,发现个好东东,可以识别pdf里面文字的好玩意,贴出来分享一个。

想知道的往下看吧!

这个神奇的东西就是CAJViewer,下载地址:http://www.skycn.com/soft/41564.html

老规矩,说一下怎么用的吧,安装好以后,用CAJViewer打开pdf,然后工具——选择图像,右击——文字识别,OK,文字出来了。贴几张图片看看吧:

选择图像

文字识别

文字出来啦

不过这个小工具也有一个bug,就是识别的东西不一定很准(比如:它会把co2识别成coz),不过也不是很差劲的!

Tags:

Leave a comment