记录我们自己的前端生活!
PDF文字拷贝不出来,怎么办!
近日,维护的网站要修改一批页面,也相应的给了一批的PDF,大概有十余个页面左右吧!
费话不说开始做吧,打开PDF,文字不能复制,一个电话给客户,然后就收到对方的一个光盘,打开,直接晕了,这叫什么跟什么啊,整个什么 格式的文件给我,还是不行。还有两天时间就要完成,不等了,我先google 一把,Yeah,发现个好东东,可以识别pdf里面文字的好玩意,贴出来分享一个。
想知道的往下看吧!
这个神奇的东西就是CAJViewer,下载地址:http://www.skycn.com/soft/41564.html
老规矩,说一下怎么用的吧,安装好以后,用CAJViewer打开pdf,然后工具——选择图像,右击——文字识别,OK,文字出来了。贴几张图片看看吧:


不过这个小工具也有一个bug,就是识别的东西不一定很准(比如:它会把co2识别成coz),不过也不是很差劲的!
Random Posts
Loading…
| 打印文章 | 这篇文章由cherry于一月 9, 2010 11:43 下午发表在懒得分类。你可以订阅RSS 2.0 也可以发表评论或引用到你的网站。 |
