pdf用的是内嵌文字 导出为乱码 文件有水印 用OCR识别出来有水印部分是图片 所以不能用 谁有办法啊?

求专业牛X人士帮忙 导出文本啊- -
2024-12-09 14:45:36
推荐回答(3个)
回答1:

对于有水印的,建议你还是用ABBYY FineReader,在有水印或者是文字不清楚的时候识别率比其他的高一些,但是速度有点慢……
不过你要知道,打了水印的其实就是为了防止拷贝盗版而采取的方法,如果还是识别不出来的话,不管你用任何OCR,两点建议。
1.如果水印区域小的话,在识别区域选择的时候把水印的区域绕开然后自己打字打上去。
2.如果全是水印。阿弥陀佛。。转成JPEG然后用PS把水印部分修改掉然后再识别。(除非你打字很慢,不然有那时间你不如自己打字了,我深有感触= =)
3.(个人建议)放弃吧- -...放弃无谓的挣扎吧。

回答2:

PDF转ePub专家【免费版】龙谷的 pdf内码校正或OCR识别.
水印可以用Foxit PDF Editor直接编辑和删除,网上有PJ的软件。删除水印后再用OCR识别。

回答3:

用PDF软件编辑器删除水印。再将文字转曲,就不会变乱码了!如果不知道怎么将PDF内嵌文字转曲,可以Hi我,我全天在线!