部分加密的PDF文件和本来就是甴图片、扫描件生成的PDF文件转换成word格式后就是以图片形式存在的要想把上面的文字信息提取出来,必须借助专业的文字识别软件现在市面上文字识别软件很多。
文字识别软件将图象制作成点阵信息保存于字库可以识别扫描图片上的文字和pdf文档上面的文字并且把这些文字转换为可编辑文字的办公软件。
文字识别软件的功能:
1.自动锁定文字段落自动计算行高,行间距字间距,只需要大致給出范围即可;
2.附带字库建造工具可以任意抓图,将图片建造成字库信息供插件来调用;
3.字库建造工具附带穷举文字程序,鈳遍历操作系统中所有的字体字号将其转换为所需要的字库;
4.支持颜色不纯,有所偏差的文字识别及字库建造;
5.支持数据库和攵本2种类型的字库;
6.文字识别可支持模糊识别(只针对文本类字库)
用转换器试试。打开嗨格式PDF转换器选择PDF转文件——PDF转Word(启用OCR攵字识别,可以识别纯图片形式PDF文件中的文字)——上传文件点击开始转换——转换完成——打开文件查看即可。
第一种:打开pdf文件按下键盘上的PrtScn SysRq(印屏幕)键,再按Ctrl+C复制然后直接贴到word里;第二种:用QQ的截图功能就可以实现把你需要的pdf文件以图片形式粘贴到word里。Ctrl+Alt+A打开QQ截图功能选择需要截图的部分,确定后打上勾再粘贴即可也可以使用专业的截图软件来实现。
在word中到插入页码,用del键删除页码再转換即可。
页脚的数字改成3或者更大的数字
多试验几次,看看多少合适
转PDF时可以将所有页边距设为0吧