网站公告列表

  没有公告

加入收藏
设为首页
联系站长
繁體中文
您现在的位置: 无忧电脑 >> 文章中心 >> 网页设计 >> 文章正文
  PDF文件的OCR识别方法           ★★★ 【字体:
PDF文件的OCR识别方法
作者:佚名    文章来源:互联网    点击数:    更新时间:2008-6-24    

                                                                                        
 

图片型PDF文件的OCR识别方法
本方法适用于扫描所得的图片型PDF文件的文字识别。

1.工具:microsoft office document imaging(见Office 2003 工具)、Windows程序附件中的“画图”板。

2.图片文件格式:.tif(即Tag图像文件格式,tiff)

3.步骤:

    A.在PDF文件中使用快照工具,选中需要识别的区域。提示“选定的区域已复制到了剪贴板”,点击“确定”。

    B. 打开“画图”板,“开始--程序--附件--画图”,然后点“编辑--粘贴--文件--另存为”,在保存类型中选择Tiff,然后“保存”。

   C.用microsoft office document imaging打开保存的文件,“开始--程序--Microsoft office--microsoft office工具--microsoft office document imaging”,接着点“工具--将文本发送到Word”,去掉“在输出时保持图片版式不变”前面选择框中的“√”,然后确定。

   D.在弹出的Word中即可进行编辑,识别完成。

4.注意事项:

   A.PDF原稿越清晰识别效果越好,建议放大到200%使用快照工具。

   B.其他格式图片应先转换为tif格式,用“画图”板打开然后另存就可以。

   C.使用快照工具时选区边界尽量放宽,避免靠边的字无法正确识别。

   D.支持跨栏选择的文字,识别后段落正常。

   E.使用快照工具时,避免一次选择太大范围,造成死机。

   F.如果识别后全为乱码,注意microsoft office document imaging的OCR选项是否为相应语言,“工具--选项--OCR--OCR语言(中英文选择)--确定”。

 
                                                                      
 

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    最新热点 最新推荐 相关文章
    没有相关文章
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)

                         无忧电脑 QQ群:19938280   闽ICP备08000694号       
                      本站有些内容参考互联网,如有侵犯到你的地方,请来信通知,我们将会在三日内处理