资源预览内容
第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
亲,该文档总共8页全部预览完了,如果喜欢就下载吧!
资源描述
总结了五种将图片文本转换成可编辑 word 的方法希望对大家有用:在介绍之前先介绍几款常用的转换软件:汉王 OCR、Microsoft Office Document Imaging、尚书七号、慧视小灵鼠、新版紫光 9.0、 方法一:工具/原料 使用工具:扫描仪或者数码相机 电脑 使用软件:Microsoft Office Word Adobe Acrobat 7.0 Professional 扫描软件 CAJViewer 7.1 关键词:如何将纸质文件或图片转换成 word 文字 步骤/方法1. 首先,先确认你的计算机安装以下设备:扫描仪。如果没有扫描仪,也可以使用数码相机。扫描仪可以将纸质文件扫描到计算机中。 2. 其次,要确认你的计算机安装如下软件:扫描仪配备的扫描软件,Microsoft Office Word,Adobe Acrobat 7.0 Professional(版本 7.0或者几点零的都没关系,但是确认要安装这个,只安装 Adobe Acrobat 7.0 Reader 版本的是不行的),CAJViewer 7.1 软件,如果这些软件没有,可以到网络上下载。用百度或者迅雷狗狗搜都行(本人认为狗狗搜索的软件相对安全好用一些);下载完以后安装即可。 3. 安装 Adobe Acrobat 7.0 Professional 软件以后,在打印的时候,会出现一个 Adobe PDF 的打印机,可以将文件打印成*.pdf 的文件。这个也比较关键,因为本文所说的软件,支持打开*.pdf 文件而不支持*.JPG 或者*.doc 文件.4. 下面开始转换的具体步骤。首先,把纸质文件转换成*.JPG 的文件,不管用用扫描仪扫描,还是数码相机拍照片。文件要是黑白格式的,且文字最好横平竖直的,不要七扭八歪的哦。打开 Microsoft Office Word,新建一个 word 文件,然后选择 “插入-图片”,在文档中插入你扫描号的图片,做成一页。 5. 插入图片后调整好版面,保存不保存皆可。然后选择 “文件-打印”,在打印机选项中,选择“Adobe PDF 的打印机”,确定后,选择输出文件的名字就行了。另外,对于*.JPG 文件,直接右键点击文件,也有一个“Adobe PDF”的选项,直接点击转换即可。转换完成以后,就可以进行下一步识别了。 6. 打开 CAJViewer 7.1 软件,打开你刚才存储好的*.PFD 文件, 在菜单栏的左上角,有一个“文字识别”的快捷工具,点击“文字识别”,鼠标变成十字空心,然后用鼠标选中想要转换的文字就行了。如上图,文字识别的工具。选中以后,会弹出一个对话框,就是将文字转换好了。这时,你可以选择“复制到剪贴板”,或者“发送到 WPS/Word”选项,然后就可以到 word 文件中了。到 word 中,再进行一下字体、行间距的排版,就 OK 了,简单吧!经过本人多次使用,成功率 100%。注意事项 不过,此方法适用于文字符号,表格识别以后到 word 中,都是制表符,不能自动生成表格,就不好用了,哈哈。 首先,先确认你的计算机安装以下设备:扫描仪。如果没有扫描仪,也可以使用数码相机。扫描仪可以将纸质文件扫描到计算机中。其次,要确认你的计算机安装如下软件:扫描仪配备的扫描软件,Microsoft Office Word,Adobe Acrobat 7.0 Professional(版本 7.0或者几点零的都没关系,但是确认要安装这个,只安装 Adobe Acrobat 7.0 Reader 版本的是不行的),CAJViewer 7.1 软件,如果这些软件没有,可以到网络上下载。用百度或者迅雷狗狗搜都行(本人认为狗狗搜索的软件相对安全好用一些);下载完以后安装即可。 方法二:用 word 2003 软件进行转换具体如下: 一、将 JPG、JPEG、BMP 等文字图片 转换成 Word 格式(转换成 txt 格式) 如果你安装了 Microsoft Office2003 了吧! (一般的 office 2003 都会自备这款主件这里就不另上传该office2003 软件了) 1、无论你的文字图片格式如何, 请把 该文字图片的 格式 另存为 TIFF 格式图片, 2、在 开始菜单 所有程序 Microsoft Office Microsoft Office 工具 Microsoft Office Document Imaging 打开, 再, 文件 打开 “找到你的转换格式后的图片文” 工具 进行 OCR 识别, 发送到 WORD 中编辑保存即可。 3、成 word 格式后 ,就可以根据需要,另存为 txt 格式 了! 注:如果没有找到“Microsoft Office Document Imaging”项,使用Office 2003 安装光盘中的“添加/删除组件”更新安装该组件,选中 Office 工具 Microsoft DRAW 转换器。 (怎么说呢,这个方法我试过,用这种方法转换的文字 里面还会存在 识别错误,所以,转换完后,还是要检查输出文字的正确性)方法三:具体操作如下:具体的我给你说: 在扫描仪发展史上,文字识别软件(OCR)的出现,实现了将印刷文字扫描得到的图片转化为文本文字的功能,提供了一种全新的文字输入手段,大大提高了用户工作的效率,同时也为扫描仪的应用带来了进步。从此,扫描仪不再仅仅是图形、图像的输入工具,它真正的成为了电子化办公的有机组成部分。随之而来的是,扫描仪在金融、证券、政府等领域普遍应用,为人们摆脱纸制文档束缚,真正实现无纸化办公铺平了道路。 目前在中国市场上销售的每一款 Microtek 扫描仪产品,都附赠了“尚书六号”文字识别软件。在颇具美名的“尚书五号”文字识别软件基础上,“尚书六号”又有了许多新的突破。它一改以前文字识别软件只能对“黑白二色”图像进行识别的限制,可以对彩色、灰度图像文件直接进行识别;尚书六号支持更多的扫描文件格式,例如 TIFF、BMP 和 JPG 格式;与此同时,尚书六号完善了表格识别功能,各式各样的表格几乎都可以原封不动的由图片格式转变为可以自由编辑的文字格式。最值得一提的是,“尚书六号”还加入了人性化设计,在软件安装完毕后,程序组图标里面会自动出现“尚书六号说明”,借助这本用户手册,即使是初学者也可以迅速掌握软件的使用。 下面结合 Microtek 扫描仪的驱动软件 ScanWizard 5,详细介绍如何配合尚书六号 OCR 软件做好文字识别工作: Step1:扫描图像文件 建议首先点击桌面上 ScanWizard 5 软件的图标,进入 Microtek 扫描仪驱动软件的界面,直接进行扫描工作,而不需要启动其他的扫描程序或图像编辑程序,这样可以大大加快扫描进程。同时,注意将 ScanWizard 5 软件切换到高级工作模式(如图 1 所示),以便于用户检查扫描仪工作时的分辨率。在文字识别时,推荐使用的扫描分辨率设定在 300ppi,色彩模式可以选择“RGB 彩色”或者“灰阶”,选择“扫描到”的文件格式是 TIF 或者 JPG 两者都可以,然后将扫描得到的文件保存在用户确定的目录下面。 Step2:打开尚书六号读取扫描好的图像文件 Step3:被识别图片的预处理 被识别图片的预处理工作主要包括“倾斜校正”和“设定正确识别区域”两个步骤。在进行“倾斜校正”时,可按下工具栏的最下面的一个“图像倾斜校正”工具按钮。系统会自动弹出一个对话框,提示需要校正的角度,此时按下“是”按钮,系统就给予图片做水平的倾斜校正。在此需要特别注意,“自动倾斜校正功能”只能对原稿做2.8 度的倾角的校正,如果原稿的倾斜角度大于 2.8 度,系统会建议用户重新扫描稿件,以提高识别率。 如何“正确设定识别区域”,也是一个值得用户注意的地方:如“海尔”一文,实际是分成两个栏目进行阅读的,所以在设定识别区域的时候,注意需要将这个两个栏目分别圈定,也就是设定两个识别区域(如图 2 所示)。同时,对于一些文字稿件,如果在中间插有图片的时候,建议采用绕开的方式,对所环绕的文字分别进行识别区域的设定。此外,对于表格类的图片,为了将标题栏也能识别进去,建议将表格部分整个框选,同时标题作为一个单独的框选区域。 Step4:开始进行识别 在开始“识别”的时候,应注意识别软件的设定值是否正确,尤其注意识别字集的选择问题:如果要识别简体中文,请选择“简体字集”;如果要识别繁体中文,请选择“繁体字集”;在选择“纯英文字集”时,可以大幅提升英文字母的识别率。同时,“简体字集”和“繁体字集”也具有较强的识别英文的能力。 Step5:识别校对完成后,进行保存 在“尚书六号”文字识别软件中,存盘格式(也就是文件保存的类型)有四种,分别是:Word、Text、CSV、HTML。直接用 Word 格式保存时,可以用微软的 Word 软件打开,它可以相对比较完整的保存排版格式;但建议用户一般可选择 Text(纯文本)格式保存,因为这种格式可以用几乎所有文档编辑器打开;如果用户进行表格识别,识别结果可以选择保存为 CSV 格式,这样用 EXCEL 就能够直接打开;而 HTML 格式是针对网页设计使用的,用 IE 等网络浏览器或网页编辑器可以打开方法四:在使用 OCR 软件识别前,可用用图片处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。 图片文字提取(OCR)图解教程http:/hi.baidu.com/yiyoo/blog/item/91fd61f0d11d0eafa50f5269.html 或 Microsoft Office Document Imaging(office2003 中内含) OFFICE 中有一个组件 document image,功能一样的强大。不仅扫描的文字图片,连数码相机拍的墙上的宣传告示上的字都能提取出来。 第一步 打开带有文字的图片或电子书籍等,找到你希望提取的页面,按下键盘上的ALT+打印屏幕键(PrintScreen)进行屏幕取图,或者用其他抓图软件。保存成 tif 格式。 第二步 我们需要安装“Microsoft Office Document Imaging”的组件,点“开始程序Microsoft OfficeMicrosoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging” 然后打开图片,找到 OCR 识别工具(像眼睛),点击此工具,开始安装,这个时候就需要你把光盘(或虚拟光驱)的 office 安装文件。 第三步 用 Microsoft Office Document Imaging 打开图片,用 OCR 工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word 或者记事本。 或用摄像头作扫描仪输入文字: 我们平时使用的摄像头大家好象只用作聊天了吧 其实它的作用也是很广泛的.好多的朋友在写论文,资料的时候总是要用一些书上的资料.总是到打印社进行扫描打印,其实我们的摄像头就可以解决这个问题. 一,安装 Microsoft office 2003 (仅以 office 2003 为例。其它版本office 均可) 二,打开“开始Microsoft officeMicrosoft office 工具Microsoft office Document scannging”,如果该项未安装,系统则会自动安装。此时会弹出扫描新文件对话框,单击扫描仪按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。 三,再单击扫描按钮即可进行扫描,在扫描过程中会弹出一个
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号