经常都有扫描一些文档,可是有时候只是个图片,编辑起来很不方便,那么如何将扫描文件转化为word格式呢?扫描的文件都是图片格式的,要转化为文档格式,那就只有把图片里的文字一个个读出来了,现在就是有这种技术可以实现:
扫描文件转化为可编辑的文档一般是用OCR软件来实现。既然你的扫描仪是爱普生1670的,应该自带有OCR识别软件(需安装)。如果你没有,而且你的电脑又是安装OFFICE 2003的,也可用OFFICE 2003中的Microsoft Office Document Imaging组件把pdf文件转换成可编辑的word文件。
如何将扫描文件转化为word格式,简单的方法,可以下载一个ocr文字识别软件,可以将扫描的文档转换为可编辑的txt文档。
我使用的是清华TH-OCR XP专业版,只要文档清楚,识别后基本上不需改动,有些复印的文件笔画不清楚,识别要差些。
顺便说一下,我使用的是紫光扫描仪,软件是配置的。
识别率和扫描设置也有关,一般设为黑白、300dpi的分辨率。
关于OCR技术
所谓OCR (Optical Character Recognition光学字符识别)技术,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。 由于OCR是一门与识别率拔河的技术,因此如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。而根据文字资料存在的媒体介质不同,及取得这些资料的方式不同,就衍生出各式各样、各种不同的应用。
光学符号识别技术是一种汉字文稿的自动输入方式,它通过光学扫描仪和计算机的配合,经OCR软件将图像数据进行运算分类后,将图像数据转化为计算机内码,可以极大减轻数据录入工作的强度,提高数据录入的速度。 文献资料的数字化录入,一般分为: 1、纯图像方式。 2、目录文本、正文图像方式。 3、全文本方式。 4、全文索引方式。文本方式和图像方式的混合体。 我国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年汉字识别的研究进入一个实质性的阶段,不少研究单位相继推出了中文OCR产品. 我国目前使用的文本型OCR软件主要有清华文通TH-OCR、北信BI-OCR、中自ICR、沈阳自动化所SY-OCR、北京曙光公司NI-OCR(已被中自汉王并购)等,匹配的扫描仪则使用市面上的平板扫描仪。
相关阅读:
Word 2003 的启动和退出
信封和标签的制作(word)
win7安装方法 windows8什么时候出 打开网页速度慢怎么办 电脑录音机 如何安装word2003
,如何将扫描文件转化为word格式tag: 如何 , 电脑常识,电脑常识大全,生活常识 - 电脑常识