首页
学习
活动
专区
工具
TVP
发布

扫描仪扫描出来的文件一般是什么文件?

通常扫描图像以图形文件的方式储存,有数种可使用图像的文件格式。TIFF(标志图像文件格式)是目前最常用的图形文件格式之一。扫描、传真、文字处理、光学字符识别和其它一些应用等都支持这种格式。扫描仪使用注意事项:

1、分辨率

分辨率太高,会加长扫描所用时间,并且会因为一些非文字的细节被捕获反而造成识别不正确,分辨率太低,OCR软件因为信息量不足,也会造成识别率不高。一般大多普通五号印刷体选择黑白模式下300dpi进行扫描比较合适。

2、亮度

选择适当的亮度可使扫描原稿显得黑白分明,扫描亮度的设定以扫描所得图像中汉字的笔划较细但不断开为佳,如果扫描所得的汉字轮廓残缺较多,应该增加亮度,如果有一些黑点或黑斑,则应减小亮度。

3、原稿

虽然一些OCR软件允许文稿有一定的倾斜,还可以通过识别软件进行倾斜校正,但这种校正效果并不是很令人满意的。

4、版面分析

在版面分析中选择与原稿相符的版面类型,对一些复杂的版面,划分合理的块来进行识别,这样也能有效地提高识别正确率。

5、自定义库

对个别扫描效果清晰,但OCR却识别错误的字,可以加到用户自定义库中,这样下次就不会犯同样的错误,慢慢地识别正确率也会得到提高。

TIFF格式特点:

1、应用广泛

TIFF可以描述多种类型的图像;TIFF拥有一系列的压缩方案可供选择;TIFF不依赖于具体的硬件;TIFF是一种可移植的文件格式。

2、可扩展性

在TIFF 6.0中定义了许多扩展,它们允许TIFF提供以下通用功能:几种主要的压缩方法;多种色彩表示方法;图像质量增强;特殊图像效果;文档的存储和检索帮助。

3、格式复杂

TIFF文件的复杂性给它的应用带来了一些问题。一方面,要写一种能够识别所有不同标记的软件非常困难。另一方面,一个TIFF文件可以包含多个图像,每个图像都有自己的IFD和一系列标记,并且采用了多种压缩算法。这样也增加了程序设计的复杂度。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191101A04JBS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券