扫描仪扫描文档（TIFF 和 PDF）的最佳设置[关闭]

2023-12-15

扫描仪的最佳设置是什么，以便扫描文档（白色和黑色文本）并将其用于 OCR 转换（以获得最佳结果）以及 PDF 和 TIFF 格式的标准设置和规范是什么？

对于 OCR，最佳扫描设置是：

常规文本分辨率为 300 dpi，特别小的字体（细则打印）分辨率为 400 dpi
文本为黑白，小字体为灰度，图片为彩色
TIFF 格式。 Group4 用于黑白（文件大小非常小）。如果需要颜色，请使用未压缩（文件大小非常大）。

某些 OCR 技术可能有特殊的偏好，这可能会略有帮助，但通常很小。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OCR

tiff

pdfconversion

扫描仪扫描文档（TIFF 和 PDF）的最佳设置[关闭] 的相关文章

Microsoft Azure 认知服务手写检测边界框参数

我目前正在使用Microsoft Azure 认知服务手写检测 API https learn microsoft com en in azure cognitive services computer vision quickstarts
如何使用 PHP 在网站上实现 OCR？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
Pytesseract 对于实时 OCR 来说非常慢，有什么方法可以优化我的代码吗？

我正在尝试使用 python 创建实时 OCRmss and pytesseract 到目前为止我已经能够捕获整个屏幕其 FPS 稳定为 30 如果我想捕获大约 500x500 的较小区域我已经能够获得 100 FPS 然而一旦我包
tess4j 与 Spring mvc

我已经尝试将 tess4j 作为独立的 java 程序并且它可以正常工作并给出文本输出现在我正在尝试创建一个 spring mvc web 项目在 pom 中添加 tess4j 的依赖项并且我已在我的项目中添加了 tess4j 源
图像中的文本检测

I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
Google Vision API 文本识别器无法正常工作

我使用 Google Vision API 来读取报纸等任何物体上的文本或墙上的文本我已经尝试过来自 Google 开发者网站的相同示例但我的文本识别器总是返回 falseIsOperational功能我在 Blackberry ke
tesseract (v3.03) 输出为 PDF [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案为什么会返回这个错误呢 root amd 3700 2gb ocr test tesseract l dan pdf png out pd
MATLAB 写入多页 tiff 指数慢

我正在尝试编写一个多页 tiff 文件该文件是 128 像素 x 128 像素 x 122000 帧的 16 位无符号整数 ImageJ 或简短的 Python 脚本可以在快速机器上在一分钟内完成此操作在同一台机器上无论使用我尝试过的
从图像中识别数字

我正在尝试编写一个应用程序来查找图像内的数字并将它们相加如何识别图像中的书写数字图像中有很多框我需要获取左侧的数字并将它们相加得出总数我怎样才能实现这个目标编辑我对图像进行了 java tesseract ocr 但没有得到任何
将 pdf 文件转换为 tiff 文件的最佳方法 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
将 tiff 像素长宽比更改为正方形

我正在尝试对多页 tiff 文件执行条形码识别但是 tiff 文件是从传真服务器我无法控制发送给我的该服务器以非方形像素长宽比保存 tiff 这导致图像由于纵横比而被严重挤压我需要将 tiff 转换为方形像素长宽比但不知道如何在
TensorFlow：训练时参数不更新

我正在使用 TensorFlow 实现分类模型我面临的问题是当我运行训练步骤时我的权重和误差没有更新结果我的网络不断返回相同的结果我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
收据褪色部分可以恢复吗？

我有一些包含一些扫描收据的文件我需要使用 OCR 从中提取文本由于收据上打印的文字在一段时间后会褪色导致收据上的某些文字不清晰影响OCR结果褪色单词的一些示例有什么方法可以恢复褪色的部分以便提高 OCR 结果吗我在OpenC
提高 pytesseract 从图像中正确识别文本的能力

我正在尝试使用读取验证码pytesseract模块大多数时候它都能提供准确的文本但并非总是如此这是读取图像操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
Tesseract OCR - 手写字体

我正在尝试使用Tesseract OCR http code google com p tesseract ocr 检测其中包含纯文本的图像文本但这些文本具有名为的手写字体Journal Example 结果不是最好的千里马尺寸宽
Python PIL 难以处理未压缩的 16 位 TIFF 图像

我的系统是Mac OS X v10 8 2 我有几个 2560x500 未压缩的 16 位 TIFF 图像灰度无符号 16 位整数我首先尝试使用 PIL 加载它们通过 Homebrew 安装版本 1 7 8 from PIL im
使用 Tesseract 进行手写识别

我只是想知道如果将大写字母全部放在表格中自己的小框中那么超正方体的手写识别准确度有多高我知道你可以训练它来识别你自己的笔迹但我的问题是我需要在多个笔迹中使用它有人能指出我正确的方向吗多谢简而言之您必须训练 Tesseract
Tiff 的 getImageWritersByFormatName 中存在问题。获取图像作家

我正在尝试将 PDF 转换为 tiff 图像我使用以下代码按格式获取图像编写器 Iterator
System.Drawing.Image.Save 抛出ExternalException：GDI 中发生一般错误

我有一个函数它需要一个位图复制它的一部分并将其保存为 8bpp tiff 结果图像的文件名是唯一的并且文件不存在程序有权写入目标文件夹 void CropImage Bitmap map Bitmap croped new Bitma

随机推荐

OpenMPI：简单的 2 节点设置

我在仅使用两个节点运行 OpenMPI 程序时遇到问题其中一个节点与正在执行的机器是同一台机器 mpiexec命令和另一个节点是一台单独的机器我将调用正在运行 mpiexec 的机器 master 以及另一个节点slave On bot
使用 data.table [R] 查找组中众数出现的次数

我一直在使用这里的优秀答案查找具有数据表的组的众数但是我还想查找每组变量 y 的 x 模态值出现的次数我怎样才能做到这一点编辑有一种比上面链接的答案更快的方法来查找模式我找不到从中得到的答案如果有请编辑并链接但它使用此功能
React-router重定向到index.html并从.htaccess中的url中删除www

我正在 ReactJS 中构建一个小型应用程序因此所有页面都需要提供index html 并且 JS 处理 url 这很好用但我还想让 htaccess 从网址中删除 www 如果存在我正在阅读 mod rewrite 文档但我不太
如何在 Windows 7 中将 URL 参数从 Java 传递到本地 HTML 文件？

我迫切需要您的专业知识来解决 Windows 7 问题设想我有一个基于框架的帮助包它是为上下文相关的帮助调用而设置的 Java 应用程序能够通过将表示所需 HTML 的名为 anchor 的标记传递到名为 pophelp 的 HTML
从输入文件读取实际值时出现浮点异常

我尝试从输入文件中读取浮点值Fortran 为此我使用以下代码 INTEGER nf REAL re OPEN newunit nf file toto txt READ unit nf fmt re 与 toto txt 包含我的真实值
Octave / MATLAB 中的 deal() 函数有什么意义？

一些参考代码使用了该函数deal 简单地说就像 a b c deal 1 2 3 如文档中所述对于八度 and 对于MATLAB 该函数只是将输入复制到输出 Why use deal 在这种情况下甚至在一般情况下我正在尝试学习更正
Django：从模板内访问会话变量？

如果我在 Django 中设置一个会话变量例如 request session name name 有没有办法可以从模板中访问它或者我是否必须从视图中检索它然后将其传递给模板之所以这么问是因为我想在模板中访问大约 10 个小会话变
在 Angular 5 中迭代复杂的 JSON 结构

如何在 Angular 5 中迭代 JSON 已经搜索了很多得到了一个管道概念但它不适用于复杂的 json 如下所示我需要使用以下类型的数据创建可扩展表我一直在阅读这个 json data Items Key 9009 type f
如何使用 javascript 阻止因空字段而提交表单？

如何在 javascript 中编写脚本来输出错误并防止表单中存在空字段时提交表单假设表单名称为 form 输入名称为 name 我在 PHP 中遇到了一些麻烦并不总是正确处理空字段所以我想将其作为备份如有任何帮助我们将不胜感激
Sparklyr 更改所有列名称 Spark DataFrame

我打算更改所有列名称目前的重命名或选择操作太费力了不知道有没有人有更好的解决方案示例如下 df lt data frame oldname1 LETTERS oldname2 1 oldname200 APPLE df tbl lt
F5浏览器刷新和回发有区别吗？（asp.NET）

我正在 asp NET 中现有数据网格的不同行中动态创建拖网格我生成的数据网格有一列是 TemplateColumn 复选框列在我的父数据网格中我有一个带有复选框的模板列当我选中或取消选中复选框的值时会调用 check chang
Flutter：如何使用变量将参数传递给 Widget？

这是一些伪代码显示了我想要实现的目标 Text txt text subtitle false final params subtitle textAlign TextAlign center style TextStyle color
如何检查 css box-shadow 是否受支持（jQuery）？

我正在创建一个完整的 css 布局但是某些浏览器例如IE6 不支持box shadow 和 webkit box shadow或 moz box shadow 我想检查一下是否不支持然后添加其他样式这在 jQuery 中怎么可能呢
在 Heroku 上结合使用 Resque、Puma 和 Scheduler

在查看了大量指南后我想确认我的设置现在我的procfile好像 web bundle exec puma C config puma rb config ru resque TERM CHILD 1 RESQUE TERM TIMEOU
如何恢复用 jQuery 删除的元素？

如果使用删除元素 notification remove 我们如何将其创建回来你无法得到那个特定的例子后退使用 remove 将其从 DOM 中删除不过您可以创建它的克隆在 DOM 中移动它隐藏它等等根据您的项目需求您可能还
读取行时，awk $line

我有一个包含数字列表的文件我有第二个文件每个文件包含各种条目和多个字段我想要做的是获取第 12 个字段等于第一个数字的所有行并将它们放入一个新文件中然后放入第二个数字依此类推我写了一句很有道理的俏皮话但我不明白为什么它行不通
Spring 4 静态内容（如 css/js）带来错误 405 不支持请求方法“GET”

我已经检查过这个问题但是经过 4 个小时的尝试没有任何结果对我有用尝试访问我的 css 文件时收到 405 错误这是我的 Config java package com myapp config import org springf
如何确保我的 makefile 检测到头文件和 cpp 文件中的更改？

目前每当我这样做时make我的 makefile 告诉我 make some obj file o 是最新的无论我是否编辑了生成该目标文件所涉及的任何文件我如何让它检测变化这是一个重现该问题的简单 makefile SHELL bi
C# 中的二维数组切片

我正在寻找在 C 中切片二维数组我有 double 2 2 价格想要检索该数组的第二行我尝试过价格 1 但我有一种感觉可能是别的东西提前致谢没有直接的切片操作但您可以定义如下扩展方法 public static IEnum
扫描仪扫描文档（TIFF 和 PDF）的最佳设置[关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案扫描仪的最佳设置是什么以便扫描文档白色和黑色文本并将其用于 OCR 转换以获得最佳结果以及 PDF 和 TIFF 格式的标准设置和规范是什么对于 OCR 最佳扫描设置是

扫描仪扫描文档（TIFF 和 PDF）的最佳设置[关闭]

扫描仪扫描文档（TIFF 和 PDF）的最佳设置[关闭] 的相关文章

随机推荐

热门标签