扫描仪扫描文档(TIFF 和 PDF)的最佳设置[关闭]

2023-12-15

扫描仪的最佳设置是什么,以便扫描文档(白色和黑色文本)并将其用于 OCR 转换(以获得最佳结果)以及 PDF 和 TIFF 格式的标准设置和规范是什么?


对于 OCR,最佳扫描设置是:

  • 常规文本分辨率为 300 dpi,特别小的字体(细则打印)分辨率为 400 dpi
  • 文本为黑白,小字体为灰度,图片为彩色
  • TIFF 格式。 Group4 用于黑白(文件大小非常小)。如果需要颜色,请使用未压缩(文件大小非常大)。

某些 OCR 技术可能有特殊的偏好,这可能会略有帮助,但通常很小。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

扫描仪扫描文档(TIFF 和 PDF)的最佳设置[关闭] 的相关文章

  • Microsoft Azure 认知服务手写检测边界框参数

    我目前正在使用Microsoft Azure 认知服务手写检测 API https learn microsoft com en in azure cognitive services computer vision quickstarts
  • 如何使用 PHP 在网站上实现 OCR? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • Pytesseract 对于实时 OCR 来说非常慢,有什么方法可以优化我的代码吗?

    我正在尝试使用 python 创建实时 OCRmss and pytesseract 到目前为止 我已经能够捕获整个屏幕 其 FPS 稳定为 30 如果我想捕获大约 500x500 的较小区域 我已经能够获得 100 FPS 然而 一旦我包
  • tess4j 与 Spring mvc

    我已经尝试将 tess4j 作为独立的 java 程序 并且它可以正常工作并给出文本输出 现在我正在尝试创建一个 spring mvc web 项目 在 pom 中添加 tess4j 的依赖项 并且我已在我的项目中添加了 tess4j 源
  • 图像中的文本检测

    I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
  • Google Vision API 文本识别器无法正常工作

    我使用 Google Vision API 来读取报纸等任何物体上的文本或墙上的文本 我已经尝试过来自 Google 开发者网站的相同示例 但我的文本识别器总是返回 falseIsOperational功能 我在 Blackberry ke
  • tesseract (v3.03) 输出为 PDF [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 为什么会返回这个错误呢 root amd 3700 2gb ocr test tesseract l dan pdf png out pd
  • MATLAB 写入多页 tiff 指数慢

    我正在尝试编写一个多页 tiff 文件 该文件是 128 像素 x 128 像素 x 122000 帧的 16 位无符号整数 ImageJ 或简短的 Python 脚本可以在快速机器上在一分钟内完成此操作 在同一台机器上 无论使用我尝试过的
  • 从图像中识别数字

    我正在尝试编写一个应用程序来查找图像内的数字并将它们相加 如何识别图像中的书写数字 图像中有很多框 我需要获取左侧的数字并将它们相加得出总数 我怎样才能实现这个目标 编辑 我对图像进行了 java tesseract ocr 但没有得到任何
  • 将 pdf 文件转换为 tiff 文件的最佳方法 [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 将 tiff 像素长宽比更改为正方形

    我正在尝试对多页 tiff 文件执行条形码识别 但是 tiff 文件是从传真服务器 我无法控制 发送给我的 该服务器以非方形像素长宽比保存 tiff 这导致图像由于纵横比而被严重挤压 我需要将 tiff 转换为方形像素长宽比 但不知道如何在
  • TensorFlow:训练时参数不更新

    我正在使用 TensorFlow 实现分类模型 我面临的问题是 当我运行训练步骤时 我的权重和误差没有更新 结果 我的网络不断返回相同的结果 我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
  • 收据褪色部分可以恢复吗?

    我有一些包含一些扫描收据的文件 我需要使用 OCR 从中提取文本 由于收据上打印的文字在一段时间后会褪色 导致收据上的某些文字不清晰 影响OCR结果 褪色单词的一些示例 有什么方法可以恢复褪色的部分 以便提高 OCR 结果吗 我在OpenC
  • 提高 pytesseract 从图像中正确识别文本的能力

    我正在尝试使用读取验证码pytesseract模块 大多数时候它都能提供准确的文本 但并非总是如此 这是读取图像 操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
  • 如何去除给定图像中的噪声,使 ocr 输出完美?

    我已经对这个孟加拉文本图像进行了大津阈值处理 并使用 tesseract 进行 OCR 但输出非常糟糕 我应该应用什么预处理来消除噪音 我也想校正图像 因为它有轻微的倾斜 我的代码如下 import tesserocr from PIL i
  • Tesseract OCR - 手写字体

    我正在尝试使用Tesseract OCR http code google com p tesseract ocr 检测其中包含纯文本的图像文本 但这些文本具有名为的手写字体Journal Example 结果不是最好的 千里马 尺寸 宽
  • Python PIL 难以处理未压缩的 16 位 TIFF 图像

    我的系统是Mac OS X v10 8 2 我有几个 2560x500 未压缩的 16 位 TIFF 图像 灰度 无符号 16 位整数 我首先尝试使用 PIL 加载它们 通过 Homebrew 安装 版本 1 7 8 from PIL im
  • 使用 Tesseract 进行手写识别

    我只是想知道 如果将大写字母全部放在表格中自己的小框中 那么超正方体的手写识别准确度有多高 我知道你可以训练它来识别你自己的笔迹 但我的问题是我需要在多个笔迹中使用它 有人能指出我正确的方向吗 多谢 简而言之 您必须训练 Tesseract
  • Tiff 的 getImageWritersByFormatName 中存在问题。获取图像作家

    我正在尝试将 PDF 转换为 tiff 图像 我使用以下代码按格式获取图像编写器 Iterator
  • System.Drawing.Image.Save 抛出ExternalException:GDI 中发生一般错误

    我有一个函数 它需要一个位图 复制它的一部分并将其保存为 8bpp tiff 结果图像的文件名是唯一的并且文件不存在 程序有权写入目标文件夹 void CropImage Bitmap map Bitmap croped new Bitma

随机推荐

  • OpenMPI:简单的 2 节点设置

    我在仅使用两个节点运行 OpenMPI 程序时遇到问题 其中一个节点与正在执行的机器是同一台机器 mpiexec命令和另一个节点是一台单独的机器 我将调用正在运行 mpiexec 的机器 master 以及另一个节点slave On bot
  • 使用 data.table [R] 查找组中众数出现的次数

    我一直在使用这里的优秀答案查找具有数据表的组的众数 但是 我还想查找每组变量 y 的 x 模态值出现的次数 我怎样才能做到这一点 编辑 有一种比上面链接的答案更快的方法来查找模式 我找不到从中得到的答案 如果有 请编辑并链接 但它使用此功能
  • React-router重定向到index.html并从.htaccess中的url中删除www

    我正在 ReactJS 中构建一个小型应用程序 因此所有页面都需要提供index html 并且 JS 处理 url 这很好用 但我还想让 htaccess 从网址中删除 www 如果存在 我正在阅读 mod rewrite 文档 但我不太
  • 如何在 Windows 7 中将 URL 参数从 Java 传递到本地 HTML 文件?

    我迫切需要您的专业知识来解决 Windows 7 问题 设想 我有一个基于框架的帮助包 它是为上下文相关的帮助调用而设置的 Java 应用程序能够通过将表示所需 HTML 的名为 anchor 的标记传递到名为 pophelp 的 HTML
  • 从输入文件读取实际值时出现浮点异常

    我尝试从输入文件中读取浮点值Fortran 为此 我使用以下代码 INTEGER nf REAL re OPEN newunit nf file toto txt READ unit nf fmt re 与 toto txt 包含我的真实值
  • Octave / MATLAB 中的 deal() 函数有什么意义?

    一些参考代码使用了该函数deal 简单地说 就像 a b c deal 1 2 3 如文档中所述 对于八度 and 对于MATLAB 该函数只是将输入复制到输出 Why use deal 在这种情况下 甚至在一般情况下 我正在尝试学习 更正
  • Django:从模板内访问会话变量?

    如果我在 Django 中设置一个会话变量 例如 request session name name 有没有办法可以从模板中访问它 或者我是否必须从视图中检索它 然后将其传递给模板 之所以这么问 是因为我想在模板中访问大约 10 个小会话变
  • 在 Angular 5 中迭代复杂的 JSON 结构

    如何在 Angular 5 中迭代 JSON 已经搜索了很多 得到了一个管道概念 但它不适用于复杂的 json 如下所示 我需要使用以下类型的数据创建可扩展表 我一直在阅读这个 json data Items Key 9009 type f
  • 如何使用 javascript 阻止因空字段而提交表单?

    如何在 javascript 中编写脚本来输出错误并防止表单中存在空字段时提交表单 假设表单名称为 form 输入名称为 name 我在 PHP 中遇到了一些麻烦 并不总是正确处理空字段 所以我想将其作为备份 如有任何帮助 我们将不胜感激
  • Sparklyr 更改所有列名称 Spark DataFrame

    我打算更改所有列名称 目前的重命名或选择操作太费力了 不知道有没有人有更好的解决方案 示例如下 df lt data frame oldname1 LETTERS oldname2 1 oldname200 APPLE df tbl lt
  • F5浏览器刷新和回发有区别吗?(asp.NET)

    我正在 asp NET 中现有数据网格的不同行中动态创建拖网格 我生成的数据网格有一列是 TemplateColumn 复选框列 在我的父数据网格中 我有一个带有复选框的模板列 当我选中或取消选中复选框的值时 会调用 check chang
  • Flutter:如何使用变量将参数传递给 Widget?

    这是一些伪代码 显示了我想要实现的目标 Text txt text subtitle false final params subtitle textAlign TextAlign center style TextStyle color
  • 如何检查 css box-shadow 是否受支持(jQuery)?

    我正在创建一个完整的 css 布局 但是 某些浏览器 例如IE6 不支持box shadow 和 webkit box shadow或 moz box shadow 我想检查一下是否不支持 然后添加其他样式 这在 jQuery 中怎么可能呢
  • 在 Heroku 上结合使用 Resque、Puma 和 Scheduler

    在查看了大量指南后 我想确认我的设置 现在我的procfile好像 web bundle exec puma C config puma rb config ru resque TERM CHILD 1 RESQUE TERM TIMEOU
  • 如何恢复用 jQuery 删除的元素?

    如果使用删除元素 notification remove 我们如何将其创建回来 你无法得到那个特定的例子后退 使用 remove 将其从 DOM 中删除 不过 您可以创建它的克隆 在 DOM 中移动它 隐藏它等等 根据您的项目需求 您可能还
  • 读取行时,awk $line

    我有一个包含数字列表的文件 我有第二个文件 每个文件包含各种条目和多个字段 我想要做的是获取第 12 个字段等于第一个数字的所有行 并将它们放入一个新文件中 然后放入第二个数字 依此类推 我写了一句很有道理的俏皮话 但我不明白为什么它行不通
  • Spring 4 静态内容(如 css/js)带来错误 405 不支持请求方法“GET”

    我已经检查过这个问题 但是经过 4 个小时的尝试 没有任何结果对我有用 尝试访问我的 css 文件时收到 405 错误 这是我的 Config java package com myapp config import org springf
  • 如何确保我的 makefile 检测到头文件和 cpp 文件中的更改?

    目前 每当我这样做时make我的 makefile 告诉我 make some obj file o 是最新的 无论我是否编辑了生成该目标文件所涉及的任何文件 我如何让它检测变化 这是一个重现该问题的简单 makefile SHELL bi
  • C# 中的二维数组切片

    我正在寻找在 C 中切片二维数组 我有 double 2 2 价格 想要检索该数组的第二行 我尝试过价格 1 但我有一种感觉 可能是别的东西 提前致谢 没有直接的 切片 操作 但您可以定义如下扩展方法 public static IEnum
  • 扫描仪扫描文档(TIFF 和 PDF)的最佳设置[关闭]

    Closed 这个问题不符合堆栈溢出指南 目前不接受答案 扫描仪的最佳设置是什么 以便扫描文档 白色和黑色文本 并将其用于 OCR 转换 以获得最佳结果 以及 PDF 和 TIFF 格式的标准设置和规范是什么 对于 OCR 最佳扫描设置是