专为屏幕阅读而设计的 OCR 引擎

2023-12-19

是否有任何 OCR 引擎旨在识别屏幕捕获图像中的文本而不是扫描文本?我有一个项目,需要检索和识别应用程序中的文本,到目前为止我尝试过的 OCR 引擎都不能很好地处理屏幕截图。

理想情况下,引擎应该能够很好地处理颜色和背景噪音,尽管如果没有类似的东西可用,我可以做一些调整。

它需要与 .NET 兼容;用 .NET 编写或具有 .NET 可调用的 API。


我发现了超立方 OCR http://code.google.com/p/tesseract-ocr/对于一个开源项目来说是非常可靠的。我发现它甚至可以读取和解码简单的验证码,例如 Megaupload 的验证码。我认为只要稍加调整,这可能会效果很好。

唯一的缺点是它只接受未压缩的 TIFF 图像,这可能很烦人。

编辑:Philip Daubmeier 已经找到了 .NET 集成,但下面是将位图转换为未压缩的 TIFF 的代码。

private void ConvertBitmapToTIF(Bitmap convert)
{
    ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
    System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
    System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;

    EncoderParameters parms = new EncoderParameters(2);
    EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
    EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
    parms.Param[0] = param0;
    parms.Param[1] = param1;

    convert.Save("output.tif", codecInfo, parms);
}

这会保存到文件中,但是位图保存 http://msdn.microsoft.com/en-us/library/system.drawing.bitmap.save.aspx方法也可以写入流。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

专为屏幕阅读而设计的 OCR 引擎 的相关文章

  • 如何使用 PetaPoco 库自动从数据库创建模型?

    我的数据库中有一个表 我想为其创建一个带有 getter 和 setter 的模型类 对于我项目中的大部分任务 我使用 PetaPoco 我手动创建了模型 但很少有表有很多列 有没有办法使用 PetaPoco 从数据库创建模型 我强烈建议您
  • 在c#中创建sql连接

    我是这个网站的新手 也是编程的新手 我目前正在通过销售点创建库存系统 它使用模态和非模态形式 我的问题是 我正在研究change password对话框必须连接到数据库才能覆盖密码字段 我使用的数据库是Microsoft SQL Serve
  • 如何以一种形式发布两个或多个模型?

    我正在为一个项目开发互联网课程计划应用程序 该课程计划是根据以下模型构建的 使用数据库优先方法中的实体框架生成 public partial class Subject public int Id get set public string
  • InvalidOperationException:无法解析类型“Microsoft.AspNetCore.Http.IHttpContextAccessor”的服务

    我开始将我的 asp net core RC1 项目转换为 RC2 并面临现在的问题IHttpContextAccessor没有解决 为了简单起见 我使用 Visual Studio 模板创建了新的 ASP NET RC2 项目ASP NE
  • C# 创建包含多个文件的 ZIP 存档

    我正在尝试创建包含多个文本文件的 ZIP 存档 如下所示 Dictionary
  • 无法在.net core中使用WCF WSHttpBinding

    我正在尝试将我的项目从 net 移动到 net core 我最初在 net 中使用 WCF WSHttpBinding 服务 但无法在 net core 中使用相同的服务 我尝试使用 BasicHttpBinding 在客户端与 WsHtt
  • 为什么WCF中不允许方法重载?

    假设这是一个ServiceContract ServiceContract public interface MyService OperationContract int Sum int x int y OperationContract
  • 如何将 CSV 文件读入 .NET 数据表

    如何将 CSV 文件加载到System Data DataTable 根据CSV文件创建数据表 常规 ADO net 功能是否允许这样做 我一直在使用OleDb提供者 但是 如果您正在读取具有数值的行 但希望将它们视为文本 则会出现问题 但
  • 元素属性语法和属性属性语法之间有语义差异吗?

    我认为元素属性语法和属性属性语法在语义上没有太大区别 但是 我发现一定有什么不同 例如 下面的例子只是演示了一个简单的触发器
  • 图像处理以提高 tesseract OCR 准确性

    我一直在使用 tesseract 将文档转换为文本 文档的质量参差不齐 我正在寻找有关哪种图像处理可以改善结果的提示 我注意到高度像素化的文本 例如由传真机生成的文本 对于超正方体来说尤其难以处理 大概所有这些字符的锯齿状边缘都会混淆形状识
  • WCF 服务调用包装器

    为 WCF 服务调用创建包装器的最佳实践是什么 我认为有必要 为了在同一个地方监视所有呼叫 我正在考虑使用这种代码 这是正确的想法吗 RetType t ServiceExecutionContext
  • 从图像创建视频时,每秒减慢 ffmpeg 的图像速度

    我有一系列演示的屏幕截图 我想将其放入视频中 我正在使用 ffmpeg 为此目的 命令是ffmpeg f image2 i screenshot 5d png vcodec mpeg4 demo avi 不过 视频长度比我想要的要短 而且移
  • 如何为从源文件编译的应用程序分配自定义图标?

    在我的程序中 我使用 CSharpCodeProvider 来从源文件编译另一个应用程序 我使用的代码如下 public static bool CompileExecutable String sourceName FileInfo so
  • 如何获取可用系统内存的大小?

    C NET 中是否可以获取系统可用内存的大小 如果是的话怎么办 Use Microsoft VisualBasic Devices ComputerInfo TotalPhysicalMemory http msdn microsoft c
  • 每个托管线程是否都有自己对应的本机线程?

    我想知道是否在 Net 中创建托管线程 通过调用Thread Start 导致在后台创建一个本机线程 那么托管线程是否有对应的本机线程呢 如果是 当托管线程等待或睡眠时 是否意味着相应的本机线程也在等待或睡眠 是的 NET 线程映射到所有当
  • Android 手机作为 GSM 调制解调器在 PC 上发送/接收短信?

    是否可以将 Android 移动设备用作 PC 上的 GSM 调制解调器 我正在 net下开发应用程序来发送 接收短信等 现在我想通过 USB 将我的 Android 设备连接到我的 PC 并将其用作 GSM 调制解调器来与其通信 这里是参
  • 确保 StreamReader 不会挂起等待数据

    下面的代码读取从 tcp 客户端流读取的所有内容 并且在下一次迭代中它将仅位于 Read 上 我假设正在等待数据 我如何确保它不会在没有任何内容可供读取时返回 我是否必须设置低超时 并在失败时响应异常 或者有更好的办法吗 TcpClient
  • 使用接口有什么好处?

    使用接口有什么用 我听说它用来代替多重继承 并且还可以用它来完成数据隐藏 还有其他优点吗 哪些地方使用了接口 程序员如何识别需要该接口 有什么区别explicit interface implementation and implicit
  • 等待进程释放文件

    我如何等待文件空闲以便ss Save 可以用新的覆盖它吗 如果我紧密地运行两次 左右 我会得到一个generic GDI error
  • 从 Excel 应用程序对象中查找位数(32 位/64 位)?

    是否可以从 Microsoft Office Interop Excel ApplicationClass 确定 Excel 是以 32 位还是 64 位运行 Edit该解决方案应该适用于 Excel 2010 和 Excel 2007 此

随机推荐

  • 使用 $resource 承诺模式缓存数据

    假设我的服务从 resource get 返回一个承诺 我想知道这是否是缓存数据的正确方法 在此示例中 点击后退箭头并返回搜索结果后 我不想再次查询网络服务器 因为我已经有了它们 这是处理这种情况的正确模式吗 下面的示例是查询 Flixte
  • 转换时间字符串格式

    我想将时间数据转换为格式HH mm ss在 JavaScript 中 我的代码有问题 请参阅代码内的注释 function parseTime timeString var timeString timeString toLowerCase
  • 如何简化Java中的印度区字符串? (问题扩展)

    我有一系列印度地区 例如String districts district1 district2 district3 等等 也许是印度的全部或部分地区 认为 District1 district2 district3 是拉贾斯坦邦的区 An
  • 删除 Google 地图圆形/形状

    我正在使用 google maps Circle 方法创建一个 Circle 这一切都工作得很好 但是我怎样才能删除这个圆圈呢 My code var populationOptionsAgain strokeColor c4c4c4 st
  • 如何测试断言?

    我发现如何测试异常或错误 https stackoverflow com a 54241438 6509751 https stackoverflow com a 54241438 6509751 但我如何测试以下内容assert工作正常吗
  • 抓取非英文网站的编码问题

    我试图将网页的内容作为字符串获取 我发现这个问题解决了如何编写一个基本的网络爬虫 https stackoverflow com questions 1381617 simplest way to correctly load html f
  • 在 INSTEAD OF INSERT 触发器的 OUTPUT 子句中,是否可以引用两个 INSERTED 表?

    SQL Server 2005 我有一个观点INSTEAD OF INSERT扳机 在触发器的主体内部 我想使用带有OUTPUT引用两者的子句INSERTED tables 外层INSERTED表为INSTEAD OF INSERT tri
  • autoconf 配置警告:/usr/bin/file:没有这样的文件或目录

    当我在 ubuntu 操作系统 16 中使用我的配置时 似乎没有问题 我已经安装了 autoconf 工具和依赖项 当我在 ubuntu 16 或最新版本 中运行相同的配置文件时 问题是我没有安装任何自动工具 我收到以下错误消息 confi
  • 如何在 Google 云存储中下载多个文件

    场景 项目团队成员可以访问的存储桶中存储有多个文件夹和许多文件 有没有一种方法可以下载整个文件夹 而不是一次下载一个文件 这非常慢且耗时 或者至少一次多个文件 是否可以在不使用命令控制台之一的情况下实现这一点 一些团队成员不懂技术 需要尽可
  • SVG 的 Typescript 库 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我一直在使用 Raphael 和 Angular 4 应用程序 也尝试切换到 Snap 这些都不能很好
  • 为什么使用 PredicateBuilder 的这段代码不起作用?

    为什么我的列表没有返回任何内容 class Program static void Main string args var list new List
  • Codeigniter form_helper 获取数据库行作为选择菜单中的值

    我正在编写一个表单 其中有一个选择菜单 我希望从数据库中提取值 所以我认为这将是这样的 My view 我的控制器 function add content data array this gt is logged
  • Keycloak H2登录失败:约束已存在

    我们使用 keycloak 和 h2 数据库 直到昨天 一切进展顺利 当时 keycloak 突然无法连接到 h2 数据库 Constraint FK OUSE064PLMLR732LXJCN1Q5F1 already exists SQL
  • .NET 4.0 中的 System.Linq 在哪里?

    我将一个 asp net 应用程序迁移到 4 0 现在我收到错误 找不到类型或命名空间名称 IQueryable 对 System Linq 的引用无效 我在引用列表中找不到它 System Linq 到哪里去了 确保您正在引用System
  • Reactjs - 使用 xlsx.utils.json_to_sheet 导出到 Excel

    我正在使用 xlsx npm 包将数据导出到 Excel 以下代码按预期工作并导出数据 我需要应用如下所示的一些样式 请帮忙 标题应该是粗体 标题背景应该是灰色的 应用边框 进口声明 import as XLSX from xlsx Cod
  • 角度重复 n 次

    我有一个包含 int 属性的 JSON 对象x 我想重复下面的代码x次 span class glyphicon glyphicon star span ng repeat 似乎没有被指出 因为它正在与集合一起使用 任何建议 角度新手 我会
  • 将变量传递给事件 javascript - 没有闭包,没有 jq,避免 evals 等

    好吧 每个人都已经解决了这个问题 但我觉得还没有更了解该怎么做 我想要一个循环来设置一堆点击处理程序 并为每个处理程序提供唯一的参数 我现在正在做这样的事情 for thisThing in things myDiv document cr
  • 如何创建自定义页面卷曲核心动画?

    我正在尝试在 iPhone 应用程序中创建图像的 卷页 动画 我t UIViewAnimationTransitionCurlUp 它是未记录的核心动画同级 但是我需要动画的图像是透明的PNG 具有 不均匀 一些alpha像素 轮廓 当使用
  • gem安装权限问题

    qichunren zhaobak gt gem install hpricot ERROR While executing gem Gem FilePermissionError You don t have write permissi
  • 专为屏幕阅读而设计的 OCR 引擎

    是否有任何 OCR 引擎旨在识别屏幕捕获图像中的文本而不是扫描文本 我有一个项目 需要检索和识别应用程序中的文本 到目前为止我尝试过的 OCR 引擎都不能很好地处理屏幕截图 理想情况下 引擎应该能够很好地处理颜色和背景噪音 尽管如果没有类似