是否有任何 OCR 引擎旨在识别屏幕捕获图像中的文本而不是扫描文本?我有一个项目,需要检索和识别应用程序中的文本,到目前为止我尝试过的 OCR 引擎都不能很好地处理屏幕截图。
理想情况下,引擎应该能够很好地处理颜色和背景噪音,尽管如果没有类似的东西可用,我可以做一些调整。
它需要与 .NET 兼容;用 .NET 编写或具有 .NET 可调用的 API。
我发现了超立方 OCR http://code.google.com/p/tesseract-ocr/对于一个开源项目来说是非常可靠的。我发现它甚至可以读取和解码简单的验证码,例如 Megaupload 的验证码。我认为只要稍加调整,这可能会效果很好。
唯一的缺点是它只接受未压缩的 TIFF 图像,这可能很烦人。
编辑:Philip Daubmeier 已经找到了 .NET 集成,但下面是将位图转换为未压缩的 TIFF 的代码。
private void ConvertBitmapToTIF(Bitmap convert)
{
ImageCodecInfo codecInfo = GetEncoderInfo("image/tiff");
System.Drawing.Imaging.Encoder encodeCom = System.Drawing.Imaging.Encoder.Compression;
System.Drawing.Imaging.Encoder encodeBPP = System.Drawing.Imaging.Encoder.ColorDepth;
EncoderParameters parms = new EncoderParameters(2);
EncoderParameter param0 = new EncoderParameter(encodeCom, (long)EncoderValue.CompressionNone);
EncoderParameter param1 = new EncoderParameter(encodeBPP, 8L);
parms.Param[0] = param0;
parms.Param[1] = param1;
convert.Save("output.tif", codecInfo, parms);
}
这会保存到文件中,但是位图保存 http://msdn.microsoft.com/en-us/library/system.drawing.bitmap.save.aspx方法也可以写入流。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)