Tesseract

如何减小tesseract生成的PDF的大小？

我的网络应用程序的设置如下我获取用户上传的 PDF 文件对它们运行 OCR 并向他们显示 OCRed PDF 由于一切都在线因此最小化生成的 PDF 文件的大小是减少用户加载和等待时间的关键我从用户那里收到的文件是sample

pdf pdfgeneration OCR Tesseract Ghostscript

如何将 Tesseract OCR 库集成到 C++ 程序中

我正在尝试使用Tesseract OCR 库 https code google com p tesseract ocr 为了创建一个程序来读取电梯楼层号码的图片我还没有找到任何关于如何将 Tesseract 库包含到 C 文件中的示例

c Ubuntu ComputerVision OCR Tesseract

Tesseract OCR：解析表格单元格

我正在使用 cmd 中的 Tesseract OCR v4 0 0 alpha 从如下所示的表格的 png 中提取文本我希望 Tesseract OCR 能够解析一个单元格中的内容然后再转到下一个单元格我不想继续行中的下一个单词

OCR Tesseract

Tesseract OCR 无法检测数字

我正在尝试用 python 中的 tesseract 检测一些数字下面您将看到我的起始图像以及我可以将其简化为的内容这是我用来获取它的代码 import pytesseract import cv2 import numpy as np

python opencv imageprocessing Tesseract pythontesseract

用于 Tesseract 和 OpenCV 的 CMake

我是 Linux 编程新手我正在尝试创建一个 OCR 应用程序Ubuntu 12 10 using 超立方体 http code google com p tesseract ocr E2 80 8E and OpenCV http ww

c Linux opencv CMake Tesseract

训练 Tesseract 特定单词 - 可能吗？

我想使用 Tesseract 从文档中提取大约 10 20 个关键字该文档将包含所有英文字符单词我感兴趣的是年龄 23 之类的东西这里 Age 是我感兴趣的关键字也想提取 23 它的值我想到的第一个方法是将整个页面提取为文本

OCR Tesseract

在 tesseract C++ API 中禁用字典辅助 OCR

我有一个应用程序其中使用 tesseract API 对技术数据表进行 OCR 处理我这样初始化它 tesseract TessBaseAPI tess tess Init NULL eng tesseract OEM TESSERAC

c API OCR Tesseract

Tesseract 虚假空间识别

我正在使用 tesseract 来识别序列号这是可以接受的存在常见问题例如错误识别零和 O 6 和 5 或 M 和 H 除此之外这个超正方体还向识别的单词添加了空格而图像中没有空格下图被识别为 HI 3H 这张图片的结果是 FB

c opencv OCR Tesseract spaces

配置：错误：leptonica 库丢失（在 MinGW 上构建 tesseract-ocr-3.01 时）

运行配置时失败 checking for leptonica yes checking for pixCreate in llept no configure error leptonica library missing 但我已经构建了l

Compilation MinGW configure Tesseract

Android OCR 使用 tess-two（tesseract 的一个分支）

我正在使用 OCR 作为正在进行的项目中的模块经过一周的深入研究后我认为我应该在 Eclipse 上运行一个测试应用程序看看它的工作有多准确我发现 tess two 是 tesseract 的一个分支作为对我的 OCR 的支持我

Android eclipse OCR logcat Tesseract

在哪里可以找到 tesseract->setvariable 函数的第一个参数的可用属性名称列表？

从大量的目光中我只能找到其中的一小部分如下面的 tesseract 的 setVariable 1st param 2nd param 示例 tesseract gt SetVariable tessedit char whitelist

ios xcode Tesseract

Tesseract 不使用路径变量

为什么我的 Tesseract 实例要求我显式设置数据路径但不想读取环境变量让我澄清一下运行代码 ITesseract tesseract new Tesseract String result tesseract doOCR myI

Linux Tesseract tess4j

使用 OCR python 读取图像上的数字

我正在尝试使用 Python 和 tesseract 中的 OpenCV 提取图像上的数字这是我的尝试但我什么也没得到该代码没有返回预期的数字 import fitz pytesseract os re import cv2 sTem

python opencv ImageMagick OCR Tesseract

如何识别这些图像中字母的颜色？

我在用本文 https code msdn microsoft com windowsdesktop Solving Captcha with C dadf37cd解决验证码问题它的工作原理是使用 AForge 从图像中删除背景然后将

c captcha Tesseract aforge

Tesseract 混淆两个数字

我正在编写一个应用程序来扫描图像中的数字这些数字使用 OCR B 字体并且还可能包含 and gt 人物这是我的源图像即使将字符集限制为上述字符使用 Tesseract 的扫描效果也不是很好由于我没有找到 Tesseract 的

OCR Tesseract

如何查找 Tesseract OCR 配置文件中支持的参数

我想知道Tesseract OCR使用的配置文件接受哪些参数如何编写配置文件等我在上找不到任何关于此的文档他们的网站 https code google com p tesseract ocr 如何确定支持哪些参数及其含义 Tesse

Tesseract

根据 ocr 图像结尾的段落将字符串拆分为列

我正在开发一个项目将打字机写的战争日记笔记从 PDF 扫描转换为文本我可以成功地对于原始的未调整大小的文件可能是 90 提取我首先裁剪的主要文本 Reprex 数据您可以从头开始尝试使用图像或我在下面提供的文本我的挑战是保持文本

r Tesseract stringr pdftools magickrpackage

如何使用 Tesseract OCR 从图像中读取表格数据？

有谁知道如何从图像中读取和解析任何表格数据我正在使用 asp net 应用程序并且已使用 Tesseract OCR API 成功读取数据但无法从图像读取表格请用c 代码给出解决方案 None

c ASPNETMVC Tesseract

向 Tesseract eng.traineddata“添加”新字体

据我所知 Tesseract 3 x 附带了 6 种英文字体如果我错了请纠正我我需要训练 Tesseract 来支持 5 种以上的字体我只需要大写字母和数字没有特殊字符或符号我遵循了各种流程例如向 Tesseract 3 O

python OCR Tesseract

使用 OpenCV 和 Tesseract 的摩洛哥车牌识别 (LPR)

我正在开展一个关于识别摩洛哥车牌的项目如下图所示摩洛哥车牌请问我如何使用 OpenCV 切出车牌并使用 Tesseract 读取中间的数字和阿拉伯字母我研究过这篇研究论文 https www researchgate net pub

opencv OCR Tesseract imagerecognition