Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何减小tesseract生成的PDF的大小?
我的 网络 应用程序的设置如下 我获取用户上传的 PDF 文件 对它们运行 OCR 并向他们显示 OCRed PDF 由于一切都在线 因此最小化生成的 PDF 文件的大小是减少用户加载和等待时间的关键 我从用户那里收到的文件是sample
pdf
pdfgeneration
OCR
Tesseract
Ghostscript
如何将 Tesseract OCR 库集成到 C++ 程序中
我正在尝试使用Tesseract OCR 库 https code google com p tesseract ocr 为了创建一个程序来读取电梯楼层号码的图片 我还没有找到任何关于如何将 Tesseract 库包含到 C 文件中的示例
c
Ubuntu
ComputerVision
OCR
Tesseract
Tesseract OCR:解析表格单元格
我正在使用 cmd 中的 Tesseract OCR v4 0 0 alpha 从如下所示的表格的 png 中提取文本 我希望 Tesseract OCR 能够解析一个单元格中的内容 然后再转到下一个单元格 我不想继续 行 中的下一个单词
OCR
Tesseract
Tesseract OCR 无法检测数字
我正在尝试用 python 中的 tesseract 检测一些数字 下面您将看到我的起始图像以及我可以将其简化为的内容 这是我用来获取它的代码 import pytesseract import cv2 import numpy as np
python
opencv
imageprocessing
Tesseract
pythontesseract
用于 Tesseract 和 OpenCV 的 CMake
我是 Linux 编程新手 我正在尝试创建一个 OCR 应用程序Ubuntu 12 10 using 超立方体 http code google com p tesseract ocr E2 80 8E and OpenCV http ww
c
Linux
opencv
CMake
Tesseract
训练 Tesseract 特定单词 - 可能吗?
我想使用 Tesseract 从文档中提取大约 10 20 个关键字 该文档将包含所有英文字符 单词 我感兴趣的是 年龄 23 之类的东西 这里 Age 是我感兴趣的关键字 也想提取 23 它的值 我想到的第一个方法是将整个页面提取为文本
OCR
Tesseract
在 tesseract C++ API 中禁用字典辅助 OCR
我有一个应用程序 其中使用 tesseract API 对技术数据表进行 OCR 处理 我这样初始化它 tesseract TessBaseAPI tess tess Init NULL eng tesseract OEM TESSERAC
c
API
OCR
Tesseract
Tesseract 虚假空间识别
我正在使用 tesseract 来识别序列号 这是可以接受的 存在常见问题 例如错误识别零和 O 6 和 5 或 M 和 H 除此之外 这个超正方体还向识别的单词添加了空格 而图像中没有空格 下图被识别为 HI 3H 这张图片的结果是 FB
c
opencv
OCR
Tesseract
spaces
配置:错误:leptonica 库丢失(在 MinGW 上构建 tesseract-ocr-3.01 时)
运行配置时失败 checking for leptonica yes checking for pixCreate in llept no configure error leptonica library missing 但我已经构建了l
Compilation
MinGW
configure
Tesseract
Android OCR 使用 tess-two(tesseract 的一个分支)
我正在使用 OCR 作为正在进行的项目中的模块 经过一周的深入研究后 我认为我应该在 Eclipse 上运行一个测试应用程序 看看它的工作有多准确 我发现 tess two 是 tesseract 的一个分支 作为对我的 OCR 的支持 我
Android
eclipse
OCR
logcat
Tesseract
在哪里可以找到 tesseract->setvariable 函数的第一个参数的可用属性名称列表?
从大量的目光中我只能找到其中的一小部分 如下面的 tesseract 的 setVariable 1st param 2nd param 示例 tesseract gt SetVariable tessedit char whitelist
ios
xcode
Tesseract
Tesseract 不使用路径变量
为什么我的 Tesseract 实例要求我显式设置数据路径 但不想读取环境变量 让我澄清一下 运行代码 ITesseract tesseract new Tesseract String result tesseract doOCR myI
Linux
Tesseract
tess4j
使用 OCR python 读取图像上的数字
我正在尝试使用 Python 和 tesseract 中的 OpenCV 提取图像上的数字 这是我的尝试 但我什么也没得到 该代码没有返回预期的数字 import fitz pytesseract os re import cv2 sTem
python
opencv
ImageMagick
OCR
Tesseract
如何识别这些图像中字母的颜色?
我在用本文 https code msdn microsoft com windowsdesktop Solving Captcha with C dadf37cd解决验证码问题 它的工作原理是使用 AForge 从图像中删除背景 然后将
c
captcha
Tesseract
aforge
Tesseract 混淆两个数字
我正在编写一个应用程序来扫描图像中的数字 这些数字使用 OCR B 字体 并且还可能包含 and gt 人物 这是我的源图像 即使将字符集限制为上述字符 使用 Tesseract 的扫描效果也不是很好 由于我没有找到 Tesseract 的
OCR
Tesseract
如何查找 Tesseract OCR 配置文件中支持的参数
我想知道Tesseract OCR使用的配置文件接受哪些参数 如何编写配置文件等 我在 上找不到任何关于此的文档他们的网站 https code google com p tesseract ocr 如何确定支持哪些参数及其含义 Tesse
Tesseract
根据 ocr 图像结尾的段落将字符串拆分为列
我正在开发一个项目 将打字机写的战争日记笔记从 PDF 扫描转换为文本 我可以成功地 对于原始的未调整大小的文件 可能是 90 提取我首先裁剪的主要文本 Reprex 数据 您可以从头开始尝试使用图像或我在下面提供的文本 我的挑战是保持文本
r
Tesseract
stringr
pdftools
magickrpackage
如何使用 Tesseract OCR 从图像中读取表格数据?
有谁知道如何从图像中读取和解析任何表格数据 我正在使用 asp net 应用程序 并且已使用 Tesseract OCR API 成功读取数据 但无法从图像读取表格 请用c 代码给出解决方案 None
c
ASPNETMVC
Tesseract
向 Tesseract eng.traineddata“添加”新字体
据我所知 Tesseract 3 x 附带了 6 种英文字体 如果我错了 请纠正我 我需要训练 Tesseract 来支持 5 种以上的字体 我只需要大写字母和数字 没有特殊字符或符号 我遵循了各种流程 例如 向 Tesseract 3 O
python
OCR
Tesseract
使用 OpenCV 和 Tesseract 的摩洛哥车牌识别 (LPR)
我正在开展一个关于识别摩洛哥车牌的项目 如下图所示 摩洛哥车牌 请问我如何使用 OpenCV 切出车牌并使用 Tesseract 读取中间的数字和阿拉伯字母 我研究过这篇研究论文 https www researchgate net pub
opencv
OCR
Tesseract
imagerecognition
«
1
2
3
4
5
6
7
8
...10
»