使用 OCR 从图像文件读取文本的 API

2023-11-24

我正在寻找 Java 中 OCR（光学字符识别）的示例代码或 API 名称，使用它我可以从图像文件中提取所有文本。无需将其与我使用下面的代码所做的任何图像进行比较。

public class OCRTest {

    static String STR = "";

    public static void main(String[] args) {
        OCR l = new OCR(0.70f);
        l.loadFontsDirectory(OCRTest.class, new File("fonts"));
        l.loadFont(OCRTest.class, new File("fonts", "font_1"));
        ImageBinaryGrey i = new ImageBinaryGrey(Capture.load(OCRTest.class, "full.png"));
        STR = l.recognize(i, 1285, 654, 1343, 677, "font_1");
        System.out.println(STR);
    }
}

你可以试试Tess4j or Tesseract 的 JavaCPP 预设。我更喜欢后者，因为它比前者更容易。将依赖项添加到您的 pom `

        <dependency>
            <groupId>org.bytedeco.javacpp-presets</groupId>
            <artifactId>tesseract-platform</artifactId>
            <version>3.04.01-1.3</version>
        </dependency>

` 而且编码简单

import org.bytedeco.javacpp.*;
import static org.bytedeco.javacpp.lept.*;
import static org.bytedeco.javacpp.tesseract.*;

public class BasicExample {
    public static void main(String[] args) {
        BytePointer outText;

        TessBaseAPI api = new TessBaseAPI();
        // Initialize tesseract-ocr with English, without specifying tessdata path
        if (api.Init(null, "eng") != 0) {
            System.err.println("Could not initialize tesseract.");
            System.exit(1);
        }

        // Open input image with leptonica library
        PIX image = pixRead(args.length > 0 ? args[0] : "/usr/src/tesseract/testing/phototest.tif");
        api.SetImage(image);
        // Get OCR result
        outText = api.GetUTF8Text();
        System.out.println("OCR output:\n" + outText.getString());

        // Destroy used object and release memory
        api.End();
        outText.deallocate();
        pixDestroy(image);
    }
}

Tess4j 并不复杂，因为它需要安装特定的 VC++ 可再发行软件包。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

OCR

使用 OCR 从图像文件读取文本的 API 的相关文章

序列的排列？

我有具体数量的数字现在我想以某种方式显示这个序列的所有可能的排列例如如果数字数量为3 我想显示 0 0 0 0 0 1 0 0 2 0 1 0 0 1 1 0 1 2 0 2 0 0 2 1 0 2 2 1 0 0 1 0 1 1 0
Spring应用中Eureka健康检查的问题

我正在开发一个基于 Spring 的应用程序其中包含多个微服务我的一个微服务充当尤里卡服务器到目前为止一切正常在我所有其他微服务中用 EnableEurekaClient 我想启用这样的健康检查应用程序 yml eureka c
如何通过 javaconfig 使用 SchedulerFactoryBean.schedulerContextAsMap

我使用 Spring 4 0 并将项目从 xml 移至 java config 除了访问 Service scheduleService 带注释的类来自QuartzJobBean executeInternal 我必须让它工作的 xml 位
为什么 JTables 使 TableModel 在呈现时不可序列化？

所以最近我正在开发一个工具供我们配置某些应用程序它不需要是什么真正令人敬畏的东西只是一个具有一些 SQL 脚本生成功能并创建几个 XML 文件的基本工具在此期间我使用自己的 AbstractTableModel 实现创建了一系列
org.apache.hadoop.security.AccessControlException：客户端无法通过以下方式进行身份验证：[TOKEN，KERBEROS] 问题

我正在使用 java 客户端通过 Kerberos 身份验证安全访问 HDFS 我尝试打字klist在服务器上它显示已经存在的有效票证我收到的异常是客户端无法通过以下方式进行身份验证 TOKEN KERBEROS 帮助将不胜感激这是一
Spring AspectJ 在双代理接口时失败：无法生成类的 CGLIB 子类

我正在使用Spring的
如何在 Spring 中禁用使用 @Component 注释创建 bean？

我的项目中有一些用于重构逻辑的通用接口它看起来大约是这样的 public interface RefactorAwareEntryPoint default boolean doRefactor if EventLogService wa
jQuery AJAX 调用 Java 方法

使用 jQuery AJAX 我们可以调用特定的 JAVA 方法例如从 Action 类该 Java 方法返回的数据将用于填充一些 HTML 代码请告诉我是否可以使用 jQuery 轻松完成此操作就像在 DWR 中一样此外对于
Java 公历日历更改时区

我正在尝试设置 HOUR OF DAY 字段并更改 GregorianCalendar 日期对象的时区 GregorianCalendar date new GregorianCalendar TimeZone getTimeZone GM
java.lang.IllegalStateException：应用程序 PagerAdapter 更改了适配器的内容，而没有调用 PagerAdapter#notifyDataSetChanged android

我正在尝试使用静态类将值传递给视图而不是使用意图因为我必须传递大量数据有时我会收到此错误但无法找出主要原因是什么 Error java lang IllegalStateException The application s Pag
将 MOXy 设置为 JAXB 提供程序，而在同一包中没有属性文件

我正在尝试使用 MOXy 作为我的 JAXB 提供程序以便将内容编组解组到 XML JSON 中我创建了 jaxb properties 文件内容如下 javax xml bind context factory org eclip
在 junit 测试中获取 javax.lang.model.element.Element 类

我想测试我的实用程序类 ElementUtils 但我不知道如何将类作为元素获取在 AnnotationProcessors 中我使用以下代码获取元素 Set
如何对不同的参数类型使用相同的java方法？

我的问题我有 2 个已定义的记录创建对象请求更新对象请求必须通过实用方法进行验证由于这两个对象具有相同的字段因此可以对这两种类型应用相同的验证方法现在我只是使用两种方法进行重载但它很冗长 public record Crea
获取文件的总大小（以字节为单位）[重复]

这个问题在这里已经有答案了可能的重复 java 高效获取文件大小 https stackoverflow com questions 116574 java get file size efficiently 我有一个名为 filenam
不接受任何内容也不返回任何内容的函数接口[重复]

这个问题在这里已经有答案了 JDK中是否有一个标准的函数式接口不接受也不返回任何内容我找不到一个像下面这样 FunctionalInterface interface Action void execute 可运行怎么样 Functi
java.io.Serialized 在 C/C++ 中的等价物是什么？

C C 的等价物是什么java io Serialized https docs oracle com javase 7 docs api java io Serializable html 有对序列化库的引用用 C 序列化数据结构 ht
干净构建 Java 命令行

我正在使用命令行编译使用 eclipse 编写的项目如下所示 javac file java 然后运行 java file args here 我将如何运行干净的构建或编译每当我重新编译时除非删除所有内容否则更改不会受到影响 cla
使用反射覆盖最终静态字段是否有限制？

在我的一些单元测试中我在最终静态字段上的反射中遇到了奇怪的行为下面是说明我的问题的示例我有一个基本的 Singleton 类其中包含一个 Integer public class BasicHolder private static
如何将双精度/浮点四舍五入为二进制精度？

我正在编写对浮点数执行计算的代码的测试不出所料结果很少是准确的我想在计算结果和预期结果之间设置一个容差我已经证实在实践中使用双精度在对最后两位有效小数进行四舍五入后结果始终是正确的但是usually四舍五入最后一位小数后
CamcorderProfile.videoCodec 返回错误值

根据docs https developer android com reference android media CamcorderProfile html 您可以使用CamcorderProfile获取设备默认视频编解码格式然后将其

随机推荐

如何使用 PyQt5 在同一窗口中更改 UI？

我刚刚开始使用 PyQt5 我一直在尝试完成一项看似非常简单的任务但无法获得足够的信息经过一番谷歌搜索后我已经能够关闭一个窗口并在加载另一个 UI 的情况下启动另一个窗口但这不是我想要在这里做的我想在同一个窗口中切换用户界面我
如何使用 Swing 创建可扩展面板？

我想创建一个展开和折叠面板的列表如下图所示我还没有找到任何与此相关的 Swing 组件所以我开始创建类似的东西我尝试将按钮一个放在另一个下面以填充可用宽度但实际上不起作用我只能看到最后添加的一个 JPanel panel ne
Xcode Instruments 8.3 显示设置按钮丢失

在最新版本的 Instruments 8 3 中显示设置按钮已被删除并由文件 gt 记录设置对话框取代使用分配工具时我现在无法再激活自动快照因为该选项已从右侧面板中消失并且记录选项对话框仅显示分配工具的值而不显示虚拟机跟踪器的
如果数学移至内联函数，为什么 C++ 舍入行为（对于编译时常量）会发生变化？

考虑以下函数 static inline float Eps const float x const float eps std numeric limits
如何关闭 Eclipse 上的项目方面？

我试图解决 Eclipse 中的问题所以我单击了 Propreties gt Project Facets gt Click on the link 现在我有了新的看法Project Facets还有很多错误我不知道如何返回上一步并取消
核心数据，一对多子对象排序

所以假设我有一个父母孩子的商店父母与孩子有一对多的关系 parent children 并且他们都有名字现在在初始获取父母时我可以指定一个排序描述符以按名字顺序返回它们但是如何按顺序请求孩子呢如果我执行 parent chil
如何让TextBox失去焦点？

怎么做TextBox当用户触摸时失去焦点并隐藏屏幕键盘Enter虚拟钥匙 private void TheName KeyDown object sender KeyRoutedEventArgs e var tb sender as Te
Android：连接并打印到 Bixolon SPP-R200

我想打印到Bixolon SPP R200据我所知它是更容易使用 Android 设置的移动蓝牙打印机之一但是我不知道如何开始我想首先我必须通过蓝牙连接到打印机我假设为此目的我求助于本机 Android 蓝牙 API 我可能需要某种
Rails 3.1：accepts_nested_attributes_for 和 has_one 关联 - 不起作用？

我试图在 has one 关联模型上使用 Accepts nested attributes for 但绝对无处可去我有两个模型一个用户和一个位置一位用户有一个位置 class User lt ActiveRecord Base cu
登录管理页面后，Django 服务器立即停止

单击登录按钮后立即尝试登录 django 管理页面 django 服务器停止 Django 新手尝试使用 venv 在虚拟环境中创建项目这些是我所做的以下步骤 1 创建一个名为api的文件夹 2 使用创建虚拟环境python m venv
使用 Linq to Entities 在一项操作中获取 COUNT 和 SKIP TAKE

我在 Linq to Entities 支持的数据访问层中有一个数据调用该数据访问层旨在进行分页调用在此过程中我需要选择数据的子集例如 50 行但还要获取所有匹配项的计数以了解需要分页的总匹配项数目前我正在执行以下操作 va
“+”、“*”、“!”是什么意思？分支名称旁边的符号在 VS Code 中表示吗？

在 VS Code 中有一个在我的分行名称旁边签名这意味着什么检查源代码揭示表示您有未暂存的更改尚未添加表示您已分阶段进行更改已添加但未提交表示未合并的冲突还可以有Rebasing 在最后当你处于变基过程中时所以如
LINQ: ...Where(x => x.Contains(以“foo”开头的字符串))

给定以下类的集合 public class Post public IList
使用 python 导入我的数据库连接

是否可以使用我的数据库凭据创建一个 py 文件来连接到 MySQL 数据库 Ex con ip 0 0 0 0 username root password pswd database test 然后在另一个文件上使用这个文件 like i
condition_variable.notify_all 是否应该被互斥锁覆盖？

我已经实现了一个类它允许我将线程与条件变量同步我发现关于 notify all 应该在锁内还是在锁外完成的冲突信息我发现了两种方式构建的例子首先释放锁的理由是为了防止等待线程在被通知释放后立即阻塞在互斥锁上反对首先释放锁的论点是等
SQL Server 在多个列上进行透视

我正在尝试在多个列上进行旋转我正在使用 SQL Server 2008 这是我迄今为止尝试过的 CREATE TABLE t id int Rscd varchar 10 Accd varchar 10 position int INSE
跨站点将 DisplayFormatAttribute.ConvertEmptyStringToNull 的默认值设置为 false

属性 DisplayFormatAttribute ConvertEmptyStringToNull 的默认值为 true 我想将整个站点的默认值设置为 false 或者按类或页面也可以有没有办法可以做到这一点这样我就不需要用以下内容装
Python 中带有字符串的 3D 散点图

我尝试在 Python 中绘制 3D 散点图其中 x 和 y 上有字符串类别即神经网络的激活函数和求解器 z 轴上有浮点数即 NN 的准确度分数以下示例引发错误 ValueError 无法将字符串转换为浮点数 str1 我按照此文档
VueJS v-bind：背景图像的样式：url()

根据VueJS docs div div 我尝试过几种模式 div div div div div div 但结果对于 HTML 无效style属性有任何想法吗尝试其他模式后这是有效的模式
使用 OCR 从图像文件读取文本的 API

我正在寻找 Java 中 OCR 光学字符识别的示例代码或 API 名称使用它我可以从图像文件中提取所有文本无需将其与我使用下面的代码所做的任何图像进行比较 public class OCRTest static String STR

使用 OCR 从图像文件读取文本的 API

使用 OCR 从图像文件读取文本的 API 的相关文章

随机推荐

热门标签