使用Python调用百度OCR

2023-05-16

使用Python调用百度OCR

注册/登录百度智能云
创建应用
安装python SDK
接口说明
代码实现（本地图片）
代码实现（使用url上的图片并使用可选参数）

注册/登录百度智能云

注册请点击
登录请点击

创建应用

注册登录百度云账号之后，点击创建应用，可以得到AppID 、API Key、Secret Key三个信息后，我们就可以在之后代码里使用它调用接口了。

安装python SDK

如果MAC安装了pip3
则终端使用：sudo pip3 install baidu-aip
如果没有安装pip或者安装后不知道导入位置或者怎么导入pycharm（这里我使用pycharm编码）
则参考我的之前文章：MAC上安装完pip3后，下载的包位置以及如何导入pycharm

接口说明

在这里插入图片描述

接口说明
在这里插入图片描述
如果需要可选参数：
添加

options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

调用变为：

""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)

代码实现（本地图片）

导入baidu-api后进行编码：
如果识别的图片在本地，读取图片时需要图片在本地的绝对路径
编码如下：

from aip import AipOcr

"""定义常量（写自己注册后百度发给你的）"""
APP_ID = '23039530'
API_KEY = 'oSgzKw2W660W9RGKAoUPTky4'
SECRET_KEY = '填写自己的key'

"""初始化对象"""
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

"""读取图片"""
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('/Users/donghanning/Desktop/OCR/test.jpg')

"""调用通用文字识别接口, 识别本地图像"""
result = client.basicGeneral(image)
print(result)
print("*******************************************")
# 打印每行文字
for item in result['words_result']:
    print(item['words'])

print("*******************************************")

# 将每行文字拼接成一个整体
string_text = ""
for item in result['words_result']:
    string_text += item['words']
print('string_text:', string_text)

代码实现（使用url上的图片并使用可选参数）

from aip import AipOcr

"""定义常量"""
APP_ID = '23039530'
API_KEY = 'oSgzKw2W660W9RGKAoUPTky4'
SECRET_KEY = '填写自己的key'

"""初始化对象"""
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

"""读取图片"""
url="https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1606753289137&di=51dbc28388dc6f2fd4966795988ad624&imgtype=0&src=http%3A%2F%2Fc.hiphotos.baidu.com%2Fzhidao%2Fwh%3D450%2C600%2Fsign%3D90078d22b0de9c82a630f18b59b1ac3c%2Fe850352ac65c1038511ca7d9b1119313b07e894e.jpg"

"如果有可选参数"
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

"""调用通用文字识别接口, 识别本地图像"""
result = client.basicGeneralUrl(url,options)
print(result)
print("*******************************************")
# 打印每行文字
for item in result['words_result']:
    print(item['words'])

print("*******************************************")

# 将每行文字拼接成一个整体
string_text = ""
for item in result['words_result']:
    string_text += item['words']
print('string_text:', string_text)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

OCR

调用百度

使用Python调用百度OCR 的相关文章

在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
OpenCV Python cv2.mixChannels()

我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
Python pickle：腌制对象不等于源对象

我认为这是预期的行为但想检查一下也许找出原因因为我所做的研究结果是空白我有一个函数可以提取数据创建自定义类的新实例然后将其附加到列表中该类仅包含变量然后我使用协议 2 作为二进制文件将该列表腌制到文件中稍后我重新运行脚本
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
如何在ipywidget按钮中显示全文？

我正在创建一个ipywidget带有一些文本的按钮但按钮中未显示全文我使用的代码如下 import ipywidgets as widgets from IPython display import display button wid
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
Jupyter Notebook 内核一直很忙

我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常但是我无法运行 python 笔记本内核被创建它也连接但它始终显示黑圈忙碌符号防火墙或防病毒软件没有问题我尝试过禁用两者我也无法
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P

随机推荐

64位intel汇编风格往bss段中的数组放值

span class token keyword extern span printf span class token punctuation span section span class token punctuation span
Ubuntu在线配置：golang调用python环境

Anolis amp amp CentOS配置 xff1a Anolis和CentOS配置 xff1a golang调用python环境 Ubuntu离线配置 xff1a Ubuntu离线配置 xff1a golang调用python环境
【string 与 char】C++ 中string与char

C 43 43 中string类的定义如下 xff1a span class token comment A string of 64 c char span span class token keyword typedef span ba
Ubuntu16.04 登陆完后出现蓝屏

解决方法 xff1a 问题分析启动 Ubuntu 可以进入登录界面 xff0c 说明系统是可以运行起来的没有发生大块的核心数据损坏 xff0c linux 系统一般都可以修复 xff0c 一定要淡定于是开始放狗 xff08 google
招聘会岗位筛选爬虫——广州市高校毕业生就业指导中心（广州市高指中心）

2020 09 21更新 xff1a 目前该网站已实现此功能 xff1a 为什么爬虫 xff1f 由于没有筛选功能 xff0c 导致获取相关想要的信息费时费力目标网站 xff1a 广州市高校毕业生就业指导中心的某个现场招聘会以 2019
Access to from origin ‘null‘ has been blocked by CORS policy: No ‘Access-Control-Allow-Origin‘ heade

Access to XMLHttpRequest at span class token string 39 http localhost 8080 postgres mvt source 834 428 10 39 span from o
[实验一] 选择器

该个栏目的博客都是基于南京大学的数字逻辑与计算机组成的课程设计 xff0c 方便以后进行总结归纳而准备的这次实验是实验一 xff1a 选择器设计一个简单的选择器 xff0c 介绍一些常用的多路选择器的设计方法 Verilog语言中的al
VMware虚拟机中安装的Linux系统无法识别U盘解决方法

文章目录 1 问题描述2 解决方法3 参考文献 1 问题描述如图1所示 xff0c 在VMware安装的Linux系统 xff08 Ubuntu 无法读取U盘图 1 U盘读取失败 2 解决方法原因在于所用的U盘为3 0接口 xff0c
解决error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools"两个方法

简述在Windows下的pycharm安装出现 Microsoft Visual C 43 43 14 0 is required Get it with 34 Microsoft Visual C 43 43 Build Tools的解
ubuntu 18.04源码安装mysql 5.7.18

一安装依赖包 sudo apt update sudo apt install cmake bison libncurses5 dev build essential 二下载 mysql 5 7 18源码源码传送门选择那个包含bo
什么叫做装箱和拆箱?一看就懂系列

有很多同学对与装箱和拆箱还是有点搞不太明白首先讲一下概念 xff1a 1 装箱指的是把值类型转化为引用类型 2 拆箱当然指的就是把引用类型转化为值类型估计很多同学可能还分不清哪些是属于引用类型和值类型这个就需要自己去强化记忆一下了光
java 和javascript的区别？你是否还在把他们混为一谈呢

1 javascript是基于对象的 xff0c 它是一种脚本语言 xff0c 是一种基于对象和事件驱动的编程语言 xff0c 因而它本身提供了非常丰富的内部对象供设计人员使用而Java是面向对象的 xff0c 即Java是一种真正的面向
vs2019智能提示设置为中文

官网修改中文提示地址 xff1a https docs microsoft com zh cn dotnet core install localized intellisense 1 去官网下载intellisense语言包下载链接 x
.net中的定时任务

FluentScheduler是什么 xff1f FluentScheduler是 net中的任务调度框架 xff0c 也就是你如果想在 net程序跑一段代码 xff0c 同时又不影响主程序的运行时就可以使用FluentScheduler
实用的Visual Studio插件

打开Visual Studio 扩展管理扩展安装自己需要的插件 01 CodeMaid CodeMaid快速整理代码文件 xff0c 规范你的代码 xff0c 提高代码阅读体验代码自动对齐 xff0c 格式化代码 xff08 ps x
mysql 数据库信息探索

mysql 数据库信息探索 xff08 1 xff09 查询数据库的表数量 SELECT COUNT TABLES table schema FROM information schema TABLES GROUP BY table sch
.net 6 基于AspNetCoreRateLimit的限流

1 安装包 AspNetCoreRateLimit 2 在appsetting cs中加入IpRateLimiting配置节点 span class token comment 限流配置 span span class token stri
关于汉字转拼音并排序解决方案

使用方法 xff1a 写一个静态帮助类 span class token keyword public span span class token keyword static span span class token keyword c
.NET Core6 中使用AutoMapper

1 引入AutoMapper包 2 新建一个类 xff1a MappingProfile xff0c 类名自定义 xff0c 但是必须要继承 Profile类用于创建映射规则如图 xff1a Student为源数据 xff08 我这里是
使用Python调用百度OCR

使用Python调用百度OCR 注册登录百度智能云创建应用安装python SDK接口说明代码实现 xff08 本地图片 xff09 代码实现 xff08 使用url上的图片并使用可选参数 xff09 注册登录百度智能云注册请点击登

使用Python调用百度OCR

使用Python调用百度OCR

注册/登录百度智能云

创建应用

安装python SDK

接口说明

代码实现（本地图片）

代码实现（使用url上的图片并使用可选参数）

使用Python调用百度OCR 的相关文章

随机推荐

热门标签