使用Python调用百度OCR
- 注册/登录百度智能云
- 创建应用
- 安装python SDK
- 接口说明
- 代码实现(本地图片)
- 代码实现(使用url上的图片并使用可选参数)
注册/登录百度智能云
注册请点击
登录请点击
创建应用
注册登录百度云账号之后,点击创建应用,可以得到AppID 、API Key、Secret Key三个信息后,我们就可以在之后代码里使用它调用接口了。
安装python SDK
如果MAC安装了pip3
则终端使用:sudo pip3 install baidu-aip
如果没有安装pip或者安装后不知道导入位置或者怎么导入pycharm(这里我使用pycharm编码)
则参考我的之前文章:MAC上安装完pip3后,下载的包位置以及如何导入pycharm
接口说明
![在这里插入图片描述](https://img-blog.csdnimg.cn/20201130214720904.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyMTczMDM4,size_16,color_FFFFFF,t_70)
![接口说明](https://img-blog.csdnimg.cn/20201130212701660.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyMTczMDM4,size_16,color_FFFFFF,t_70)
![在这里插入图片描述](https://img-blog.csdnimg.cn/20201130212735840.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQyMTczMDM4,size_16,color_FFFFFF,t_70)
如果需要可选参数:
添加
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"
调用变为:
""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)
代码实现(本地图片)
导入baidu-api后进行编码:
如果识别的图片在本地,读取图片时需要图片在本地的绝对路径
编码如下:
from aip import AipOcr
"""定义常量(写自己注册后百度发给你的)"""
APP_ID = '23039530'
API_KEY = 'oSgzKw2W660W9RGKAoUPTky4'
SECRET_KEY = '填写自己的key'
"""初始化对象"""
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
"""读取图片"""
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('/Users/donghanning/Desktop/OCR/test.jpg')
"""调用通用文字识别接口, 识别本地图像"""
result = client.basicGeneral(image)
print(result)
print("*******************************************")
# 打印每行文字
for item in result['words_result']:
print(item['words'])
print("*******************************************")
# 将每行文字拼接成一个整体
string_text = ""
for item in result['words_result']:
string_text += item['words']
print('string_text:', string_text)
代码实现(使用url上的图片并使用可选参数)
from aip import AipOcr
"""定义常量"""
APP_ID = '23039530'
API_KEY = 'oSgzKw2W660W9RGKAoUPTky4'
SECRET_KEY = '填写自己的key'
"""初始化对象"""
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
"""读取图片"""
url="https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1606753289137&di=51dbc28388dc6f2fd4966795988ad624&imgtype=0&src=http%3A%2F%2Fc.hiphotos.baidu.com%2Fzhidao%2Fwh%3D450%2C600%2Fsign%3D90078d22b0de9c82a630f18b59b1ac3c%2Fe850352ac65c1038511ca7d9b1119313b07e894e.jpg"
"如果有可选参数"
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"
"""调用通用文字识别接口, 识别本地图像"""
result = client.basicGeneralUrl(url,options)
print(result)
print("*******************************************")
# 打印每行文字
for item in result['words_result']:
print(item['words'])
print("*******************************************")
# 将每行文字拼接成一个整体
string_text = ""
for item in result['words_result']:
string_text += item['words']
print('string_text:', string_text)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)