今天使用tesseract进行识别,跟着B站的视频写了如下代码
import pytesseract as pt
from PIL import Image
pt.pytesseract.tesseract_cmd = r"F:\Tesseract_ocr\tesseract.exe"
img = Image.open("01.jpg")
text = pt.image_to_string(img)
print(text)
B站的视频连接如下,谢谢这位up主!
Python 实现 OCR 识别提取图片文字,多语言支持,步骤简单小白也能学
但是运行的时候很奇怪,平时我只遇到报错和一直运行的情况,但是这一次控制台跳了一下,就只显示一个序号,以前的找不到了(用的是spyder,用过的朋友应该知道是什么意思,之前都是每一次的序号都会有)
然后我尝试换了一个识别的图片
之前的图片我随便截的,有点模糊
![在这里插入图片描述](https://img-blog.csdnimg.cn/2fb79f26d2fc41278f4b1a6e09708632.png#pic_center)
然后我就又随便截了一段,很清楚的
![在这里插入图片描述](https://img-blog.csdnimg.cn/f8a1cf4859694de6be3be25ce0c702f0.jpg#pic_center)
然后还改动了最后一行的text
print(text[0:3])
就成功了
不知道为什么,只写一个text就是不行,知道的大佬可以在评论区解释一下呀~
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)