安装需要的包
# pip install pytesseract
# pip install Pillow
# 安装OCR环境
# 下载exe安装文件
# https://digi.bib.uni-mannheim.de/tesseract/
# 下载需要的版本,安装时下载需要的语言
# 安装完成后添加全局环境遍历 path
核心代码如下
from PIL import Image
import io
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'安装OCR的地址\\tesseract.exe'
#img 为Image图片
#lan为获取的语言
#pytesseract.get_languages(config='') 获取下载的所有语言
#这里拼接了所有语言
try:
ling= pytesseract.get_languages(config='')
lan=''
for k in ling:
lan=f'{lan}+{k}'
text = pytesseract.image_to_string(img, lang=lan)
return text
except :
raise Exception("错误信息!")
如有好的方法还请多多指教
手机扫一扫
移动阅读更方便
你可能感兴趣的文章