python实现图片提取文字功能
阅读原文时间:2023年09月02日阅读:6

安装需要的包

# pip install pytesseract

# pip install Pillow

# 安装OCR环境

# 下载exe安装文件

# https://digi.bib.uni-mannheim.de/tesseract/

# 下载需要的版本,安装时下载需要的语言

# 安装完成后添加全局环境遍历 path 

核心代码如下

from PIL import Image
import io
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'安装OCR的地址\\tesseract.exe'
#img 为Image图片
#lan为获取的语言
#pytesseract.get_languages(config='') 获取下载的所有语言
#这里拼接了所有语言

try:
ling= pytesseract.get_languages(config='')
lan=''
for k in ling:
lan=f'{lan}+{k}'
text = pytesseract.image_to_string(img, lang=lan)

return text

except :

raise Exception("错误信息!")

如有好的方法还请多多指教