进入后,看这做事,老多了。
笔墨识别也供应了不少,免费的就可以了。
根据提示,选择笔墨识别,同时创建一个新的运用。在管理运用里 会瞥见你创建的运用和运用对应的AK和SK
这是百度的示例
# encoding:utf-8import requestsimport base6439;''通用笔墨识别'''request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"# 二进制办法打开图片文件f = open('[本地文件]', 'rb')img = base64.b64encode(f.read())params = {"image":img}access_token = '[调用鉴权接口获取的token]'request_url = request_url + "?access_token=" + access_tokenheaders = {'content-type': 'application/x-www-form-urlencoded'}response = requests.post(request_url, data=params, headers=headers)if response: print (response.json())
2、调度软件界面
便是要把文本识别出来。但是这种Pdf不是那种。不知终极效果如何,试试再说吧。
3。创造一个问题,对图片进行读取时没按顺序,所在以天生时也应格式化。上一张图。
pix.writePNG(folder_path + '/' + 'images_%s.jpg' % pg) # 将图片写入指定的文件夹内
pix.writePNG(folder_path + '/' + 'images_%s.jpg' % "{0:03d}".format(pg)) # 将图片写入指定的文件夹内
改成三位数字。
这样就成功了。
这个样子好用。
好几天了。未完待。。觉得窗口式还不如无窗口式方便。