zbparse/flask_app/PaddleOCR/python_api/demo3.py

#    demo1.py ：演示OCR基础功能
#    demo2.py ：演示可视化接口
# 👉 demo3.py ：演示OCR文段后处理（段落合并）接口

from PPOCR_api import GetOcrApi
from PPOCR_visualize import visualize  # 可视化
from tbpu import GetParser  # 获取排版解析器的接口

import os

# 测试图片路径
TestImagePath = os.path.join(os.path.dirname(os.path.abspath(__file__)), "test.jpg")

# 初始化识别器对象，传入 PaddleOCR-json 引擎路径。
ocr = GetOcrApi(r"Your Path/PaddleOCR-json.exe")

if ocr.getRunningMode() == "local":
    print(f"初始化OCR成功，进程号为{ocr.ret.pid}")
elif ocr.getRunningMode() == "remote":
    print(f"连接远程OCR引擎成功，ip：{ocr.ip}，port：{ocr.port}")
print(f"\n测试图片路径：{TestImagePath}")

# OCR识别图片，获取文本块
getObj = ocr.run(TestImagePath)
ocr.exit()  # 结束引擎子进程
if not getObj["code"] == 100:
    print("识别失败！！")
    exit()
textBlocks = getObj["data"]  # 提取文本块数据

# OCR原始结果的可视化Image
img1 = visualize(textBlocks, TestImagePath).get(isOrder=True)
ocr.exit()  # 结束引擎子进程
print("========== 原始结果 ==========")
ocr.printResult(getObj)

# 获取排版解析器对象
parser = GetParser("multi_para")
# 传入OCR结果列表，返回新的文本块列表
textBlocksNew = parser.run(textBlocks)
# 注意，处理后原列表 textBlocks 的结构可能被破坏，不要再使用原列表（或先深拷贝备份）。
print("========== 整理后结果 ==========")
getObj["data"] = textBlocksNew
ocr.printResult(getObj)

# 可视化 后处理结果的可视化Image
img2 = visualize(textBlocksNew, TestImagePath).get(isOrder=True)
print("显示可视化结果。左边是原始结果，右边是合并自然段后的结果。")
visualize.createContrast(img1, img2).show()  # 左右拼接图片并展示