From 4e0b7dc1cfba00604d0fa2046d3414ad8d4bd65d Mon Sep 17 00:00:00 2001 From: zy123 <646228430@qq.com> Date: Mon, 18 Nov 2024 09:19:47 +0800 Subject: [PATCH] 11.18 --- flask_app/货物标/技术参数要求提取.py | 27 +++++++++++++++++++++++---- 1 file changed, 23 insertions(+), 4 deletions(-) diff --git a/flask_app/货物标/技术参数要求提取.py b/flask_app/货物标/技术参数要求提取.py index b79a0d6..6310397 100644 --- a/flask_app/货物标/技术参数要求提取.py +++ b/flask_app/货物标/技术参数要求提取.py @@ -276,7 +276,7 @@ def get_technical_requirements(file_path,invalid_path): 任务:解析采购文件,提取采购需求,并以JSON格式返回。 要求与指南: - 1. 精准定位:文件内容以markdown格式组织,请运用文档理解能力,找到文件中的采购需求部分,若有采购清单,请直接根据采购清单上的货物(或系统)名称给出结果。 + 1. 精准定位:请运用文档理解能力,找到文件中的采购需求部分,若有采购清单,请直接根据采购清单上的货物(或系统)名称给出结果。 2. 采购目标:采购目标通常有硬件(如设备、货物)和软件(如系统软件、应用APP),一次采购活动可能同时包含这两种类型。对于工程类的施工、建设采购需求,无需提取。 3. 非清单形式处理:若未出现采购清单,则从表格或文字中摘取采购信息。 4. 系统归属:一些采购活动可能将采购目标划分为若干系统和货物,每个系统可能包含若干货物,则将这些货物名称作为该系统的二级键;系统可以只包含总体'系统功能'而无货物。 @@ -292,7 +292,7 @@ def get_technical_requirements(file_path,invalid_path): 5.不包含'说明'、'规格'、'技术参数'等列内容,仅返回采购的货物或系统或模块名称。 特殊情况处理: - 若同一层级(如同一系统中)下存在同名但采购要求不同的货物,以'货物名-编号'区分,编号从1递增,规避重复键名的问题。 + 若同一层级(如同一系统中)下存在同名但采购要求不同的货物,以'货物名-编号'区分,编号从1递增,规避重复键名的问题;否则无需添加编号。 示例输出1,普通系统、货物类采购: {{ @@ -431,8 +431,9 @@ def test_all_files_in_folder(input_folder, output_folder): except Exception as e: print(f"处理文件 {file_path} 时出错: {e}") +#TODO:提示词限制序号生成 交换机-1 #TODO:对于软件系统功能,提取偏离表的时候额外处理 包头市公安支队机动车查验监管系统招标文201907_procurement.pdf -#TODO: 提示词限制最多两层 eg 妇幼、陕西 +#TODO: 提示词限制最多两层防止,嵌套过多,代码也要做处理,'系统'下的最多只有一层 eg 妇幼、陕西 # { # "采购需求": { # "查验视频监管软件系统": { @@ -443,10 +444,28 @@ def test_all_files_in_folder(input_folder, output_folder): # "业务视频应用": { # "视频回放": {} # }, +#{ 对于这种误判-1,脚本中也要处理一下。 +# "采购需求": { +# "高清数字枪机-1": {}, +# "枪机支架-1": {}, +# "高清数字半球机-1": {}, +# "网络硬盘录像机-1": {}, +# "监控硬盘-1": {}, +# "交换机-1": {}, +# "交换机-2": {}, +# "监视器-1": {}, +# "电源线-1": {}, +# "网线-1": {}, +# "水晶头-1": {}, +# "PVC线槽-1": {}, +# "辅料-1": {}, +# "安装调试-1": {} +# } +# } if __name__ == "__main__": start_time=time.time() # truncate_file="C:\\Users\\Administrator\\Desktop\\fsdownload\\469d2aee-9024-4993-896e-2ac7322d41b7\\ztbfile_procurement.docx" - truncate_file=r"C:\Users\Administrator\Desktop\货物标\output1\招标文件(107国道)_procurement.pdf" + truncate_file=r"C:\Users\Administrator\Desktop\new招标文件\货物标\广水市公安局音视频监控系统设备采购项目.pdf" # invalid_path="D:\\flask_project\\flask_app\\static\\output\\output1\\e7dda5cb-10ba-47a8-b989-d2993d34bb89\\ztbfile.pdf" # truncate_file="D:\\flask_project\\flask_app\\static\\output\\output1\\e7dda5cb-10ba-47a8-b989-d2993d34bb89\\ztbfile_procurement.docx" # output_folder="C:\\Users\\Administrator\\Desktop\\货物标\\output1\\tmp"