This commit is contained in:
zy123 2024-11-18 09:19:47 +08:00
parent c93261207d
commit 4e0b7dc1cf

View File

@ -276,7 +276,7 @@ def get_technical_requirements(file_path,invalid_path):
任务解析采购文件提取采购需求并以JSON格式返回 任务解析采购文件提取采购需求并以JSON格式返回
要求与指南 要求与指南
1. 精准定位文件内容以markdown格式组织请运用文档理解能力找到文件中的采购需求部分若有采购清单请直接根据采购清单上的货物或系统名称给出结果 1. 精准定位请运用文档理解能力找到文件中的采购需求部分若有采购清单请直接根据采购清单上的货物或系统名称给出结果
2. 采购目标采购目标通常有硬件如设备货物和软件如系统软件应用APP一次采购活动可能同时包含这两种类型对于工程类的施工建设采购需求无需提取 2. 采购目标采购目标通常有硬件如设备货物和软件如系统软件应用APP一次采购活动可能同时包含这两种类型对于工程类的施工建设采购需求无需提取
3. 非清单形式处理若未出现采购清单则从表格或文字中摘取采购信息 3. 非清单形式处理若未出现采购清单则从表格或文字中摘取采购信息
4. 系统归属一些采购活动可能将采购目标划分为若干系统和货物每个系统可能包含若干货物则将这些货物名称作为该系统的二级键系统可以只包含总体'系统功能'而无货物 4. 系统归属一些采购活动可能将采购目标划分为若干系统和货物每个系统可能包含若干货物则将这些货物名称作为该系统的二级键系统可以只包含总体'系统功能'而无货物
@ -292,7 +292,7 @@ def get_technical_requirements(file_path,invalid_path):
5.不包含'说明''规格''技术参数'等列内容仅返回采购的货物或系统或模块名称 5.不包含'说明''规格''技术参数'等列内容仅返回采购的货物或系统或模块名称
特殊情况处理 特殊情况处理
若同一层级如同一系统中下存在同名但采购要求不同的货物'货物名-编号'区分编号从1递增规避重复键名的问题 若同一层级如同一系统中下存在同名但采购要求不同的货物'货物名-编号'区分编号从1递增规避重复键名的问题否则无需添加编号
示例输出1普通系统货物类采购 示例输出1普通系统货物类采购
{{ {{
@ -431,8 +431,9 @@ def test_all_files_in_folder(input_folder, output_folder):
except Exception as e: except Exception as e:
print(f"处理文件 {file_path} 时出错: {e}") print(f"处理文件 {file_path} 时出错: {e}")
#TODO:提示词限制序号生成 交换机-1
#TODO:对于软件系统功能,提取偏离表的时候额外处理 包头市公安支队机动车查验监管系统招标文201907_procurement.pdf #TODO:对于软件系统功能,提取偏离表的时候额外处理 包头市公安支队机动车查验监管系统招标文201907_procurement.pdf
#TODO: 提示词限制最多两层 eg 妇幼、陕西 #TODO: 提示词限制最多两层防止,嵌套过多,代码也要做处理,'系统'下的最多只有一层 eg 妇幼、陕西
# { # {
# "采购需求": { # "采购需求": {
# "查验视频监管软件系统": { # "查验视频监管软件系统": {
@ -443,10 +444,28 @@ def test_all_files_in_folder(input_folder, output_folder):
# "业务视频应用": { # "业务视频应用": {
# "视频回放": {} # "视频回放": {}
# }, # },
#{ 对于这种误判-1脚本中也要处理一下。
# "采购需求": {
# "高清数字枪机-1": {},
# "枪机支架-1": {},
# "高清数字半球机-1": {},
# "网络硬盘录像机-1": {},
# "监控硬盘-1": {},
# "交换机-1": {},
# "交换机-2": {},
# "监视器-1": {},
# "电源线-1": {},
# "网线-1": {},
# "水晶头-1": {},
# "PVC线槽-1": {},
# "辅料-1": {},
# "安装调试-1": {}
# }
# }
if __name__ == "__main__": if __name__ == "__main__":
start_time=time.time() start_time=time.time()
# truncate_file="C:\\Users\\Administrator\\Desktop\\fsdownload\\469d2aee-9024-4993-896e-2ac7322d41b7\\ztbfile_procurement.docx" # truncate_file="C:\\Users\\Administrator\\Desktop\\fsdownload\\469d2aee-9024-4993-896e-2ac7322d41b7\\ztbfile_procurement.docx"
truncate_file=r"C:\Users\Administrator\Desktop\货物标\output1\招标文件(107国道)_procurement.pdf" truncate_file=r"C:\Users\Administrator\Desktop\new招标文件\货物标\广水市公安局音视频监控系统设备采购项目.pdf"
# invalid_path="D:\\flask_project\\flask_app\\static\\output\\output1\\e7dda5cb-10ba-47a8-b989-d2993d34bb89\\ztbfile.pdf" # invalid_path="D:\\flask_project\\flask_app\\static\\output\\output1\\e7dda5cb-10ba-47a8-b989-d2993d34bb89\\ztbfile.pdf"
# truncate_file="D:\\flask_project\\flask_app\\static\\output\\output1\\e7dda5cb-10ba-47a8-b989-d2993d34bb89\\ztbfile_procurement.docx" # truncate_file="D:\\flask_project\\flask_app\\static\\output\\output1\\e7dda5cb-10ba-47a8-b989-d2993d34bb89\\ztbfile_procurement.docx"
# output_folder="C:\\Users\\Administrator\\Desktop\\货物标\\output1\\tmp" # output_folder="C:\\Users\\Administrator\\Desktop\\货物标\\output1\\tmp"