72 lines
3.4 KiB
Python
72 lines
3.4 KiB
Python
import json
|
||
import re
|
||
#这个字典可能有嵌套,你需要遍历里面的键名,对键名作判断,而不是键值,具体是这样的:如果处于同一层级的键的数量>1并且键名全由数字或点号组成。那么就将这些序号键名全部删除,重新组织成一个字典格式的数据,你可以考虑用字符串列表来保持部分平级的数据
|
||
#对于同级的键,如果数量>1且键名都统一,那么将键名去掉,用列表保持它们的键值
|
||
#对于同一个字典中,可能存在若干键值对,若它们的键值都是""或者"/" 你就将它们的键值删去,它们的键名用字符串列表保存
|
||
|
||
#zbtest20也有问题
|
||
def contains_number_or_index(key, value):
|
||
# 判断值是否是数字或数字字符串
|
||
is_number = isinstance(value, (int, float)) or (isinstance(value, str) and value.isdigit())
|
||
# 判断键是否包含 "序号"
|
||
contains_index = '序号' in key
|
||
# 判断值中是否包含数字
|
||
contains_digit = isinstance(value, str) and re.search(r'\d+', value)
|
||
# 判断值中是否包含中文字符
|
||
contains_chinese = isinstance(value, str) and re.search(r'[\u4e00-\u9fff]', value)
|
||
# 如果值中包含数字但也有中文字符,则保留(返回 False)
|
||
if contains_digit and contains_chinese:
|
||
return False
|
||
# 如果值是数字或包含数字,且不包含中文字符,或者键包含 "序号",返回 True
|
||
return is_number or contains_index or contains_digit
|
||
|
||
#对于同一个字典中,可能存在若干键值对,若它们的键值都是""或者"/" 你就将它们的键值删去,它们的键名用字符串列表保存
|
||
#如果键名是"序号"或者键值中全是数字,删去序号
|
||
def preprocess_dict(data):
|
||
if isinstance(data, dict):
|
||
if len(data) > 1:
|
||
# 检查是否所有值都是 "" 或 "/"
|
||
if all(v == "" or v == "/" for v in data.values()):
|
||
return list(data.keys())
|
||
else:
|
||
processed = {}
|
||
for k, v in data.items():
|
||
if not contains_number_or_index(k, v):
|
||
processed_v = preprocess_dict(v)
|
||
if processed_v != "": # 只添加非空值
|
||
processed[k] = processed_v
|
||
return processed
|
||
else:
|
||
return {k: preprocess_dict(v) for k, v in data.items()}
|
||
elif isinstance(data, list):
|
||
return [preprocess_dict(item) for item in data]
|
||
else:
|
||
return data
|
||
|
||
|
||
# 测试代码
|
||
#TODO:同一层全部都是数字才成功删除,没需求了
|
||
input_data = {
|
||
"符合性审查": {
|
||
"说明": "1ha",
|
||
"www":"哈哈",
|
||
"审查标准": [
|
||
{
|
||
"序号": 1,
|
||
"内容": "投标总报价超过项目(分包)预算金额或最高限价的;"
|
||
},
|
||
{
|
||
"序号": 2,
|
||
"内容": "《投标书》、《法定代表人授权书》、《开标一览表(含明细)》未提供或不符合招标文件要求的;"
|
||
},
|
||
{
|
||
"序号": 3,
|
||
"内容": "工期(服务期限)、质保期不符合招标文件要求的;"
|
||
},
|
||
]
|
||
}
|
||
}
|
||
pred=preprocess_dict(input_data)
|
||
print(json.dumps(pred, ensure_ascii=False, indent=4))
|
||
# processed_data = process_dict(pred)
|
||
# print(json.dumps(processed_data, ensure_ascii=False, indent=4)) |