md编著

2025-02-11 16:25:19 +08:00 · 2025-02-11 16:25:19 +08:00 · afed2c31d3
commit afed2c31d3
parent 667feb0d7e
1 changed files with 72 additions and 2 deletions
--- a/README.md
+++ b/README.md
@ -49,13 +49,16 @@ requirements.txt一般无需变动，除非代码中使用了新的库，也要
 **如何本地启动本项目：**

 1. requirements.txt里的环境要配好
-2. .env环境配好 （一般不需要在电脑环境变量中额外配置了）
-
+   conda create -n zbparse python=3.8
+   conda activate zbparse
+   pip install -r requirements.txt
+2. .env环境配好 （一般不需要在电脑环境变量中额外配置了，但是要在Pycharm中安装插件，使得项目能将env中的环境变量配置到系统环境变量中！！！）
 3. 点击下拉框，Edit configurations

 ![1](md_files/11.png)

 	设置run_serve.py为启动脚本![1](md_files/10.png)
+	注意这里的working directory要设置到最外层文件夹，而不是flask_app！！！

 4. postman打post请求测试：

@ -70,11 +73,78 @@ body:
  "zb_type":2

 }
+file_url如何获取：[OSS管理控制台](https://oss.console.aliyun.com/bucket/oss-cn-wuhan-lr/bid-assistance/object?path=test%2F)
+
+bid-assistance/test 里面找个文件的url，推荐'094定稿-湖北工业大学xxx'
+注意这里的url地址有时效性，要经常重新获取新的url



 ## flask_app结构介绍

+### 项目中做限制的地方
+
+**大模型的限制**
+
+general/llm下的doubao.py 和通义千问long_plus.py
+**目前是linux和windows各部署一套，因此项目中的qps是对半的，即calls=?**
+
+1. 这是qianwen-long的限制（针对阿里qpm为1200，投标生成和解析对半分600，每秒就是10，又linux和windows服务器对半，就是5；）
+
+```
+@sleep_and_retry
+@limits(calls=5, period=1)  # 每秒最多调用4次
+def rate_limiter():
+    pass  # 这个函数本身不执行任何操作，只用于限流
+```
+
+2. 这是qianwen-plus的限制（针对tpm为1000万，每个请求2万tokens，那么linux和windows总的qps为8时，8x60x2=960<1000。）
+
+```
+@sleep_and_retry
+@limits(calls=4, period=1)  # 每秒最多调用4次
+def qianwen_plus(user_query, need_extra=False):
+    logger = logging.getLogger('model_log')  # 通过日志名字获取记录器
+```
+
+**重点！！**后续阿里扩容之后成倍修改这块**calls=?**
+
+如果不用linux和windows负载均衡，这里的calls也要乘2！！
+
+
+
+**接口的限制**
+
+1. start_up.py的def create_app()函数，限制了对每个接口同时100次请求。这里事实上不再限制了（因为100已经足够大了），默认限制做到大模型限制这块。
+
+```
+app.connection_limiters['upload'] = ConnectionLimiter(max_connections=100)
+    app.connection_limiters['get_deviation'] = ConnectionLimiter(max_connections=100)
+    app.connection_limiters['default'] = ConnectionLimiter(max_connections=100)
+    app.connection_limiters['judge_zbfile'] = ConnectionLimiter(max_connections=100)
+```
+
+2. ConnectionLimiter.py以及每个接口上的装饰器，如
+
+   ```
+   @require_connection_limit(timeout=1800)
+   
+   def zbparse():  
+   ```
+
+
+   这里限制了每个接口内部执行的时间，暂时设置到了30分钟！（不包括排队时间）超时就是解析失败
+
+
+
+**后端的限制：**
+
+目前后端发起招标请求，如果发送超过100（max_connections=100）个请求，我这边会排队后面的请求，这时后端的计时器会将这些请求也视作正在解析中，事实上它们还在排队等待中，这样会导致在极端情况下，新进的解析文件速度大于解析的速度，排队越来越长，后面的文件会因为等待时间过长而直接失败，而不是'解析失败'。
+
+	
+
+
+
 ### general

 是公共函数存放的文件夹，llm下是各类大模型，读取文件下是docx pdf文件的读取以及文档清理clean_pdf，去页眉页脚页码