From ef682cc5a5f9f778ac0901fb52ca1e0c59d30f4b Mon Sep 17 00:00:00 2001 From: zhangsan <646228430@qq.com> Date: Thu, 22 Aug 2024 19:24:47 +0800 Subject: [PATCH] 8.22 --- README.md | 14 ++++++++++---- data.html | 1 - 2 files changed, 10 insertions(+), 5 deletions(-) delete mode 100644 data.html diff --git a/README.md b/README.md index a595c0c..dc5a602 100644 --- a/README.md +++ b/README.md @@ -1,11 +1,17 @@ -如何运行? +## 如何运行? + cd到项目根目录 pip install -r requirements.txt 安装所需依赖。 然后先运行scrape.py,再运行main_extraction是一个完整的流程。 -scrape.py脚本负责抓取(处罚信息公开表)网址,保存至txt文件中 -main_extraction.py负责读取txt文件中的url抓取网页内容,处理失败的url将保存至error_urls.txt中,成功的会添加到output_data*.xlsx中 +### 主要脚本 -标题网址提取.py 负责抓取决定书以及处罚信息公开表,保存至excel文件中 \ No newline at end of file +- scrape.py脚本负责抓取(处罚信息公开表)网址,保存至txt文件中 +- main_extraction.py负责读取txt文件中的url抓取网页内容,处理失败的url将保存至error_urls.txt中,成功的会添加到output_data*.xlsx中 +- 标题网址提取.py 负责抓取决定书以及处罚信息公开表,保存至excel文件中 + + + +联系方式:qq 646228430 \ No newline at end of file diff --git a/data.html b/data.html deleted file mode 100644 index 0ce4c1c..0000000 --- a/data.html +++ /dev/null @@ -1 +0,0 @@ -

行政处罚决定书文号

琼银保监罚决字〔202337

被处罚当事人

个人姓名

\

单位

名称

中国银行海南省分行\中国银行三亚分行\中国银行陵水支行\中国银行海口龙珠支行

法定代表人(主要负责人)姓名

林振闽\林公木\韩思光\李琳

主要违法违规事实(案由)

贷款管理不尽职

行政处罚依据

《中华人民共和国银行业监督管理法》四十

行政处罚决定

中国银行海南省分行罚款20万元;对中国银行三亚分行罚款35万元;对中国银行陵水支行罚款20万元;对中国银行海口龙珠支行罚款40万元

作出行政处罚决定的机关名称

海南银保监局

作出处罚决定的日期

20235月25

\ No newline at end of file