Skip to content

Conversation

Kaze-2715
Copy link

出于大量爬取漏洞数据库数据的需求,添加了大量爬取的功能:
原有数据库在访问大量数据时服务器会拒绝请求,因此使用循环来分批次爬取,实测每次100条,间隔1秒时,服务器不会拦截,成功爬取到了49000条数据
出于实际应用中优先爬取最新数据的需求,添加了爬取最新数据的逻辑:
先进行一次请求获取数据总数,再使用总数来构建url达到倒序爬取的目的

大二学生,第一次提PR,难免会有错漏之处,敬请您批评指正🙏
联系方式:
email: zhaofangming@mail.nwpu.edu.cn
qq: 1983517529

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant