月度归档: 2024 年 2 月

18 篇文章

多线程与流量泛洪
多线程与流量泛洪 一、简介 并发操作:如果一个单核的CPU,是不存在严格意义上的并发,只是因为处理时间极短,所以感觉上时并发操作的 针对多核CPU,例如4核CPU严格意义上并发操作是4个 线程与进程 每一个应用程序,至少会有一个进程,并且拥有PID和独立的内存空间。 每一个进程,至少拥有一个线程,而县城并没有独立的内存空间 示例代码 import …
爬虫
爬虫 一、简介 搜索引擎:百度、谷歌、企业内部的知识库,某些项目专项数据爬取、专业的数据爬取 互联网:公网(不需要授权的情况下接可以浏览的内容,搜索引擎的重点),深网(需要授权才能够使用的内容),暗网(非正式渠道,无法使用常规手段访问) 爬取互联网的公开信息,但是正常情况下,也需要遵守一个规则:robots协议 二、基本原理 所有网页均是HTML,…
Requests库处理HTTP
Requests库处理HTTP 一、HTTP协议 1.请求类型 GET:用于通过指定URL地址访问 POST:URL地址+请求数据,将请求数据交给服务器 PUT:与POST类似,主要用于Restful风格,用于更新数据 DELETE:请求删除某个资源 2.响应类型 1XX:信息 2XX:正常 3XX:重定向 4XX:客户端错误 5XX:服务器端错误…