python3 获取header和data-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

python3 获取header和data

阅读量：5287 次

发布时间：2019-06-14

本文共 960 字，大约阅读时间需要 3 分钟。

一、headers的获取

就以博客园的首页为例：http://www.cnblogs.com/

打开网页，按下F12键，如下图所示：

点击下方标签中的Network，如下：

之后再点击下图所示位置：

找到红色下划线位置所示的标签并点击，在右边的显示内容中可以查看到所需要的headers信息。

一般只需要添加User-Agent这一信息就足够了，headers同样也是字典类型；

user_agent = 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36' headers = { 'User-Agent' : user_agent }

二、data获取

以博客园登录界面为例：http://passport.cnblogs.com/user/signin?ReturnUrl=http%3A%2F%2Fwww.cnblogs.com%2F

按下F12键，如下图所示：

点击Network，然后随意输入用户名和密码，点击登录可以看到如下图所示：

博客园登录的data信息:

data={    input1:"*******",    input2:"*******", remember:"false" }

以电驴下载网站为例：http://secure.verycd.com/signin?error_code=emptyInput&continue=http://www.verycd.com/

data信息在From Data标签中：

data={    username:"****",    password:"****", continue:"http://www.verycd.com/" fk:" ", save_cookie:1, login_submit:"登录" }

每一个登录网站的data信息不一定一样，都需要进入网页确定。

好啦，今天就到这了~明天介绍一个实例：如何爬取糗百的段子。

转载时注明原作者出处：|

转载于:https://www.cnblogs.com/xinguichun/p/10993800.html

你可能感兴趣的文章

[禅悟人生]在劳动中品味幸福

正则表达式

刘润《五分钟商学院》思维导图笔记 - 商业篇

Unity3d 序列帧动画

分布式存储ceph——（6）ceph 讲解

thinkphp 和 laravel使用sql语句操作db和源码浅析

HR招聘_(五)_招聘方法论（电话邀约）

读Zepto源码之操作DOM

重启系统调用探究（转）

groupby一个as_index参数解释

获取距今多少年

深入了解当前ETL的一些基本技术

Gogs (Go git server) 使用笔记

js中的时间显示

进制转换之二进制与十进制转换

使用 GitHub+Hexo 搭建个人博客

Android 性能测试优质实践汇总

php简易页面内调试技巧

R语言之数据可视化 - R的绘图系统3 - Lattice 绘图系统

《20171130-构建之法：现代软件工程-阅读笔记4》

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-11-26 13:24:59 当前IP: 3.149.214.223 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我