Python3 默认提供了urllib库,可以爬取网页信息,但其中确实有不方便的地方,如:处理网页验证和Cookies,以及Hander头信息处理。
为了更加方便处理,有了更为强大的库 urllib3
和 requests
, 本节会分别介绍一下,以后我们着重使用requests
。
1. urllib3库的使用:
- 安装:通过使用pip命令来安装urllib3
pip install urllib3
- 简单使用:
import urllib3
import re
# 实例化产生请求对象
http = urllib3.PoolManager()
# get请求指定网址
url = "http://www.baidu.com"
res = http.request("GET",url)
# 获取HTTP状态码
print("status:%d" % res.status)
# 获取响应内容
data = res.data.decode("utf-8")
# 正则解析并输出
print(re.findall("
",data))
- 其他设置: 增加了超时时间,请求参数等设置
import urllib3
import re
url = "http://www.baidu.com"
http = urllib3.PoolManager(timeout = 4.0) #设置超时时间
res = http.request(
"GET",
url,
#headers={
# 'User-Agent':'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
#},
fields={'id':100,'name':'lisi'}, #请求参数信息
)
print("status:%d" % res.status)
data = res.data.decode("utf-8")
print(re.findall("
",data))
2. requests库的使用:
- 安装:通过使用pip命令来安装requests
pip install requests
- 简单使用:
import requests
import re
url = "http://www.baidu.com"
# 抓取信息
res = requests.get(url)
#获取HTTP状态码
print("status:%d" % res.status_code)
# 获取响应内容
data = res.content.decode("utf-8")
#解析出结果
print(re.findall("
",data))
审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
信息
+关注
关注
0文章
406浏览量
35537 -
python
+关注
关注
56文章
4795浏览量
84663
发布评论请先 登录
相关推荐
数据库事件触发的设置和应用
数据库无论对于生产管理还是很多的实际应用都非常重要。小编这次聊一下数据库事件触发的应用。示例使用了postgresql和Python。
HAL库和标准库的区别 HAL库与CMSIS的关系
在嵌入式系统开发中,HAL(硬件抽象层)库和标准库是两种常用的软件库,它们在功能和使用场景上有所不同。 1. 标准库 标准
KiCon演讲回顾(六):Würth Elektronik KiCad 库设计与管理
.wrl和.step两种格式。 需要的操作: 重命名 缩放 改变坐标系 导出.wrl和.step文件。 解决方法:使用 Python 脚本实现自动化 挑战2:封装 器件信息数据库和Python脚本自动化。
使用Python进行串口通信的案例
当然!以下是一个使用Python进行串口通信的简单示例。这个示例展示了如何配置串口、发送数据以及接收数据。我们将使用 pyserial 库,这是一个非常流行的用于串口通信的Python库
Python库解析:通过库实现代理请求与数据抓取
在Python中,有多个库可以帮助你实现代理请求和数据抓取。这些库提供了丰富的功能和灵活的API,使得你可以轻松地发送HTTP请求、处理响应、解析HTML/XML/JSON数据,以及进
如何利用python和API查询IP地址?
在Python中,直接查询IP地址的地理位置或详细信息(如所属国家、城市等)通常需要依赖外部API服务,因为Python标准库本身不提供直接查询IP地址地理位置的功能。以下是一个使用
发表于 08-28 11:55
深度学习常用的Python库
深度学习作为人工智能的一个重要分支,通过模拟人类大脑中的神经网络来解决复杂问题。Python作为一种流行的编程语言,凭借其简洁的语法和丰富的库支持,成为了深度学习研究和应用的首选工具。本文将深入探讨
安装esp-idf配置install.sh出错了怎么解决?
recent call last):
File \"/usr/local/lib/python3.6/dist-packages/pip/_vendor/urllib3/response.py\", line 425, in _error_catcher
yield
发表于 06-24 07:37
ESP32下如何加自定义Python库?
我看官方有提供Micropython的bin文件,但我想根据自己外设扩充一下Python库,这个应该从哪里入手?
之前做过RTT系统的python库扩充,RTT有提供Micropyth
发表于 06-18 06:27
ESP32如何安装MicroPython库?
??
【问题2】有Python的noise库,装还是不装?装了也是没用啊,环境是MicroPython
【请教】请问以上问题如何解决?
发表于 06-05 07:55
python 学习:在内网中 python库-numpy 安装方法,升级pip3版本的指令
\\\\numpy-1.26.4-cp311-cp311-win_amd64.whl
内网中升级pip 升级版本的指令:
python.exe -m pip install --upgrade pip--proxy \"http://gateway.schneider.z
发表于 04-22 17:18
评论