设为首页收藏本站

切换到宽版

五花八门论坛首页BBS

»五花八门论坛首页 › Python › Python学习 › 获取一个简单的页面

发新帖

查看: 11782|回复: 3

获取一个简单的页面

504 主题	7万元宝	79万积分

Rank: 9 Rank: 9 Rank: 9

积分: 798695

发表于 2020-8-6 17:35:50 | 显示全部楼层 |阅读模式

B站上看视频，抄的一个代码，获取首页页面数据的爬虫

#爬取本站首页页面数据
#导入requests模块
import requests
#指定URL
url = 'http://www.zhaoqianzhou.com'
#发起请求，get方法会返回一个响应对象
response = requests.get(url=url)
#获取响应数据.text返回的是字符串形式的响应数据
page = response.text
print(page)
#存储
with open('./sodgou.html','w',encoding='utf-8') as fp:
fp.write(page)
print('爬虫is over')

复制代码

回复

使用道具举报

504 主题	7万元宝	79万积分

Rank: 9 Rank: 9 Rank: 9

积分: 798695

楼主| 发表于 2020-8-6 17:36:41 | 显示全部楼层

生成的HTML文件，存储在同一目录下

回复

使用道具举报

504 主题	7万元宝	79万积分

Rank: 9 Rank: 9 Rank: 9

积分: 798695

楼主| 发表于 2020-8-6 19:03:44 | 显示全部楼层

import requests
url = 'http://www.zhaoqianzhou.com'
respsonse = requests.get(url=url)
page_text = respsonse.text
with open('./qianzhou.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print(page_text)
print('over')

复制代码

回复

使用道具举报

504 主题	7万元宝	79万积分

Rank: 9 Rank: 9 Rank: 9

积分: 798695

楼主| 发表于 2021-5-20 15:53:22 | 显示全部楼层

import requests
url = 'https://club.coovm.com/forum-53-1.html'
spon = requests.get(url=url)
print(spon.text) #获得HTML网页数据
print(spon.content) #获得返回的数据（二进制）

复制代码

回复

使用道具举报

发新帖

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2026-2-4 19:16 , Processed in 0.050680 second(s), 18 queries .

本站已稳定运营：

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表