设为首页收藏本站

切换到宽版

五花八门论坛首页BBS

»五花八门论坛首页 › Python › Python学习 › 爬取一页内容的多列数据

发新帖

查看: 5743|回复: 2

爬取一页内容的多列数据

504 主题	7万元宝	80万积分

Rank: 9 Rank: 9 Rank: 9

积分: 801413

发表于 2021-5-22 12:19:49 | 显示全部楼层 |阅读模式

import requests
from pyquery import PyQuery as pq
from openpyxl import Workbook
wb = Workbook()
sheet = wb.active
sheet['a1'] = '标题'
sheet['b1'] = '作者'
url ='http://suixian666.com/forum.php?mod=forumdisplay&fid=54'
spon = requests.get(url=url).text
d = pq(spon)
for item in d('#threadlisttableid tbody'):
sub_b = pq(item)
print(sub_b('.xst').text(),end=' ')
print(sub_b('.by a').text().split(' ')[0])
sheet.append([sub_b('.xst').text(),sub_b('.by a').text().split(' ')[0]])
wb.save('mine.xlsx')

复制代码

回复

使用道具举报

504 主题	7万元宝	80万积分

Rank: 9 Rank: 9 Rank: 9

积分: 801413

楼主| 发表于 2021-5-22 16:11:57 | 显示全部楼层

回复

使用道具举报

504 主题	7万元宝	80万积分

Rank: 9 Rank: 9 Rank: 9

积分: 801413

楼主| 发表于 2021-5-22 16:47:27 | 显示全部楼层

发现个怪事，我抄代码的时候，把pq换成其他内容，也可以正常访问抓取

回复

使用道具举报

发新帖

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2026-3-22 14:55 , Processed in 0.053374 second(s), 21 queries .

本站已稳定运营：

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表