找回密码
 立即注册
搜索
热搜: Excel discuz
查看: 1238|回复: 1

爬取论坛表格数据(斑马出勤记录)

[复制链接]

482

主题

7万

元宝

75万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
750848
发表于 2021-5-26 20:30:06 | 显示全部楼层 |阅读模式
  1. import requests
  2. from openpyxl import Workbook
  3. from pyquery import PyQuery as py

  4. wb = Workbook()  # 创建一个Excel文件
  5. sheet = wb.active  # 获取当前sheet名称
  6. tem = 'http://zhaoqianzhou.com/forum.php?mod=viewthread&tid=252&extra=page%3D1'
  7. spon = requests.get(url=tem)
  8. r = py(spon.text)
  9. for item in r('.t_table tr'):  # 这个循环是分析出来的页面提取标题存到Excel中
  10.     sub = py(item)
  11.     sheet.append([sub('td').eq(0).text(),sub('td').eq(3).text()])   #eq是选择获取几个td中的第几个
  12. wb.save("人员爬取.xlsx")  # 保存到本级目录
复制代码



回复

使用道具 举报

482

主题

7万

元宝

75万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
750848
 楼主| 发表于 2021-5-26 20:30:49 | 显示全部楼层
结果是爬取了数据,保存了第一列(sub('td').eq(0).text()),和第四列数据
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2024-4-24 18:21 , Processed in 0.090194 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表