赵乾舟 发表于 2021-5-26 20:30:06

爬取论坛表格数据(斑马出勤记录)

import requests
from openpyxl import Workbook
from pyquery import PyQuery as py

wb = Workbook()# 创建一个Excel文件
sheet = wb.active# 获取当前sheet名称
tem = 'http://zhaoqianzhou.com/forum.php?mod=viewthread&tid=252&extra=page%3D1'
spon = requests.get(url=tem)
r = py(spon.text)
for item in r('.t_table tr'):# 这个循环是分析出来的页面提取标题存到Excel中
    sub = py(item)
    sheet.append()   #eq是选择获取几个td中的第几个
wb.save("人员爬取.xlsx")# 保存到本级目录


赵乾舟 发表于 2021-5-26 20:30:49

结果是爬取了数据,保存了第一列(sub('td').eq(0).text()),和第四列数据
页: [1]
查看完整版本: 爬取论坛表格数据(斑马出勤记录)