爬取论坛表格数据(斑马出勤记录)
import requestsfrom openpyxl import Workbook
from pyquery import PyQuery as py
wb = Workbook()# 创建一个Excel文件
sheet = wb.active# 获取当前sheet名称
tem = 'http://zhaoqianzhou.com/forum.php?mod=viewthread&tid=252&extra=page%3D1'
spon = requests.get(url=tem)
r = py(spon.text)
for item in r('.t_table tr'):# 这个循环是分析出来的页面提取标题存到Excel中
sub = py(item)
sheet.append() #eq是选择获取几个td中的第几个
wb.save("人员爬取.xlsx")# 保存到本级目录
结果是爬取了数据,保存了第一列(sub('td').eq(0).text()),和第四列数据
页:
[1]