pyquery分析电影论坛页面提取标题存储到Excel表格中
import requestsfrom openpyxl import Workbook
from pyquery import PyQuery
wb = Workbook() #创建一个Excel文件
sheet = wb.active #获取当前sheet名称
sheet['a1']= '标题'
sheet.title = "第一个sheet" #修改sheet名称
tem = 'https://club.coovm.com/forum-53-{pn}.html'
# 开始循环链接,以及分析页面
for page in range(1,30):
url = tem.format(pn=page)
spon = requests.get(url=url)
doc = PyQuery(spon.text)
for item in doc.items('#threadlisttableid .xst'): #这个循环是分析出来的页面提取标题存到Excel中
sheet.append()
print(item.text()+'存取成功')
wb.save("测试1.xlsx") #保存到本级目录
页:
[1]