赵乾舟 发表于 2021-5-20 19:38:38

pyquery分析电影论坛页面提取标题存储到Excel表格中

import requests
from openpyxl import Workbook
from pyquery import PyQuery
wb = Workbook()                #创建一个Excel文件
sheet = wb.active            #获取当前sheet名称
sheet['a1']= '标题'
sheet.title = "第一个sheet"      #修改sheet名称
tem = 'https://club.coovm.com/forum-53-{pn}.html'
                                                    # 开始循环链接,以及分析页面
for page in range(1,30):
    url = tem.format(pn=page)
    spon = requests.get(url=url)
    doc = PyQuery(spon.text)
    for item in doc.items('#threadlisttableid .xst'):       #这个循环是分析出来的页面提取标题存到Excel中
      sheet.append()
      print(item.text()+'存取成功')
      
wb.save("测试1.xlsx")            #保存到本级目录

页: [1]
查看完整版本: pyquery分析电影论坛页面提取标题存储到Excel表格中