请选择 进入手机版 | 继续访问电脑版

 找回密码
 立即注册
搜索
热搜: Excel discuz
查看: 1273|回复: 0

pyquery分析电影论坛页面提取标题存储到Excel表格中

[复制链接]

482

主题

7万

元宝

75万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
750844
发表于 2021-5-20 19:38:38 | 显示全部楼层 |阅读模式
  1. import requests
  2. from openpyxl import Workbook
  3. from pyquery import PyQuery
  4. wb = Workbook()                #创建一个Excel文件
  5. sheet = wb.active              #获取当前sheet名称
  6. sheet['a1']= '标题'
  7. sheet.title = "第一个sheet"      #修改sheet名称
  8. tem = 'https://club.coovm.com/forum-53-{pn}.html'
  9.                                                     # 开始循环链接,以及分析页面
  10. for page in range(1,30):
  11.     url = tem.format(pn=page)
  12.     spon = requests.get(url=url)
  13.     doc = PyQuery(spon.text)
  14.     for item in doc.items('#threadlisttableid .xst'):       #这个循环是分析出来的页面提取标题存到Excel中
  15.         sheet.append([item.text()])
  16.         print(item.text()+'存取成功')
  17.         
  18. wb.save("测试1.xlsx")            #保存到本级目录
复制代码


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2024-3-28 17:47 , Processed in 0.101398 second(s), 26 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表