请选择 进入手机版 | 继续访问电脑版

 找回密码
 立即注册
搜索
热搜: Excel discuz
查看: 1319|回复: 0

爬取论坛标题存到Excel表格

[复制链接]

482

主题

7万

元宝

75万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
750844
发表于 2021-5-20 17:06:31 | 显示全部楼层 |阅读模式
  1. import requests
  2. from openpyxl import Workbook
  3. wb = Workbook()                                  #创建一个Excel文件
  4. sheet = wb.active
  5. url = 'https://club.coovm.com/forum-53-1.html'
  6. spon = requests.get(url=url)
  7. #print(spon.text)                    #获得HTML网页数据
  8. #print(spon.content)                 #获得返回的数据(二进制)
  9. from pyquery import PyQuery
  10. doc = PyQuery(spon.text)
  11. print(type(doc))
  12. #print(doc)
  13. #print(doc('#moderate .common a'))
  14. for item in doc.items('#threadlisttableid .xst'):
  15.     print(item.text())
  16.     sheet.append([item.text()])

  17. wb.save( "测试2.xlsx")


复制代码


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2024-3-29 07:20 , Processed in 0.100986 second(s), 26 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表