找回密码
 立即注册
搜索
热搜: Excel discuz
查看: 1487|回复: 0

爬取最新电影下载网每个电影链接

[复制链接]

492

主题

7万

元宝

77万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
770449
发表于 2021-5-23 16:58:48 | 显示全部楼层 |阅读模式
  1. import requests
  2. from pyquery import PyQuery as pq
  3. url = 'https://www.993dy.com/vod-type-id-1-pg-{pn}.html'
  4. headers = {

  5.     'Referer':'https://www.993dy.com/vod-type-id-1-pg-1.html',
  6.     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:88.0) Gecko/20100101 Firefox/88.0'
  7. }

  8. for page in range(1,3):

  9.     listurl = url.format(pn=page)
  10.     r = requests.get(listurl,headers=headers).text


  11.     d = pq(r)


  12.     for i in d('.img-list li'):
  13.         sub_d = pq(i)
  14.         print(sub_d('h5').text(),end=' ')
  15.         print('https://www.993dy.com'+sub_d('a').attr('href'))
复制代码



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|五花八门论坛 ( 豫ICP备15031300号-3 )

GMT+8, 2024-12-22 01:01 , Processed in 0.070746 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表