02月10日漏签0天

python吧关注：481,334贴子：1,984,393

21回复贴，共1页

<<返回python吧

求助帖！！！

最近在做一个python作业的实训，内容是爬取新浪新闻首页的热门视频
思路是这样先把https://www.sina.com.cn/作为BASE_url 然后requests获取res用正则匹配视频链接作为第二次解析的url 到这一步没什么问题·
接下来解析url的时候举个例子http://video.sina.com.cn/news/spj/topvideoes20200107/#318881021
这个页面审查元素查找mp4可以发现在video标签下有视频链接地址src=”http://edge.ivideo.sina.com.cn/31888102103.mp4?KID=sina,viask&Expires=1578585600&ssig=ffU4C8IOk1&reqid=”
但是第二次请求返回的内容和网页审查元素差别很大大貌似是json内容

里面只有对视频各类属性的描述我百度了说是动态网页的问题所以用了
selenium加chrome模拟正常的浏览器访问但是得出的res还是一样
有大佬知道应该怎么操作吗救救萌新

新浪新闻首页的热门视频到底是哪个子类比的呢说清楚啊本人练手给你写个就是了

不感兴趣

开通SVIP免广告

api来自这个你可以去看下哦这一大串啥意思我也不知道反正删了后边挺长一段也没影响所以就删了的

卧槽我自己能看见啊贴吧真难帖代码还要屏蔽的么

需要帮忙吗～贴吧说不方便，394883561

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

21回复贴，共1页

<<返回python吧

分享到: