怎么用Python爬取B站动漫番剧更新信息


这篇文章主要介绍“怎么用Python爬取B站动漫番剧更新信息”,在日常操作中,相信很多人在怎么用Python爬取B站动漫番剧更新信息问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python爬取B站动漫番剧更新信息”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!目标:爬取b站番剧最近更新输出格式:名字+播放量+简介
那么开始撸吧~用到的类库:requests:网络请求
pyquery:解析xml文档,像使用jquery一样简单哦~目标url:设计video类:分析完页面,设取爬去类:哎呀,怎么回事,居然返回为空
这种情况下不要慌,如果代码没有错误,那么一般是由两种情况造成
没有选择到目标,页面是js动态加载的我们先试下第一种情况,打开浏览器,f12,将选择字符串复制到console中运行下,我们这就是$(‘#list_bangumi_new .c-list .new .c-item’)这是一个item的信息,里面有我们想要的名字信息,那接下来就是去详情页寻找播放量和简介了,但是详情页链接在哪那,刚刚那个接口里并没有,我们f12,审查一下元素。
这里的链接是/anime/6439,刚刚的接口里并没有这个信息啊,那这个信息应该就是拼接出来的了,关键就是6439这个数字了,去刚刚那个接口信息里寻找一下,果然找到了一个season_id字段符合,那么详情页链接就构造如下:那么接下来就是去分析详情页,爬去我们想要播放量和简介信息了,构造爬去代码如下:那么最终爬取类关键代码如下:运行一下:
很ok,那接下来把它做成命令行~用到的类库:
argparse:解析命令行参数主要代码如下:看下效果:ok,大功告成,接下来大家就自由发挥添加更多的功能吧~:)到此,关于“怎么用Python爬取B站动漫番剧更新信息”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注开发云网站,小编会继 香港云主机续努力为大家带来更多实用的文章!

相关推荐: C++怎么解决交织相错的字符串问题

这篇文章主要介绍“C++怎么解决交织相错的字符串问题”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“C++怎么解决交织相错的字符串问题”文章能帮助大家解决问题。Givens1,s2,s3, find whethers3i…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 08/05 11:10
下一篇 08/05 11:10

相关推荐