首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

小伙用Python爬取日本爱情电影,身体一天不如一天

在互联网的世界里,正确的使用VPN看看外面的世界,多了解了解世界的发展。

肉身翻墙后,感受一下外面的肮脏世界。墙内的朋友叫苦不迭,由于某些原因,VPN能用的越来越少。上周我的好朋友狗子和我哭诉说自己常用的一个VPN终于也寿终正寝了,要和众多的日本小姐姐说再见了。作为"外面人",我还是要帮他一把……

点击朋友给我网站, 然后看到的就是各种穿不起衣服的女生的卖惨视频,我赶紧闭上眼睛,默念了几句我佛慈悲。 Tokyo真的有那么hot?

需要的准备的环境

Python3.6 + Windows

IDE自行选择

模块:requests + BeautifulSoup + lxml + re + m3u8都可以直接在CMD里面pip安装。

网站解析

如果直接在网上上面爬取下来的的视频是这样子的

m3u8记录了真实的视频所在的地址。

那么就需要咱们使用开发者工具分析一下了

我们惊喜的发现,一个又一个的 .ts 文件正在载入了

不知道 .ts 文件?这是重要的知识点呀!(敲黑板!)

点开其中的一个.ts文件看一下

打码是真心累

代码

Python学习交流群:548377875获取源码

运行之后

然后,我们得到了几百个9s的.ts小视频

我们只需要把这些小视频合成一个就好了

在cmd命令行下,我们进入到这些小视频所在的路径 执行

copy/b %s*.ts %s ew.ts

然后就搞定了,虽然爬取这样的网站非常的有意思,对于学习Python而言也很有帮助,不过最大的缺点就是,身体营养跟不上,所以小编建议在爬取这样的网站的同时,切记及时补充营养,不然身体一天不如一天。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180906A1VVYQ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券