python爬取p站_python爬p站_python2爬p站 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Python3爬取1024图片

分析列表页面首先进入1024的导航网站，随便点击一个地址进入选择图片区或者在网站地址后面添加,这就是1024网站的图片区，这个爬虫就是主要抓取这个区域的所有图片，使用浏览器debug分析一下这个页面发现基本都是列表页,格式如下： 📷 在地址栏后面拼1、2、3等于就是访问图片区第一页、第二页、第三页的列表页。根据这些列表页就可以爬出具体的每一个图片页的地址，类似上图的地址：在地址的前面拼接上主站地址就是具体的图片页了。所以根据以上的分析：通过循环地址栏找到不同的列表页在根据列表页找到具体的图片页地址栏

09

就叫Spyfari吧！｜数据爬取及可视化系列

这是《数据爬取及可视化系列》的第四篇文章。前3篇文章，可以查阅： 01基于位置的用户画像初探 02技能之谷歌Chrome爬虫 03 使用Echarts制作可视化图表 ---- 玩了一个月的elect

04

您找到你想要的搜索结果了吗？

是的

没有找到

01.爬⾍概述

爬⾍概述什么是爬⾍? 不知道各位是否遇到过这样的需求. 就是我们总是希望能够保存互联⽹上的⼀些重要的数据信息为⼰所⽤. ⽐如, 在浏览到⼀些优秀的让⼈⾎脉喷张的图⽚时. 总想保存起来留为⽇

02

Python爬虫之b站的正确打开方式

国庆假期，大家应该都出去浪了吧，不用想，各个景区应该都是人满为患了，大部分时间都花在排队上了。pk哥知道人多，哪儿也没去，就在附近转悠了下，在家闲着了。这不，为了给排队等待的朋友解闷，我这次对 b 站下手了。我用 Python 对 b 站的小视频进行了爬取，因为是小视频，大小平均在 5 兆以内。排队时，没网络也能看小姐姐了，爽啊。文末给出了源码获取方式。

03

Python爬虫之b站小视频

国庆假期，大家应该都出去浪了吧，不用想，各个景区应该都是人满为患了，大部分时间都花在排队上了。pk哥知道人多，哪儿也没去，就在附近转悠了下，在家闲着了。这不，为了给排队等待的朋友解闷，我这次对 b 站下手了。我用 Python 对 b 站的小视频进行了爬取，因为是小视频，大小平均在 5 兆以内。排队时，没网络也能看小姐姐了，爽啊。文末给出了源码获取方式。

01

【爬虫+数据清洗+可视化分析】舆情分析"淄博烧烤"的B站评论

自从2023.3月以来，"淄博烧烤"现象持续占领热搜流量，体现了后疫情时代众多网友对人间烟火气的美好向往，本现象级事件存在一定的数据分析实践意义。

01

爬虫篇 | Python爬虫之b站小视频

国庆假期，大家应该都出去浪了吧，不用想，各个景区应该都是人满为患了，大部分时间都花在排队上了。pk哥知道人多，哪儿也没去，就在附近转悠了下，在家闲着了。这不，为了给排队等待的朋友解闷，我这次对 b 站下手了。我用 Python 对 b 站的小视频进行了爬取，因为是小视频，大小平均在 5 兆以内。排队时，没网络也能看小姐姐了，爽啊。文末给出了源码获取方式。

02

爬取B站10万数据，看看都有哪些热门的UP主！

说起热门的B站相信很多喜欢玩动漫的，看最有创意的Up主的同学一定非常熟悉。我突发奇想学Python这么久了，为啥不用Python爬取B站中我关注的人，已经关注的人他们关注的人，看看全站里面热门的UP主都是是哪些。

03

python数据清洗中的时间转换

我们可以用time.strftime函数转换字符串成struct_time，再用time.strftime()格式化想要的格式

02

python爬取B站千万级数据，发现了这些热门UP主的秘密！

Python（发音：英[?pa?θ?n]，美[?pa?θɑ:n]），是一种面向对象、直译式电脑编程语言，也是一种功能强大的通用型语言，已经具有近二十年的发展历史，成熟且稳定。它包含了一组完善而且容易理

00

python爬虫实例之获取动漫截图

之前有些无聊（呆在家里实在玩的腻了），然后就去B站看了一些python爬虫视频，没有进行基础的理论学习，也就是直接开始实战，感觉跟背公式一样的进行爬虫，也算行吧，至少还能爬一些东西，hhh。我今天来分享一个我的爬虫代码。

01

爬取B站评论：Python技术实现详解

在当今信息爆炸的互联网时代，用户生成的内容不断涌现，其中包括了各种各样的评论。而B站作为一个充满活力的视频分享平台，其评论区更是一个充满了各种各样精彩评论的宝藏地。那么，有没有一种简单的方法可以将这些评论收集起来呢？答案是肯定的！本文将介绍如何使用Python编写一个爬虫程序，轻松实现爬取B站视频的评论，为我们探索互联网数据的奥秘带来便利。

01

爬取B站20万+条弹幕，我学会了如何成为B站老司机

B站(哔哩哔哩)是国内知名的视频弹幕网站，也是中国最大的年轻人聚集地之一，想要知道B站弹幕爱刷什么梗？不同分区UP主弹幕各有什么特点？如何快速成为B站弹幕老司机？本文就通过Python爬取B站不同UP主近20万+弹幕数据进行分析，全文共分为两个部分，第一部分为不同分区up主的弹幕分析，第二部分为Python爬取B站弹幕技术分析。

03

❤️心动挑战❤️python爬虫爬取B站封面图片

🍑源生动力😍 对于文章，标题是其浓缩的精华；那么对于视频，其封面就可能是最亮眼的那一帧。B站，作为最近比较火热的短视频平台，其舞蹈区各种各样的舞蹈，尤其是宅舞，深受“宅男”的喜爱。（别和我说什么黑丝、jk，我真的不喜欢😆 ） [在这里插入图片描述] 于是乎，我就尝试使用爬虫获取B站的封面。 🍉网页获取 B站是有防爬措施的，我一开始根据网页进行分析，无果。转念一想，这么火热的B站，想爬取的人肯定不止我一个，于是乎，我就开始搜索相关的文章和视频。啪的一下，很快啊，我就找到一篇，根据B站AV号爬取封面图片的文

06

别人用B站看弹幕，我用B站搞python

“吃瓜群众”“一亿小目标”“蓝瘦，香菇”“主要看气质”……如果你用过这些，你可能是9000后；

03

找python爬虫小项目？github给你准备好了！

即使我们都是程序员，但我们也并非都会修电脑，都会做酷炫的ppt，都会优化系统卡顿。其实程序员也是分行业、分专业的，就像医生也分内外科、呼吸科、神经科神的。

03

如何手动写一个Python脚本自动爬取Bilibili小视频

国庆结束之余，某个不务正业的码农不好好干活，在B站瞎逛着，毕竟国庆嘛，还让不让人休息了诶～～

02

数据集 | 2023 bilibili 视频弹幕数据集，以「木鱼水心」解说视频为例

今天分享的是 b 站弹幕数据集，使用 b 站弹幕爬虫，抓取 b 站著名百大 up 主「木鱼水心」关于三国演义、水浒传、红楼梦这些四大名著最火的几个视频的弹幕列表。

02

京东商品和评论的分布式爬虫

众所周知，爬虫比较难爬取的就是动态生成的网页，因为需要解析 JS, 其中比较典型的例子就是淘宝，天猫，京东，QQ 空间等。所以在我爬取京东网站的时候，首先需要确定的就是爬取策略。因为我想要爬取的是商品的信息以及相应的评论，并没有爬取特定的商品的需求。所以在分析京东的网页的 url 的时候, 决定使用类似全站爬取的策略。分析如图：

01

网站有反爬机制就爬不了数据？那是你不会【反】反爬！道高一尺魔高一丈啊！

不知道你们在用爬虫爬数据的时候是否有发现，越来越多的网站都有自己的反爬机制，抓取数据已经不像以前那么容易，目前常见的反爬机制主要有以下几种：

02

「Python爬虫系列讲解」十四、基于开发者工具 Network 的数据抓包技术

前文回顾：「Python爬虫系列讲解」一、网络数据爬取概述「Python爬虫系列讲解」二、Python知识初学「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试「Python爬虫系列讲解」四、BeautifulSoup 技术「Python爬虫系列讲解」五、用 BeautifulSoup 爬取电影信息「Python爬虫系列讲解」六、Python 数据库知识「Python爬虫系列讲解」七、基于数据库存储的 BeautifulSoup 招聘爬取「Python爬虫系列讲解」八、Selenium 技术「Python爬虫系列讲解」九、用 Selenium 爬取在线百科知识「Python爬虫系列讲解」十、基于数据库存储的 Selenium 博客爬虫「Python爬虫系列讲解」十一、基于登录分析的 Selenium 微博爬虫「Python爬虫系列讲解」十二、基于图片爬取的 Selenium 爬虫「Python爬虫系列讲解」十三、用 Scrapy 技术爬取网络数据

03

如何快速爬取B站全站视频信息

專欄 ❈陈键冬，Python中文社区专栏作者，知乎专栏：尽瞎扯 GitHub： https://github.com/chenjiandongx ❈ B站我想大家都熟悉吧，其实 B 站的爬虫网上一搜一大堆。不过纸上得来终觉浅，绝知此事要躬行，我码故我在。最终爬取到数据总量为 760万条。准备工作首先打开 B 站，随便在首页找一个视频点击进去。常规操作，打开开发者工具。这次是目标是通过爬取 B 站提供的 api 来获取视频信息，不去解析网页，解析网页的速度太慢了而且容易被封 ip。勾选 JS 选项

「Python爬虫系列讲解」十、基于数据库存储的 Selenium 博客爬虫

前文回顾：「Python爬虫系列讲解」一、网络数据爬取概述「Python爬虫系列讲解」二、Python知识初学「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试「Python爬虫系列讲解」四、BeautifulSoup 技术「Python爬虫系列讲解」五、用 BeautifulSoup 爬取电影信息「Python爬虫系列讲解」六、Python 数据库知识「Python爬虫系列讲解」七、基于数据库存储的 BeautifulSoup 招聘爬取「Python爬虫系列讲解」八、Selenium 技术「Python爬虫系列讲解」九、用 Selenium 爬取在线百科知识

01

《黑神话:悟空》B站弹幕、知乎回答分析

最近行哥看到一部燃爆的游戏试玩短片火遍全网---《黑神话:悟空》,短短四天在B站便获得2100万+播放量。知乎也都在从各个角度评论这款游戏，所以行哥今天分别爬取上万条《黑神话:悟空》在B站的弹幕和知乎的回答，来看看这款游戏的评价到底怎么样

04

图解爬虫，用几个最简单的例子带你入门Python爬虫

爬虫一直是Python的一大应用场景，差不多每门语言都可以写爬虫，但是程序员们却独爱Python。之所以偏爱Python就是因为她简洁的语法，我们使用Python可以很简单的写出一个爬虫程序。本篇博客将以Python语言，用几个非常简单的例子带大家入门Python爬虫。

02

开发复杂爬虫系统的经验与思考

爬虫系统是很多Python开发者会遇到的需求。在开发中，往往会踩到各种无法预知的坑。今天给大家分享一篇关于爬虫系统开发的经验总结，让大家在技术上少走弯路。

03

当 Python 爬虫搭配起 Bilibili 唧唧，奇怪的生产力出现了

最近需要大规模下载B站视频，同时要将下载好的视频用BV号进行重命名，最后上传至服务器。这个工作一开始我是完全手工完成的，通过游猴来下载，可是下载几十个视频还好，再多一点的话真是太烦了，而且生产力低下，因此诞生了编写脚本的想法。

01

python苦短-灵笼说啥

《灵笼》艺画开天生产，B站独播，国漫里面制作算是精良，但是剧情有太多瑕疵。评论两极分化，好的说非常好，差的说非常差。看看弹幕说的啥吧

01

图解爬虫，用几个最简单的例子带你入门Python爬虫

爬虫一直是Python的一大应用场景，差不多每门语言都可以写爬虫，但是程序员们却独爱Python。之所以偏爱Python就是因为她简洁的语法，我们使用Python可以很简单的写出一个爬虫程序。本篇博客将以Python语言，用几个非常简单的例子带大家入门Python爬虫。

02

使用 Python 爬取网页数据

urllib 是 Python 內建的 HTTP 库, 使用 urllib 可以只需要很简单的步骤就能高效采集数据; 配合 Beautiful 等 HTML 解析库, 可以编写出用于采集网络数据的大型爬虫;

03

微博爬虫综述、错误汇总、Q&A

微博爬虫主要有两个导向，一个是微博内容的爬虫，其目的字段包括微博文本、发布者、转发/评论/点赞数等，另一个是微博评论的爬虫，其目的字段主要是评论文本和评论者。

03

手把手教你用用Python爬取上道网的赞助公司名称

上道网是一个手游发行推荐与投融资交易平台。平台聚集手游CP、手游发行、手游渠道、手游外包，投资商以及IP授权商，IP合作、一站式服务。并为之提供合作交易机会。

01

用 Python 了解一下最炫国漫《雾山五行》

看动漫的小伙伴应该知道最近出了一部神漫《雾山五行》，其以极具特色的水墨画风和超燃的打斗场面广受好评，首集播出不到 24 小时登顶 B 站热搜第一，豆瓣开分 9.5，火爆程度可见一斑，就打斗场面而言，说是最炫动漫也不为过，当然唯一有一点不足之处就是集数有点少，只有 3 集。

02

python入门学习路线及教程（python工程狮）

开始学习之前的准备工作 python环境配置及编译器安装方法 python基础语法 1. 打印皮卡丘（输出函数、字符串类型） 2. 用python做个自我介绍吧（数据类型） 3. 用python破解谍报密码（列表及其方法） 4. 用python给歌手华晨宇打分并求平均值（元组的运算及函数方法） 5. 用python写个自动选择加油站的小程序（if条件分支） 6. 用python做个简单的彩票号码统计分析工具（字典、集合及for循环） 7. 用python来写一个猜数字游戏 8. 用python写个存款利息计

04

爬虫小工具合集|不会编程也能爬数据

首先教大家一个用Excel爬取数据的方法，这里用的Microsoft Excel 2013版本，下面手把手开始教学~

03

Python爬虫者的福音！一个神库，汇总了数十个主流网站的模拟登陆方法

网络上有形形色色的网站，不同类型的网站爬虫策略不同，难易程度也不一样。从是否需要登陆这方面来说，一些简单网站不需要登陆就可以爬，比如之前爬过的猫眼电影、东方财富网等。有一些网站需要先登陆才能爬，比如知乎、微信等。这类网站在模拟登陆时需要处理验证码、js 加密参数这些问题，爬取难度会大很多。费很大力气登陆进去后才能爬取想要的内容，很花时间。

03

Python爬取豆瓣电影Top250并进行数据分析

利用Python爬取豆瓣电影TOP250并进行数据分析，爬取’排名’,‘电影名称’,‘导演’,‘上映年份’,‘制作国家’,‘类型’,‘评分’,‘评价分数’,’短评’等字段。

03

python使用urllib2抓取防爬取链接

写了那么多篇找工作的文章，再写几篇就完了，也算是对自己一段时间的一个总结。近来发现自己博客上python技术点的文章有点少，为了防止自己总是遗忘，还是写出来的好。

02

【Python3爬虫】我爬取了七万条弹幕，看看RNG和SKT打得怎么样

直播行业已经火热几年了，几个大平台也有了各自独特的“弹幕文化”，不过现在很多平台直播比赛时的弹幕都基本没法看的，主要是因为网络上的喷子还是挺多的，尤其是在观看比赛的时候，很多弹幕不是喷选手就是喷战队，如果看了这种弹幕，真是让比赛减分不少。

02

一文学会爬虫技巧

作为冷数据启动和丰富数据的重要工具，爬虫在业务发展中承担着重要的作用，我们业务在发展过程中积累了不少爬虫使用的经验，在此分享给大家，希望能对之后的业务发展提供一些技术选型方向上的思路,以更好地促进业务发展

02

一天可抓取 1300 万条数据的新浪微博爬虫

爬虫功能：此项目和QQ空间爬虫类似，主要爬取新浪微博用户的个人信息、微博信息、粉丝和关注（详细见此：https://github.com/LiuXingMing/SinaSpider/tree/master/Sina_spider1）。代码获取新浪微博Cookie进行登录，可通过多账号登录来防止新浪的反扒（用来登录的账号可从淘宝购买，一块钱七个）。项目爬的是新浪微博wap站，结构简单，速度应该会比较快，而且反扒没那么强，缺点是信息量会稍微缺少一些（可见爬虫福利：如何爬wap站）。爬虫抓取微博的速

08

解决渗透测试信息收集任务的工具

专注一站化解决渗透测试的信息收集任务，功能包括域名ip历史解析、nmap常见端口爆破、子域名信息收集、旁站信息收集、whois信息收集、网站架构分析、cms解析、备案信息收集、CDN信息解析、是否存在waf检测、后台寻找以及生成检测结果html报告表。

01

Python爬虫学习教程：爬取b站直播消费记录!

之前看文章说fiddler也可以进行爬取，但尝试了一下没成功，这次选择appium进行爬取。类似的，可以运用爬取微信朋友圈和抖音等手机app相关数据

02

一键查询明星个人信息，并以知识图谱可视化展示

最近想搞一点好玩的事情（技术），今天打算做一个小程序：一键查询明星个人信息。（从数据抓取到知识图谱展示，全程代码完成原创，不涉及调用api包）

03

23个Python爬虫开源项目代码：微信、淘宝、豆瓣、知乎、微博...

大家好，这里是程序员晚枫，今天为大家整理了23个Python爬虫项目。整理的原因是，爬虫入门简单快速，也非常适合新入门的小伙伴培养信心。

03

源代码和工具 | 2023 bilibili 视频弹幕爬虫，单条视频最多可爬取 10000 条弹幕

书接上回，b 站除了评论区出人才，弹幕也是 b 站文化富集之地，所以今天分享的是 b 站弹幕爬虫，文末同时附上源代码和 exe 工具链接。

03

python入门012～使用python3爬取网络图片并保存到本地

本节知识点 1，python3爬取网站源码 2，正则匹配获取图片链接 3，使用python3将不怕保存到本地

02

小白也能看懂的百度地图API使用案例（附全国高速收费站点数据~）

由于该网站并没有西藏和海南省的高速收费站，所以并没有获取到，爬取这个挺简单的，我就不说了.（说多了容易戴上银手镯，我怂）

03

B站弹幕爬虫

B站作为弹幕文化的代表，有着非常丰富的弹幕资源。今天我们尝试对B站的弹幕进行爬虫并且绘制词云图展示爬虫结果。

01

资源整理 | 32个Python爬虫项目让你一次吃到撑！

今天为大家整理了32个Python爬虫项目，大家可以自行前往GitHub搜索，或者直接留言，我会给大家发送相关链接~谢谢！ WechatSogou [1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口，可以扩展成基于搜狗搜索的爬虫，返回结果是列表，每一项均是公众号具体信息字典。 DouBanSpider [2]- 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书，按评分排名依次存储，存储到Excel中，可方便大家筛选搜罗，比如筛选评价人数>1000的高分书籍；可依据不同的主题存储到Excel不同

07

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭