开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我使用Python和Selenium抓取了喜欢Instagram上帖子的账号，但只返回了11个名字

根据您的描述，您使用Python和Selenium抓取Instagram上喜欢帖子的账号，但只返回了11个名字。这可能是由于以下原因导致的：

抓取限制：Instagram对于频繁的数据抓取有一定的限制，包括每小时的请求数量和频率限制。如果您的抓取操作超过了这些限制，Instagram可能会限制您的访问，导致只返回部分数据。
页面加载问题：Selenium是一个自动化测试工具，它模拟用户操作浏览器。在使用Selenium抓取数据时，需要确保页面完全加载完成后再提取数据。如果页面加载未完成，可能会导致只返回部分数据。
抓取代码问题：请确保您的抓取代码逻辑正确，没有遗漏任何数据提取步骤。检查代码中是否存在错误或遗漏的步骤，以确保所有的账号名字都被正确提取。

针对以上问题，您可以尝试以下解决方案：

限制抓取频率：合理控制抓取频率，避免过于频繁的请求。可以使用延时等方式来控制请求的频率，以避免被Instagram限制访问。
等待页面加载完成：在使用Selenium进行页面操作后，添加适当的等待时间，确保页面加载完成后再提取数据。可以使用Selenium提供的等待方法，如WebDriverWait等，等待特定元素的出现或特定条件的满足。
检查抓取代码：仔细检查您的抓取代码，确保没有遗漏任何数据提取步骤。可以使用调试工具或打印日志来跟踪代码执行过程，确保所有的账号名字都被正确提取。

此外，如果您需要更多关于Python、Selenium、数据抓取等方面的学习资源，可以参考腾讯云提供的相关产品和文档：

腾讯云产品：腾讯云提供了云服务器、云数据库、云存储等多种产品，可用于支持您的开发和部署需求。具体产品介绍和文档可以参考腾讯云官方网站：腾讯云产品
Python开发：Python是一种简单易学、功能强大的编程语言，广泛应用于Web开发、数据分析、人工智能等领域。您可以参考腾讯云提供的Python开发文档，了解更多关于Python的使用和开发技巧：Python开发文档
Selenium自动化测试：Selenium是一个用于Web应用程序测试的工具，可以模拟用户在浏览器中的操作。您可以参考腾讯云提供的Selenium文档，学习如何使用Selenium进行自动化测试和数据抓取：Selenium文档

希望以上信息对您有帮助，如果您有任何其他问题，请随时提问。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

纽约蹭饭手册：怎样利用Python和自动化脚本在纽约吃霸王餐？

会解释怎样使用逻辑回归，随机森林，AWS和自动化脚本，但都不会深入。本文更多的是理论而非实践。如果你是一个非技术人，这篇文章仍然适合你，只不过要多花费一点时间和精力。...首先我们看一下@likenewyorkcity的这个帖子，尽管是这个账号分享出了这张图片，但图片中的标签和页面标题上@geoffrey.parry才是图片的真正版权拥有者。 ?...理论上我希望我的代码可以在识别这张图片后得出这样一条输出： ? 第一步很简单，我只需要直接标注出出现的账号即可，但第二步就没那么容易了。...我使用适合纽约市的任何图片的通用标题，标记了图片的Instagram帐户和原始来源，添加了三十个主题标签来提升帖子的曝光率。如果你继续查看帖子评论，你甚至还可以看到原始作者向我表示感谢。 ?...需要注意的是你不能在Instagram上滥用这个方法关注其他账号。Instagram的算法有非常严格的限定，如果你在一天内操作过多或关注太多用户，他们会将你停止你的操作甚至封掉你的帐号。

1.3K3 0

纽约蹭饭手册：怎样利用Python和自动化脚本在纽约吃霸王餐？

会解释怎样使用逻辑回归，随机森林，AWS和自动化脚本，但都不会深入。本文更多的是理论而非实践。如果你是一个非技术人，这篇文章仍然适合你，只不过要多花费一点时间和精力。...首先我们看一下@likenewyorkcity的这个帖子，尽管是这个账号分享出了这张图片，但图片中的标签和页面标题上@geoffrey.parry才是图片的真正版权拥有者。 ?...理论上我希望我的代码可以在识别这张图片后得出这样一条输出： ? 第一步很简单，我只需要直接标注出出现的账号即可，但第二步就没那么容易了。...我使用适合纽约市的任何图片的通用标题，标记了图片的Instagram帐户和原始来源，添加了三十个主题标签来提升帖子的曝光率。如果你继续查看帖子评论，你甚至还可以看到原始作者向我表示感谢。 ?...需要注意的是你不能在Instagram上滥用这个方法关注其他账号。Instagram的算法有非常严格的限定，如果你在一天内操作过多或关注太多用户，他们会将你停止你的操作甚至封掉你的帐号。

1.3K6 0

用Python开源机器人和5美元，我在Instagram上搞到了2500个真粉儿

当你准备发帖的时候，就可以看到标签分类和标签被使用的数量。帖子的标签分类和标签的使用数量通过这3个标签，我已经得到了一大群粉丝了。这些已经是我的标签模板，并且得到大量的应用。...大部分经常被使用在帖子里的标签通过对我的帖子经常被点zan、评论和标签的数量分析，我将分析结果写成了一个小程序将其简单处理后保存为JSON。提示：最好使用正能量的标签，将会呈现积极的感觉。...我决定收集每个帖子里的zan和评论，然后将结果整理之后，得出以下图表：每篇帖子里的zan和评论在上图中，当我在服务器上开始运行脚本时绘制了一条垂直线，如果你将红线、红虚线内和图表中的数值进行比较，...让我印象比较深刻的是，无论我的吸引粉丝策略影响有多强，我在喜欢的博主发表的帖子上收获新的粉丝数量在23-32个左右，在下一次运行程序的时候他们就会取消关注。...如果您再多花些时间，您就可以检查我的分步指南，了解如何安装selenium自动化的服务器。如果你喜欢我所做的，请考虑在GitHub，Instagram和YouTube上关注我。

2.5K5 0

Python爬虫爬取Instagram博主照片视频

看了下知乎问题怎么下载保存 Instagram 上喜欢的图片到手机? 下的回答，基本都要复制图片链接到其它软件或者微信公众号之类的来获取源图片。...于是我就想能不能写一个爬虫，传入一个喜欢的博主账号名称然后爬取该博主所有的照片和视频。...贴上问题1和问题2部分代码：第64行和第56行问题3：视频到这一步已经实现只传入博主账号名称提取该博主所有图片url的骚操作了。...该部分代码如下： download 这里的图片路径是我原先创建好的以博主账号名称为名的文件夹，后缀是提取display_url或video_url的后三位，分别是jpg格式和mp4...爬虫效率这里没有使用爬虫框架，也没有使用多线程。因为该爬虫只是出于学习交流的目的而写。后记以上就是所有的Instagram爬虫的爬虫逻辑和部分代码。

4.7K4 2

爬虫小偏方系列：robots.txt 快速抓取网站的小窍门

文章来源 | 猿人学 Python 作者王平，一个 IT 老码农，写 Python 十年有余，喜欢专研通过爬虫技术来挣钱。...如何大量发现该网站的 URL； 3. 如何抓取一个网站新产生的 URL，等等；这些问题都困扰着爬虫选手，如果有大量离散IP和账号，这些都不是问题，但是绝大部分公司都不具备这个条件的。...再举个栗子：老板又给你一个任务，老板说上次抓豆瓣你说要大量 IP 才能搞定抓豆瓣每天新产生的帖子，这次给你1000个 IP 把天眼查上的几千万家企业工商信息抓取下来。...URL 供你抓取了。...这在工作中非常适用，工作中不会在意你用的框架多好，只在意你做事的快慢和好坏。善于看 robots.txt 文件你会发现一些别有洞天的东西。

4843 1

手把手教你爬取Instagram博主照片和视频

看了下知乎问题 “怎么下载保存 Instagram 上喜欢的图片到手机?” 下的回答，基本都要复制图片链接到其它软件或者微信公众号之类的来获取源图片。...于是我就想能不能写一个爬虫，传入一个喜欢的博主账号名称然后爬取该博主所有的照片和视频。...：分析页面选择一位自己喜欢的博主然后分析Instagram的响应内容HTML。...56行问题3：视频到这一步已经实现只传入博主账号名称提取该博主所有图片url的骚操作了。...爬虫效率这里没有使用爬虫框架，也没有使用多线程。因为该爬虫只是出于学习交流的目的而写。后记以上就是所有的Instagram爬虫的爬虫逻辑和部分代码。

24.9K2 1

使用Python对Instagram进行数据分析

Instagram是最大的照片分享社交媒体平台，每月有5亿活跃用户，每天会上传9500万张照片和视频到Instagram上。它有大量的数据和巨大的潜力。...因此，在这篇文章中，我将使用LevPasha的非官方Instagram API，它支持所有的主要功能，如follow，上传照片和视频等。它是用Python编写的。...我推荐使用Jupyter笔记本和IPython。普通的python运行良好，但可能没有显示图像的功能。...你可以使用任何先进的查看工具(Notepad++)查看JSON并研究它。获得并查看Instagram时间线现在让我们做一些更有趣的事情。我们请求时间线上最后的帖子，并在我们的笔记本上查看。...，和一天中人们最喜欢的时间。

2.7K4 0

Facebook首次揭秘：超过10亿用户使用的Instagram推荐算法是怎样炼成的？

新智元报道来源：Venturebeat 编辑：大明【新智元导读】目前，每年约有5亿用户通过Instagram的自建推荐功能搜索和发现自己喜欢的内容，其背后的推荐引擎是怎样炼成的呢？...Facebook称，Explore是个由三部分组成分级漏斗，使用自定义查询语言和建模技术，目前已提取了650亿个特征，每秒可以做出9000万次模型预测。而且，这些还只是冰山一角。...在生成阶段，Explore会挖掘用户以前与之交互过的帐户，以识别感兴趣的“种子帐户”。这些账户只是兴趣相同的帐户的一小部分，但与“兴趣相同”账户筛选结合使用，可以更高效地识别局部相似的帐户。...算法会使用值模型公式进行预测，以获取行为的集中程度，然后加权和确定用户行为的重要程度，比如“保存”帖子和“喜欢”帖子的重要性孰高孰低。...Explore的最激动人心的部分之一是寻找新的有趣方式来帮助社区发现Instagram上最有趣和最相关的内容。我们还在不断继续开发Instagram Explore。

8252 0

如何使用Python对Instagram进行数据分析？

API和工具简介 Instagram提供了官方API，但是这些API有些过时，并且当前所提供的功能也非常有限。因此在本文中，我使用了LevPasha提供的非Instagram官方API。...该API支持所有关键特性，例如点赞、加粉、上传图片和视频等。它使用Python编写，本文中我只关注数据端的操作。我推荐使用Jupyter Notebook和IPython。...获取用户的所有帖子要获取所有帖子，我们将使用next_max_id和more_avialable值在结果列表上执行循环。...如果你了解社交媒体，你就会知道这是高峰使用时间，大多数企业选取此时间段发帖以获得最大的认可度。获取粉丝和被粉列表下面我将获取粉丝和跟帖列表，并在列表上执行一些操作。...我只取其中的“username”键值，并在其上使用set()。

2.7K7 0

这个 Github 仓库因你而精彩

题图：by Instagram from Instagram 阅读文本大概需要 3 分钟。我于今年 6 月份创建自己微信读者群。群组人数从一开始零星几人到现在的两百多号人。...此外，我自己平时会经常去 Github 逛逛，一是发现一些好项目，二是阅读大神的代码，从中吸取营养。近来也发现一个很不错的仓库，名字是 fuck-login。...这个仓库收集一些模拟登录一些知名的网站的 Python 脚本。但是博主因精力有限，没有再继续维护。看到这里，我脑袋灵光一闪。我们可以站在前辈的肩膀上，继续前行。...问：我想和猴哥你一起维护仓库，我准备什么？你需要一个 Github 账号，没有的 Github 账号需要进行注册。另外还需要具备 Git 版本控制的内容。...如果你还不熟悉，可以阅读廖雪峰大神的 Git 教程。问：程序代码中对 Python 库有什么要求吗？为了保证这个仓库的代码具有流通性，个人觉得有必要使用统一下 Python 库。

6622 0

全球主流社交媒体算法解析：Facebook、YouTube、Twitter如何利用算法推荐内容？

一项研究显示，出于对隐私的关注，他们更喜欢使用消息应用程序WhatsApp和Messenger（均为Facebook Inc.拥有）与密友和熟人共享和讨论新闻。...确保你的个人资料是可信的确保您的个人资料是最新的，并且填写了所有的相关信息（名称，简历，位置，链接，照片等）。该算法更喜欢看起来可信度高的账号，因此不要发垃圾内容，发失效的链接或使用自动化软件。...首次发布时，内容会被推荐给一个特定的粉丝群，以评估参与度其中的三个重要因素是：1.兴趣（Instagram算法认为你喜欢该内容的可能性越高，你看到它的可能性就越大）；2.时间轴（优先推荐最近发布的帖子...你互动越多的内容将获得更高的曝光率主题标签仍在算法中起作用，但主要只在“浏览”页面中发挥作用一个拥有好的建设且参与度高的社区可以提高每份内容的积分积极地与他人的内容进行互动（通过点赞和评论）有助于引流自己的内容...但这对于从零开始以及希望发展Youtube账号的新手来说是一个左右为难的规则。让你的目标受众喜欢你的视频你应该这样做，而且你获得的点赞越多，算法给予你的权重越高。

2.7K2 0

不懂就问，这波虎扑diss吴亦凡属于什么水平？

（双押x3 跳押）（押韵支持来自我们去年的文章 Python有嘻哈：Crossin教你用代码写出押韵的verse）在我这儿，热点只是吸引你们点进来的引子，实际内容则是不那么讨喜但确实有用的信息...相关代码已上传，获取代码请在公众号（Crossin的编程教室）回复虎扑由于篇幅所限，本文只展示结论和思路。如果想听详细的代码分析，请在文章右下角点个赞，人多的话我就另开一篇详细说明。...对此次掐架进行的分析数据来源：因为虎扑无法查看太早的帖子，所以此案例的数据截取了步行街栏目 7月25日下午3点到 8月2日下午四点半左右的帖子。...由于相关回帖数和参与用户太多，案例中的后续分析只抽样了部分主题进行。选取了回帖数最高的 100 个主题帖加随机 100 个主题帖，共包含 136964 个回帖，并随机选取了其中 5279 个用户。...互联网上的热点层出不穷，总是能给广大围观群众送上吃不完的瓜。把有限的注意力和时间花费在什么事情上，是每个人的自由，不做评判。我个人的态度在以前的文章全菊变量和菊部变量里说过，借热点说点有用的东西。

5793 0

Instagram的Explore智能推荐系统

Explore系统框架候选生成首先，我们利用人们以前在 Instagram 上互动过的账户(例如，喜欢或保存某个账户上的媒体)来识别人们可能感兴趣的其他账户。我们称之为种子账户。...这张图展示了Instagram Explore推荐的一个典型的召回过程。人们可以通过许多不同的方式来使用 Instagram 上的账号和媒体(比如关注、点赞、评论、保存和分享)。...还有不同的媒体类型(例如，照片、视频、故事和现场直播)，这意味着我们可以使用类似的方案构建多种来源。利用 IGQL，这个过程变得非常简单 —— 不同的候选源只表示为不同的 IGQL 子查询。...我们预测人们在每一种媒体上的行为，无论是积极的行为，如“喜欢”和“保存”，还是消极的行为，如“少看这样的帖子”。我们使用一个多任务多标签(MTML)神经网络来预测这些事件。...例如，如果我们认为一个人在 Explore 上保存一个帖子的重要性高于他喜欢的帖子，那么保存动作的权重应该更高。我们还希望 Explore 成为一个人们可以发现新利益和现有利益之间的丰富平衡的地方。

2.6K3 1

记一次对某企业的渗透测试实战

bugreport是禅道，script是python3+selenium 3，按照规则在禅道上书写的bugreport可由zentao.py程序生成py测试脚本。...对APP进行功能的整理，逐个功能点进行抓包分析：　　请求正文(data)虽然是密文，但是请求的URI还是真正按照对应的功能去请求的（参考URI的命名和功能的相对应性）建立设想(A)：　　在这里请教了师傅...关联分析　　日偏后我分析了一下两者的特征，发现应该出自同一个程序员之手，并且这个程序员很喜欢使用驼峰命名法… 验证设想(A) 　　在这里我尝试根据每个URI功能点生成GET请求参数的dict： /userCenter...，发现居然成功了又返回了用户的Cookie凭证…好吧，说明这里有一个逻辑问题… 　　到这下去就很简单了，获取管理员权限有上传点，测试使用jhtml的后缀可以直接绕过上传，但是上传上去之后，直接访问就给你.../etc/shadow时我直接可以获取到文件的内容，从而获取root账号权限的密码： ? 　　(解密不了)，怎么通过这个本地文件读取漏洞拿到shell？

7383 0

2年！川普被关「Facebook监狱」，他宣布与小扎断交！

在今年5月份，由外部独立专家团队组成的Facebook独立监督委员会对于Facebook的封禁账号的行动表示支持，但同时也在质疑Facebook此举的合规性，无限期封闭账号是一个模糊的，缺乏标准的处罚。...如果相关账号违反规定，Facebook将对违规贴进行明确标记。作为世界上最大的社交平台，Facebook的使命是「是让世界变得更加开放和互联。」...随后，Facebook和Instagram也封了特朗普的账号，小扎发帖表示「让总统继续使用我们的服务，风险实在太大了」。...一名白宫发言人曾表示，在使用数字媒体方面，没有人比特朗普先生更成功，「然而，当总统在关键时刻对全国发表讲话时，Big Tech却选择审查和阻止他这样做，这是令人难以置信的讽刺，但并不令人惊讶。」...用户可以通过他们的电邮和手机号码注册，获得博文通知，据称还可以点赞，但是该功能一直还无法使用。用户还被允许把川普的博文分享到Facebook和Twitter上，但并不允许用户回复或参与讨论。

3625 0

左手用R右手Python系列之——表格数据抓取之道

以上所说到的函数是针对HTML文档中不同标签设计的，所以说如果不加区分的使用这些函数提取表格，很可能对于那些你认为是表格，但是是实际上是list的内容无效。...那么selenium服务器+plantomjs无头浏览器帮我们做了什么事呢，其实只做了一件事——帮我们做了一个真实的浏览器请求，这个请求是由plantomjs无头浏览器完成的，它帮我们把经过渲染后的完整...header=TRUE) mylist % read_html(encoding ="gbk") %>% html_table(header=TRUE) %>% `[[`(1) NULL 使用以上代码抓内容是空的...---- ---- Python: python中如果不用爬虫工具，目前我所知道的表格提取工具就是pandas中的read_html函数了，他相当于一个I/O函数（同其他的read_csv，read_table...这里我们同样使用Python中的selenium+plantomjs工具来请求网页，获取完整的源文档之后，使用pd.read_html函数进行提取。

3.3K6 0

小白用Python | 超详细的Python实现新浪微博模拟登陆

首先，我们先用正常的账号登陆，具体看会有些什么请求。这里我用的是Http Analyzer抓包(Filders也是一个不错的选择)。下面是正常登陆流程的截图：接下来我会详细说明各个过程。...现在微博、空间等大型网站在输入用户名后基本都会做编码或者加密处理，这里在用户名输入框输入我的账号，通过抓包工具可以看到服务器会返回一段字符串：这一步就是预登陆过程，同学们可以自己试试。...这时候就要给大家介绍一些我的经验了，我现在已经知道的有三种模拟登陆方案： a)最简单暴力，效率也是最高的，直接把js源码转化为相应的python代码，模拟加密流程进行加密 b)使用selenium+phantomjs...最暴力的方式需要使用rsa这个第三方库，具体我在代码上有详细注释，还有一种是使用selenium+phantomjs这种方式，我也在代码中关键地方有注释，如果想看看具体过程，可以点击这里（我的个人博客）...最后奉上本文的所有方式的模拟登陆代码（如果觉得喜欢或者看了对你有帮助，不妨在github上给个star，也欢迎fork）代码链接: smart_login ，欢迎fork和star 作者：resolvewang

1.1K9 0

Python实现全自动下载抖音视频

这篇文章主要介绍了基于Python实现全自动下载抖音视频,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下很多人喜欢玩抖音，我也喜欢看抖音小姐姐，可拿着手机一个个找视频太费劲...下面利用Python，简单的三个步骤就可以将你喜欢的抖音小姐姐的视频自动下载下来了。...Charles Charles是一个App抓包工具，与Filddler的功能相似，利用它可以得到App运行过程中发生的所有网络请求和响应内容。...这里我只是利用脚本获取链接，并没有直接利用脚本下载视频。因为我是在mitmdump.exe文件所在的文件夹运行脚本，脚本里导入不了requests模块。不想配置环境变量了，所以只获取链接。...UP主的主页图漏了，请自行脑补，Python代码如下： import timeimport randomfrom appium import webdriverfrom selenium.webdriver.common.by

1.2K1 0

学习python爬虫的平凡之路

写在前面人生苦短，我用python。学习python已有两月有余，但若刨除出差和日常繁杂事务，实际的有效学习时间其实也挺有限的。...和很多python新人一样，我也是从python爬虫入手的，一段几十行的小代码就能从浩瀚无际的网络中抓取想要的数据，若是能加几个小技巧甚至就能带来全新的爬虫体验，很容易让人陶醉其间乐此不疲，既能保证学习载体又可在短时间内收获可见的效果...；Pycharm，从名字就可以看出是一个python定制的IDE，功能极为强大，尤其是虚拟编译环境，据说受到很多专业开发青睐。...cookie是一个字典格式的数据，简单的可直接复制就能使用，复杂的可以解析post data后构造，甚至是应用selenium模拟登录后得到。所见即所得：selenium。...为了得到爬虫的身份cookie，一些网站的post data又进行了复杂的加密，此时应用selenium似乎就是一个很好的选择，它几乎可以完全模拟人工登录的过程，从而实现指哪抓哪。

5051 0

一键下载QQ空间相册，微博相册，知乎回答图片，豆瓣图片，instagram图片

QQ空间相册话说2019年QQ空间推出的那个视频《时光密码》还是挺感动人的，内容取材于一对QQ网友 “往事随风”和“轻舞飞扬” 的爱与缘。你好，我是往事随风，你好，我叫轻舞飞扬。...我把Python代码打包好了，不用安装Python直接双击运行软件即可（在公众号后台回复QQ获取软件），输入自己QQ号和要导出的QQ号。 ? 它会打开你的默认浏览器，点击登录QQ。 ?...hl=zh-CN，扩展最近更新时间2021年1月27日，关于如何安装和使用Chrome扩展见之前文章上不了谷歌如何安装 Chrome 扩展？...如果还想下载和分析微博账号数据可以看看我之前的文章一键备份微博并导出生成PDF，顺便用Python分析微博账号数据，我分析过李健的微博词云图，他的微博关键词为音乐，北京，朋友，歌手，电影，居然还提到了周杰伦...instagram图片前几天分享过上ins的APP 上 Instagram 看看周杰伦又更新了什么动态，这里再分享个下载ins图片的Chrome扩展 https://chrome.google.com

2.1K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭