使用BeautifulSout4进行网络抓取-提取联系信息

、、

我正在尝试使用如下代码对供应商信息进行网络抓取 soup.find_all('span', class_ = "class-name") 请参阅附件中的图像。我想要得到联系电话，但它不是以文本或类似的形式给出的。每个数字似乎都在它自己的class标签中，甚至在这个标签中，数字都不在文本中。我也不熟悉webdev，所以如果有人能给我建议，我会非常感谢。xid=UHVuZSBFbGVjdHJvbmljIENvbXBvbmVudCBEZWFsZXJz

浏览 19提问于2021-01-26得票数 1

回答已采纳

1回答

无法使用python请求提取信息

、、、

我是一个网络抓取的初学者，我正在进行一个项目来提取NBA球队的官方网站上的联系信息。我使用requests.get提取网站的html代码，但由于某种原因，我下载的html与我看到的html非常不同，然后我点击了inspect，我似乎找不到我需要的信息。

浏览 8提问于2022-04-12得票数 -2

1回答

如何在R中通过网络抓取此网站的信息？

、、、

本网站用于搜索纽约市建筑申请信息。在"Application Searches“部分下，有"BIS Job Number:"，所以我想要从新页面提取的信息是在我输入作业编号然后单击"go”之后从新页面提取的。我想要的信息是“申请人的记录信息”(包括申请人的联系方式)。我对网络抓取非常陌生。我学习了如何

浏览 1提问于2017-09-03得票数 0

6回答

网络抓取和网络抓取有什么不同？

、、

爬行和网络抓取有区别吗？如果有不同之处，为了收集一些网络数据来提供一个数据库，以便在定制的搜索引擎中使用，最好的方法是什么？

浏览 2提问于2010-12-02得票数 96

回答已采纳

1回答

web数据抽取

、、、

作为我工作的一部分，我计划从网络资源(网络抓取)中提取数据。我想从我公司的10公里半径附近提取信息。我想知道我应该使用哪个图书馆。网络抓取是唯一的方法吗？我们能从谷歌地图中提取信息吗？

浏览 2提问于2017-10-17得票数 0

回答已采纳

2回答

Python拒绝有效的JSON

、

我正在尝试使用python3处理这个JSON：Traceback (most recent call last): File ".

浏览 4提问于2021-04-19得票数 0

1回答

GSA爬行与内容馈送哪种方法更好

我用内容抓取GSA已经有一段时间了，总是看到搜索结果的问题，预期的结果永远不会出现，或者发现错误的地方，这可能是由于错误的配置或其他原因。然而，它一直在发挥作用。我正在考虑切换到内容馈送，并使用内容馈送从数据库到GSA的所有内容馈送。但是想知道这是更好的方法还是爬网仍然是更好的选择……

浏览 5提问于2015-05-02得票数 1

2回答

网页抓取(热门网站的HTML格式)

、

我如何抓取任何网站，以便为我的网站创建提要？最受欢迎的网站遵循什么格式？

浏览 0提问于2010-11-03得票数 0

3回答

从社交媒体网络中提取数据

、、、

我想使用数据提取工具API作为我的后端.我发现的许多工具要么昂贵，要么不起作用。我对Facebook、Twitter和YouTube API以及NodeXL等都进行了研究。请有人建议我可以使用的免费的API吗？最好是那些不会太难执行的项目。

浏览 5提问于2015-04-14得票数 0

回答已采纳

1回答

是否有办法刮取特定按钮的底层数据？

、

我正在尝试抓取一个网页，对于几个使用class属性的元素，我得到了数据，但问题是当我的循环到每个URL提取信息时，它应该提取联系人号码。联系人号码不可直接使用，当我们单击“立即呼叫”按钮时，弹出卡将打开以显示联系人号码。

浏览 0提问于2021-05-20得票数 1

1回答

如何获得最后20个被禁止的蒸汽ID

、、

我正在开发一个使用蒸汽数据的欺骗分析系统。从此页，我们可以得到最后20个检查的蒸汽ID。有办法得到最后20个被禁止的蒸汽身份证吗？VacList有一个部分，上面有最后一个被禁止的帐户，但我不知道如何提取数据。像vacbanned.com这样的解决方案会好得多。

浏览 0提问于2021-01-05得票数 0

1回答

Python web抓取: google搜索结果中的网站

、、、、

我想从一个谷歌搜索页面从多个网站(例如100+)提取信息。我只想提取关键信息，例如那些带有<h1>、<h2>或<b>或<li> HTML标签的信息等，但我不想提取整个段落的<p>。我知道如何从google搜索中收集网站URL列表；我还知道如何在查看页面的HTML后对单个网站进行网络抓取。我使用Request和BeautifulSoup来完成这些任务。中<em

浏览 18提问于2021-03-31得票数 1

1回答

谷歌每日搜索趋势

、、

我教自己网络抓取，并希望从谷歌每日搜索趋势：数据将包括搜索关键字，他们的排名，搜索频率的基础上，每天。什么是从网站中提取数据的有效方法，或者更一般的，这类网站？

浏览 0提问于2018-09-18得票数 1

回答已采纳

1回答

用pyautogui控制鼠标和浏览器实现过程自动化

、、、

我正在制作一个脚本，它可以登录到一个网站并提取一个CSV数据集。下面是我想要自动化的步骤：将文本输入搜索标签框或删除搜索标记。我已经尝试过使用pyautogui模块来实现自动化，但是它对我来说并不适用。它工作得太快了，或者根本不起作用。我想我用错了。

浏览 1提问于2019-12-18得票数 0

1回答

用BeautifulSoup - HTML不同格式从CSS类链接中提取标题

、

我刚开始使用BeautifulSoup进行网络抓取，并遇到了以下问题:我试图从论坛上抓取帖子，我想提取帖子的标签。如何提取“高级物理”？

浏览 5提问于2021-06-08得票数 0

回答已采纳

1回答

把AJAX放在哪里？

我来自网络开发世界。我已经设计了一个颤振的应用程序，需要从网络抓取一些JSON很早。我希望我的第一个屏幕显示出来，并且在绘制时，我希望在幕后进行JSON提取。(但第1页将提供一些文本信息，以保持读者的参与，直到抓取发生。)谢谢你一吨！

浏览 4提问于2022-05-10得票数 0

1回答

如何使用python selenium，使用csv文件中的URL列表不断地进行web抓取

、、、、

我需要知道如何使用csv文件进行网络抓取。我拥有的文件包含“公司名称”、“主页URL”、“地址”等列表。问题是：找不到连续刮擦的方法(为了-？)而-？)

浏览 2提问于2019-05-12得票数 0

2回答

如何用BeautifulSoup抓取文本标签？

、、

我对BS4和网络抓取是个新手，所以对于这样一个基本的问题，我很抱歉。谢谢。

浏览 2提问于2020-10-08得票数 1

1回答

如果我们要用Hadoop和Solr做一个搜索引擎，NUTCH的作用是什么？

、、

我想在其中爬行一些网站，并将其索引和信息存储在Hadoop中。然后使用Solr搜索就可以了。但我面临着很多问题。以下是我的一些问题：2) Solr有什么用？如果NUTCH完成了抓取，并将抓取的索引和信息存储到Hadoop中，那么Solr的作用是什么？ 3)我们可以使用Solr和Nutch完成搜索吗？如果是，那么他们将把抓取<

浏览 2提问于2012-09-06得票数 3

1回答

C#将联系人同步到AD的最佳方法

、、

我正在创建一个小实用程序，它将从一个源抓取用户数据。用户数据包括全名和电子邮件，此来源将发生变化(更新、创建和删除用户)。将该信息同步到AD的最佳方法是什么？我觉得我这样做不是最好的/有效的方式。现在，我有删除OU (Active directory on premise)中所有当前联系人的代码，然后添加所有存在的联系人。此同步实用程序每30分钟运行一次。大约有300个联系人。我需要有这样的能力:删除不再在来源的联系人。更新已在源位置进行的任何更改(电子邮件

浏览 5提问于2021-02-27得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

无法使用python请求提取信息

如何在R中通过网络抓取此网站的信息？

网络抓取和网络抓取有什么不同？

web数据抽取

Python拒绝有效的JSON

GSA爬行与内容馈送哪种方法更好

网页抓取(热门网站的HTML格式)

从社交媒体网络中提取数据

是否有办法刮取特定按钮的底层数据？

如何获得最后20个被禁止的蒸汽ID

Python web抓取: google搜索结果中的网站

谷歌每日搜索趋势

用pyautogui控制鼠标和浏览器实现过程自动化

用BeautifulSoup - HTML不同格式从CSS类链接中提取标题

把AJAX放在哪里？

如何使用python selenium，使用csv文件中的URL列表不断地进行web抓取

如何用BeautifulSoup抓取文本标签？

如果我们要用Hadoop和Solr做一个搜索引擎，NUTCH的作用是什么？

C#将联系人同步到AD的最佳方法

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐