Python 3如何在特定的域上抓取/抓取？_如何使用Python3抓取<p>元素中的特定文本_如何在使用Python抓取时摆脱特定的div标签？ - 腾讯云开发者社区

、、、

我希望抓取所有的网址/文本内容和爬行在特定的领域。我还尝试了以下停留在特定领域的代码，但它似乎并不完全有效。print(p, p.hostname) pass return [] 我的主要问题是确保爬虫停留在指定的域上，但当urls

浏览 13提问于2020-02-09得票数 0

2回答

使用Simple_HTML_Dom获取特定文本后面的文本

、、

Simple_HTML_Dom非常适合抓取特定标签中的内容，但在抓取文本时，我不确定如何在基本的基础上做更多的事情。这是我所搜集的代码的一个示例：Some code stuff.</span> 如您所见，FirstWord和88没有包含在任何类型的标记中。这使得它们很难被抓取。不过，问题在于: FirstWord始

浏览 1提问于2013-02-27得票数 1

回答已采纳

1回答

如何编写爬虫从instagram抓取数据？

、、、、

出于研究目的，有没有办法抓取/监控instagram数据？那么任何人都可以有一些建议吗？或者可以给我一些相关的爬行任务的参考资料？

浏览 0提问于2016-08-29得票数 0

2回答

在Python中使用Tk或Wx抓取像素属性？

、、、

我在Windows7上使用的是Python3。我想抓取我用鼠标选择的屏幕区域的所有像素的所有属性，如颜色强度、颜色等。选择可以是任何形状，但现在矩形和正方形就可以了。我想要在屏幕的任何区域中执行此操作。谢谢

浏览 1提问于2012-04-28得票数 1

1回答

jQuery可以用来从超文本标记语言页面中提取数据吗？

、、、、

我在搜索我的项目时偶然发现了jQuery，该项目涉及解析和提取HTML页面的内容。不知道我是否可以使用jQuery来实现这个目的。如果是这样的话，有人可以和我分享一些例子或者分享教程的链接吗？例如，我想解析Stackoverflow上的热门问题，并将其作为移动应用程序显示给用户，主要是Android应用程序。如果jQuery是不可能的，有什么替代方案？(当然是最简单、最有效的方法)

浏览 1提问于2013-07-04得票数 0

回答已采纳

1回答

如何在使用python进行web抓取时为request_url提供规范

、

我在带有url=x的网页上。在给出我的首选项后，该特定网页的url不会改变(如选择选项，..)或者在点击该网页上的按钮之后。上下文：如何在请求url请同时说明按下按钮的</em

浏览 9提问于2018-08-14得票数 2

1回答

在MongoDB中保留文本格式

、、、、

我正在用puppeteer进行网页抓取，但我得到的description有不同的文本格式，如h1、项目符号等。我使用$("#JobDescriptionContainer").html();抓取文本，然后将其保存在MongoDB上，但当我将其放到我的JS/React应用程序中时，文本没有格式化(所有内容都在一个普通字符串中如何在我的网站上以原始格式(如我抓取的网站上所示

浏览 20提问于2021-06-25得票数 0

回答已采纳

1回答

使用python从同一网页中的多个链接中提取数据

、、、

我是蟒蛇和网络抓取的新手。测试索引有用于各种临床测试的测试组件的名称列表。单击每个名称将带您到另一个页面，其中包含有关单个测试组件的详细信息。我想从这一页中提取出有共同问题的部分。最后，将包含测试组件名称的数据框架放在一列中，将常见问题中的每个问题作为

浏览 1提问于2018-01-19得票数 0

1回答

数据挖掘设备/商品网站的具体价格

、、

这是一个有点牵强的话题，但我发现自己经常浏览齿轮网站(如，齿轮巡逻和开箱)的生日和礼物想法。我发现点击每一篇文章寻找在我的价格范围内或在我的价格范围内的项目&&我正在寻找的项目的类别，是很麻烦的。我知道我可以去亚马逊，为我正在寻找的项目设置特定的过滤器，但我喜欢从已知的提供高质量产品推荐的网站收到建议。从数据挖掘/ web抓取的<

浏览 0提问于2016-05-17得票数 0

回答已采纳

2回答

不使用服务器的React web抓取

、、、

在React中有一种方法可以在不使用服务器的情况下进行web抓取。我正在尝试使用casperjs，但当我设置它时，它似乎给我的react带来了问题，它找不到模块。

浏览 3提问于2019-05-30得票数 1

2回答

Node.JS:如何抓取json页面中的特定数据

、、、

我想要抓取这个页面：用于特定数据，如formattedDate和description。我很难理解Node.JS中的过程，我该如何在Node.JS的模块中实现这个过程呢？任何帮助都会有很大的帮助，提前谢谢。

浏览 1提问于2018-08-10得票数 1

1回答

从html页面不显示数据的url读取数据

、

我正在尝试以下代码：if __name__ == '__main__': soup = BeautifulSoup(r.text, 'html.parser')但是我看不到网页的内容

浏览 1提问于2020-02-05得票数 0

1回答

如何使用Python抓取特定的ASP.NET页面？

、、

我想抓取一个ASP.NET网站，但是urls都是一样的，我如何使用python来抓取特定的页面呢？这里是我想爬的网站：我应该得到哪些信息来区分一个页面和另一个页面？

浏览 4提问于2015-08-16得票数 0

回答已采纳

2回答

动态获取urls的python抓取

、、

我是数据抓取领域的新手，之前使用python进行web和桌面应用程序开发。我只是在想，如果有任何方法可以从页面中获取urls，然后查看它的具体信息，如电话号码，地址等。目前我使用的是BeautifulSoup和built方法，其中我将urls作为方法的一个参数。有什么建议可以让它变得更快、更自驱动吗？

浏览 1提问于2011-04-22得票数 2

回答已采纳

2回答

用谷歌地图查找洛杉矶所有的面包店

、、

我想查询谷歌地图，例如，给我一个特定地区(例如洛杉矶县)的所有面包店的经度和纬度。

浏览 1提问于2020-03-02得票数 1

1回答

创建自上而下的2D鞭子技工

、

我试图创造一个鞭子，可以延伸到任何方向，鼠标面对后，按一个特定的按钮。如果有“可抓取”的对象，如敌人或盒子，它应该锁定这些对象，并拉他们周围，以碰撞其他物体在一定的时间。我知道，我需要不同的精灵镜头的鞭子扩展和锁定动画，但我不知道如何在代码中实现这一点，以及如何让鞭子停止短，如果它检测到“可抓取”对象。

浏览 3提问于2021-07-28得票数 0

回答已采纳

1回答

在NodeJS中，如何从主域访问cookie？

、、

我可以通过使用req.cookies或者抓取一些特定的东西来访问本地创建的cookie(req.cookie‘’myvar‘)。但是，假设cookie存储在顶级域(domain.com)上，然后又存储在我的子域应用程序(my.domain.com)中--我如何从某个域获取Cookie值？

浏览 14提问于2019-08-29得票数 0

1回答

为X个人存储一组10个二维数组

、、、

基本上，我在VBA中有一个抓取功能，它从不同页面上的大约10个不同的表中抓取信息，并将它们存储在10个2D数组中。我需要对链接到应用程序的X个人重复此过程，这意味着我需要10组2D数组，用于未知数量的人，具体取决于应用程序。设计这个系统的最佳方法是什么？另外，如果我的二维数组命名约定如下，我将如何在我的抓取函数中指示为特定的人存储一组特定的10

浏览 0提问于2018-02-01得票数 0

2回答

如何使用下载链接在Python中下载文件

、、、

基本上，我正在尝试写一个脚本，将抓取网页上的某些文件，并下载到特定的文件夹。以下是问题所在。我可以抓取文件的下载链接，并且可以打开浏览器并弹出打开/保存小

浏览 0提问于2015-08-12得票数 0

2回答

Mac应用程序的Instagram API

、、、

我已经浏览了Instagram身份验证文档，我可以看到，除了带用户访问Instagram指定的URL之外，没有其他直接的身份验证方法。看，我们应该带用户到一个特定的URL。Instagram使用OAuth 2.0。但问题是，有一个名为Flume的</

浏览 8提问于2016-06-05得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云