(新问题) Python BeautifulSoup -如何在向下滚动的同时捕捉文本？(Web Crawler)

文章/答案/技术大牛

发布

1回答

、、、、

但现在我面临一个新的问题。当我在页面中搜索Sheeran时，if "Shreeran" in j:一切都很好。但是，如果我再添加一个关键字，比如concert，结果将随机生成。://xxxxxxxxx/{}'.format(pagenum) pagesource = driver.page_source soup = BeautifulSoup

浏览 20提问于2019-04-14得票数 0

1回答

python和symbian -击键捕获

、、

我正在尝试用python编写一个简单的原型应用程序来捕获用户的击键，同时编写文本消息(SMS)来收集一些统计信息，以便在基于Symbian的手机的生物识别应用程序中使用。我以前从未使用过python，也很少接触它。然而，我确实遇到了一个示例，详细说明了如何轻松地捕获向上、向下、向左、向右和0-9。我试图在pys60 API中查找有关key_codes和keypress的信息，但几乎没有可用的信息，因

浏览 5提问于2009-03-24得票数 1

9回答

BeautifulSoup和Scrapy crawler有什么区别？

、、、

我想做一个网站，显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么？我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

4回答

设计一个可滚动的网站？

我是一个非常挑剔的人，作为一个笔记本电脑用户，大多数时候我都是用我的上下页/页面键来滚动页面。每个网页似乎分为以下几类：我怎样才能专门设计我的网页，使我的网页滚动与键盘键一开始？是什么因素阻止了这一点；是否有一些具体的事情我应该避免？例如，我知道iframes和可滚动的div可能会成为这个目标的一个问题

浏览 1提问于2011-07-10得票数 3

回答已采纳

1回答

修改TextBox ControlTemplate以限制滚动，属性设置在运行时不正确

、、、、

我在为ControlTemplate TextBox.定制时遇到了问题其思想是在尽可能少的用户交互的情况下，自动将文本整齐地打印在纸上，同时在文本长度、字体大小等方面保持尽可能的灵活性。为此，一个设置是文本相对于打印行的高度(它离纸上显示的线有多近/多远)。由于更改TextBox LineHeight在文本下面而不是在文本之上添加空间，所以我一直使用文本框顶部的<

浏览 5提问于2013-08-05得票数 0

回答已采纳

3回答

“编写web服务”是什么意思？

、、

我刚刚问了一个问题，是否有可能编写一个网页检查代码，并在免费的web服务器上运行它，一个支持者回答说是。他还建议我使用服务。我想知道编写"web服务“是什么意思，它与编写脚本有什么不同？

浏览 0提问于2009-11-15得票数 0

回答已采纳

3回答

如何删除Python中两个双括号之间的文本

、、、、

我正在进行一些标记，将其转换为html，然后在没有标记的情况下解析出文本，只给我留下一组清晰的字母数字字符。def clean_markdown(self, text_string): soup = BeautifulSoup因此，在这种情况下，“定制”一词将出现在

浏览 3提问于2020-03-31得票数 1

回答已采纳

1回答

如何在数据表中限制用户输入？

、、

例如，以美国为目的地的航班，下午2点40分起飞的时间，以及300美元的价格，都会被记为 <div class = flight America 240PM 300> *Insert descriptive因此，我想知道如何在每个输入部分限制用户的输入。我一直试图使用一个仍然可用的自由格式文本的datalist来实现这一点，这样用户就不必无休止地向下滚动，以找到他们想要筛选的特定航空公司或

浏览 3提问于2020-08-08得票数 1

回答已采纳

2回答

Feedparser -从Google Reader检索旧消息

、、、

我正在使用python中的feed past库从本地报纸中检索新闻(我的目的是在这个语料库上进行自然语言处理)，并且希望能够从RSS提要中检索许多过去的条目。我不太熟悉RSS的技术问题，但我认为这应该是可能的(我可以看到，例如，Google Reader和Feedly可以在我移动滚动条时“按需”完成这项工作)。我打算只从rss feed获得新闻条目的链接，并使用BeautifulSoup解析整个页面以获得我想要的文本

浏览 1提问于2009-11-05得票数 6

回答已采纳

11回答

如何将HTML表刮到CSV？

问题如果我可以将这些信息放入电子表格中进行排序、平均等等，那么这些信息就会更有用。我的第一个想法因为我知道jQuery，所以我想我可以用它来删除屏幕上的表格格式，插入逗号和换行符，然后将整个混乱的内容复制到记事本中并保存为CSV。有更好的主意吗？具体来说，当我粘贴到电子表格中时，我必须选择“粘贴特殊”并选择格式“文本”。否则，它会尝试将所有内容粘贴到单个单元格中，即使我突出显示了整个电子表

浏览 27提问于2008-11-03得票数 44

回答已采纳

1回答

如何在每个列表项都是WKWebView的情况下在SwiftUI中创建一个列表视图(我的实现速度非常慢，而且有问题)

、、、、

基本上，我想在SwiftUI中创建一个列表视图，每个列表项都是一个WKWebView (这就像论坛中主题的帖子，每个帖子数据由一些超文本标记语言字符串表示，可能包括图片和其他东西)，类似于下面的somethinglike this 但是，当我完成代码(附加在底部的代码)时，代码执行速度非常慢，同时，无法滚动。如果向下滚动，则不会加载某些列表项。如果再次向上滚动，原始加载的列表项将消失。此外，在调试窗口中会显示许多错误消息，如<

浏览 22提问于2020-08-09得票数 2

3回答

如何使用Python快速抓取多个HTML文档？

、、、、

我有一个大约100个HTML网页的列表(所有网页都有不同的结构，如div、锚、类等)。我尝试抓取每个页面的标题(其中标题位于某个div和class下)。为了做到这一点，我使用了get请求和Beautifulsoup，然而，这需要很长的时间(每次我想做的时候都需要10分钟)！我使用计时器来查看最耗时的是什么:它是get请求。我一直在寻找让这些请求更快工作的方法，并遇到了许多不同的解决方案。然而，一个共同的主题似乎是，

浏览 7提问于2019-07-08得票数 1

回答已采纳

2回答

文本框验证强制错误

、、、

只要我没有在文本框中显示结果，我就可以一遍又一遍地运行代码。我尝试了几种不同的解决方案：我在文本框中尝试了enabled="false“属性..。这允许我查看代码的第一部分，但是由于没有启用textbox，所以我不能上下滚动查看文件。因此，这并不能真正解决这个问题。我尝试在页面指令和system.web中设置validateRequest="false“(如per )，但据我所知，它没有任何效果。我在将字符串内容放入文本框之前尝试

浏览 2提问于2011-11-22得票数 0

回答已采纳

19回答

如何在python中使用selenium webdriver滚动网页？

、、、

但我需要向下滚动才能找到所有的朋友。如何在Selenium中向下滚动。我使用的是python。

浏览 1提问于2014-01-08得票数 189

3回答

两个容器之间的自定义形状线，可改变颜色，如进度条。

、、、

根据上面的图片，我想要实现的是：一旦容器到达视图端口的中间，它的文本背景将更改为黄色。同时，当用户向下滚动或向上滚动时，中间箭头将慢慢填充黄色，直到用户到达下一个容器的中间视图。现在，我设法使焦点容器将其文本背景更改为黄色，而且我已经显示了进度条形状，但我不知道如何在用户滚动操作中将其更改为黄色(如进度条)。P/S :我正在考虑仅仅使用图

浏览 1提问于2018-12-16得票数 1

回答已采纳

3回答

如何使智能契约与事务一起发送消息给用户？

、、、

Smart显然可以通过Ethereum网络发送事务，但它们也可以与事务一起发送一个简单的消息吗？谢谢。

浏览 0提问于2019-08-30得票数 1

回答已采纳

7回答

维基百科网页的抓取和解析

、、、、

我想知道在Objective中是否有任何现有的库或可以从Objective中访问，这些库允许我刮掉格式化为格式的页面。具体而言，每个日期旁边的所有日期和所有文本。如果没有，做这件事最好的方法是什么？编辑：所以我在以下链接中找到了更多关于该API的信息：我想出了一个，它可以返回一些HTML编码的文本(格式是XML，但它包括页面的文本，如»a href=等)。编辑2：好的，多亏了

浏览 8提问于2009-10-27得票数 5

回答已采纳

4回答

如何使用“请求”模块python进行简单的快速请求？

、、、

我是python的初学者，我只是尝试用模块requests和BeautifulSoup来刮网页--这是我提出请求的。我的简单代码是：from bs4 import BeautifulSoup as BS 我试着在堆栈和谷歌上搜索，他们说使用异步，但方式对我来说很难。如果有人有

浏览 0提问于2019-01-12得票数 10

回答已采纳

1回答

在启动JQuery Knob时防止网站滚动

、、

我有一个DSP应用程序，可以通过web接口进行控制。为了允许用户设置某些数字值，如增益、灵敏度、音量、滤波器的频率限制等，我使用安东尼·塞里恩的JQuery Knob元素。但是，问题是，当您这样做时，不仅旋钮的值会发生变化，而且文档本身也会滚动，以便当您试图使用滚动轮(或跟踪盘或触摸屏，.)更改其值时，旋钮在您的光标下移动。Turn the input element into a JQuery knob. $(&#x

浏览 2提问于2018-01-04得票数 3

回答已采纳

3回答

如何从谷歌搜索中筛选出一长串网站？

我有一个网站的名单，我想永久排除在谷歌搜索结果。这些是来自StackExchange网络的大量网站剽窃(其中一些站点与机器翻译有关) Q&A，比如qaru.site。我已经创建了一个过滤搜索引擎的铬，与网址，如https://google.com/search?q=%s+-site:site1+-site:site2+-...所以有些黑名单上的域名实际上并没有被列入黑名单。我尝试过使用铬扩展来过滤搜索结果，但是这些扩展通常在更高的级别上工作，只过滤结

浏览 0提问于2019-09-21得票数 5

点击加载更多