如何从url列表中提取文本并分别保存

文章/答案/技术大牛

发布

1回答

、、、

我有一个urls列表。该列表中有100个urls，所有这些urls都包含文本。我想从这些urls中提取文本，并将这些文本保存为text1、text2、text3等格式。我只能做到这一点。urllib.request.urlopen('abc.com') line = line.decode('utf-8')上面的代码只适用于一个url

浏览 15提问于2021-05-19得票数 0

回答已采纳

1回答

如何减少Node JS中多个异步函数的运行时间？

、、、

我想在Node js中抓取一些网页并从中获取一些数据。我的代码正在工作，但它几乎需要1分钟来完成抓取和返回所有数据。我已经为每个网站使用了异步功能，并承诺收集所有信息。

浏览 2提问于2018-11-29得票数 0

1回答

如何从PDF中提取文本，包括图像和文本

、、、

我要从多个PDF文件中提取文本。PDF文件包括文本和一些图像，甚至一些页面是扫描的页面(我假设扫描的页面就像图像)。我按照下面的命令从PDF文件中提取文本。我的问题是，如何使用条件编辑命令，以检查每个页面是否包含任何图像，然后从图像中提取文本。如果你能帮助我，我将不胜感激。

浏览 10提问于2021-10-14得票数 0

2回答

将语音标记内的任何文本从一个文件保存到另一个文件的方法

、、、

我有一个很大的数据集文本文件，我想使用Unix/Linux从该文件中提取某些字符串。例如，数据集中的一行如下所示：我想提取"“中的任何字符串/文件名，并保存到另一个包含文本</em

浏览 1提问于2020-10-29得票数 0

1回答

MySQL:城市，州，乡村搜索

、、

LIKE '%$city%' OR Country LIKE '%$country%' OR State LIKE '%$state%' 其中，$city、$country和$state是通过将搜索项从带逗号的字符串转换为没有逗号的数组来获得的

浏览 2提问于2014-05-06得票数 0

回答已采纳

1回答

如何基于兄弟标记值从lxml.etree标记中提取文本

、

我的目标是从xml文档(链接)中提取urls，并将它们放在列表中：我从etree中导入了lxml，并创建了一个从所有<instanceUrl>标记中提取文本的列表理解器。url = 'https://valuespreadsheet.com/iedgar/results.php?stock=NFLX&output=xml

浏览 2提问于2017-01-18得票数 1

回答已采纳

1回答

ListView构建器

、、

我想用输入textField创建一个待办事项列表，但是当我刷新页面时， list of tasks也会刷新，因此作为默认解释，我希望通过文本字段发送一个任务，然后该任务输入列表，在我们将任务添加到listView

浏览 5提问于2022-06-10得票数 0

1回答

(Python、BeautifulSoup)创建或修改不带锚点标记的锚点文本列表

、、、、

我是Python的新手，我正在尝试构建一个从网站提取一些文本并将其粘贴到Google电子表格中的脚本。文本是用标签包装在网站上的标题。我使用BeautifulSoup (也导入了pygspread )来提取标题，如下所示： target_url = 'WEBSITE URL' r = requests.get(target_url)a标记之间的标题并打印它们。然而，而不是打印，我想粘贴在谷歌工作

浏览 16提问于2019-12-24得票数 0

回答已采纳

2回答

Python -从列表中获取元素

、

从python函数中，我得到了以下输出：类型指示它是一个列表。我希望从列表中提取值，并将其保存为单独的元素。我尝试了各种函数，将列表转换为元组，将列表转换为str，从元组或str中提取元素，但没有结果。当我尝试按索引提取元素时，我要么得到'(‘对于第一个元素索引0，或者当我试图通过迭代器函数<e

浏览 4提问于2020-05-20得票数 1

回答已采纳

1回答

刮痕型多蜘蛛

、、

从页面中提取所有链接并将它们存储在文本文件中。蜘蛛B: http://www.example.comhttp://www.examp

浏览 3提问于2015-01-19得票数 0

回答已采纳

1回答

用Scrapy从文本文件中从多个URL中抓取所有外部链接

、、、、

我希望能够让Scrapy读取一个包含大约100 k URL的种子列表的文本文件，让Scrapy访问每个URL，并提取每个种子URL上的所有外部URL(其他站点的URL)，并将结果导出到一个单独的文本文件中Scrapy只应该访问文本文件中的URL，而不是爬行并跟踪任何其他URL。我希望能够让Scrapy尽快工作，我有一个非常强大

浏览 0提问于2016-08-28得票数 1

回答已采纳

1回答

从Mac上的富文本剪贴板内容或文本选择中提取超链接

、、、、

最好是使用Applescript或Automator从文本中提取这个超链接列表(这样我就可以使用Applescript对这些URL执行进一步的处理)。请注意，我指的是从格式化文本中提取超链接，而不仅仅是从包含纯文本URL的文本中提取URL。从格式化文本中提取超链接似乎应该是一项简单的编程任务，

浏览 6提问于2015-09-18得票数 5

回答已采纳

2回答

如何从字符串中提取url并保存到列表中

、、

我很难从字符串中保存urls。url = "https://in.indeed.com/jobs?q=software%20engineer%20&l=Kerala"Links1 = soup.find_all("div",{"class

浏览 3提问于2022-03-11得票数 1

回答已采纳

2回答

在flutter中读取共享首选项中的字符串

、

我已经使用共享首选项保存了两个字符串。我想单独检索字符串并将其显示为文本。''; print(school);我应该从共享首选项中提取出名称和学校，并将其分别显示在列表磁贴上。学校名称的标题和副标题。然而，我不确定如何使用await方法来提取它。 subtitle: Text("&

浏览 0提问于2019-05-31得票数 1

1回答

我必须将PDF文件存储在Azure Blob存储到OCR并对其进行索引吗？

、、

我已经创建了一个索引，我能够从网站页面中获取信息并将其推送到索引中。我的问题是如何索引PDF文件中的内容，包括文本，以及使用认知服务从PDF文件中的图像中提取文本。因此，我似乎必须将我网站中已经存在的所有PDF文件存储在Azure Blob存储中(以某种方式保存它们的原始URL )，这样我就可以使用数据源索引器索引来索引它们并提取</e

浏览 1提问于2019-09-23得票数 0

回答已采纳

1回答

在Automator工作流中获取web文章的标题

我正在尝试创建一个工作流，该工作流使用Instapaper将URL列表转换为纯文本，然后将文本保存在机器上的文本文档中。我使用我的Instapaper来抓取文章。然后，我使用“获取文章中的链接URL”，然后

浏览 1提问于2013-09-15得票数 3

回答已采纳

4回答

如何在Perl中从纯文本中提取URL？

、、、

如何提取和删除URL链接，然后将其从纯文本中删除。"Hello!!, I love http://www.google.es".我想提取"“，将其保存在一个变量中，然后从我的文本中删除它。"Hello!!, I love". URL通常是<

浏览 0提问于2010-10-18得票数 3

1回答

从邮件中提取URL

、、、、

我试图在最新的Mac Mail.app (OSX10.10.2 Yosemite)中获得一堆电子邮件信息中任何链接的文本文档列表，这让我感到很困惑。并且有一个文本文档，每个URL/链接都可以在其中找到第一个是只处理一封电子邮件的邮件&高亮显示其中的所有

浏览 1提问于2015-03-31得票数 0

回答已采纳

2回答

从SMS打开URL

、、、

当我收到特定的消息时，我提取文本并将其保存到一个文件中。该消息由文本和URL组成。如何从文本文件中打开此url？

浏览 0提问于2011-09-13得票数 1

5回答

一种高效的算法，用于将唯一的单词保存到文件中

、、

我目前所做的是，从URL解析文本，然后清理文本并按空格将其分解并保存到文件中。我发现最难的是，案例:从site.com/page1抓取单词并将唯一单词保存到文件中。在抓取site.com/page2时，我需要检查每个单词是否已经在文件中，只有在不存在时才保存。我的想法是，获取$word，并从文件中<e

浏览 1提问于2012-04-10得票数 1

回答已采纳

点击加载更多