Python如何抓取图像、文本和指向音频文件url的链接

Python可以使用多种库和工具来抓取图像、文本和指向音频文件url的链接。以下是一些常用的方法：

图像抓取：
- 使用第三方库，如Requests、urllib等，通过发送HTTP请求获取图像文件的内容，然后保存到本地文件或处理为图像对象。
- 使用开源框架，如Scrapy，通过编写爬虫程序来定制化抓取图像的逻辑，并保存到指定位置。

文本抓取：
- 使用第三方库，如Requests、urllib等，通过发送HTTP请求获取网页的内容，然后使用正则表达式或解析库（如BeautifulSoup）提取所需的文本数据。
- 使用开源框架，如Scrapy，通过编写爬虫程序来定制化抓取文本的逻辑，并提取指定的文本数据。
音频链接抓取：
- 使用第三方库，如Requests、urllib等，通过发送HTTP请求获取网页的内容，然后使用正则表达式或解析库（如BeautifulSoup）提取包含音频链接的标签内容。
- 针对特定音频流媒体服务，可以使用相应的API进行调用，获取音频链接。

对于图像、文本和音频的抓取，可以结合使用各类爬虫框架和库，根据实际需求选择最合适的方法。

同时，腾讯云也提供了一些相关的产品和服务：

图像抓取：腾讯云智能图像识别（https://cloud.tencent.com/product/imagerecognition）
文本抓取：腾讯云自然语言处理（https://cloud.tencent.com/product/nlp）
音频处理：腾讯云语音识别（https://cloud.tencent.com/product/asr）

注意：本回答不会提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商。

Web抓取:无法通过类循环到div元素以获取文本和URL

、、

我试图抓取一个网站，在那里我使用div和class来获取其中的内容。我能够获得正确的数据，但当我将其放入循环中时会出错。 html = BeautifulSoup(response, 'html.parser') post_list = html.find_all('div', class_='eodLhs') print(post_list) i = 0 for values in post_list: url_json = {'title': values.ul.li[i].a.text, 'url

浏览 7提问于2019-10-26得票数 0

回答已采纳

1回答

iPhone -将webview的内容作为邮件发送

、、

我正在使用图像、文本和音频文件编写邮件，最后在Webview中显示预览。现在，我想把在web视图中显示的内容作为邮件发送出去。甚至必须发送图像和音频文件，以便最终用户只需像在原始消息中一样看到包含所有图像和aduio文件的消息。有可能吗？

浏览 2提问于2010-11-06得票数 0

1回答

如何从网站上抓取二级网页

、、、、

我想问你如何使用python + Beautiful soup或Scrapy来抓取网页，如果有2个级别的页面，一个简短的描述+一个到职位帖子完整细节的链接，那么它包含了例如招聘公告？我需要从招聘公告的标题中抓取数据，然后更深入地提取完整的描述，并将这些数据添加到数据库或文本文件中？问题是转到第二层，在那里完整的描述和获得完整的细节，包括图像链接，如果存在的话…有人这么做过吗？提前谢谢你。

浏览 0提问于2019-09-26得票数 1

2回答

如何匹配Python中的文本和音频？

、、、

我有一个音频文件和一个与这个音频文件中的演讲相对应的文本。有没有办法将文本与音频相匹配，这样我就可以得到类似时间戳的信息，显示文本文件中的单词在音频中的位置。

浏览 1提问于2021-04-08得票数 1

回答已采纳

1回答

Python:通过缓冲区进行分区，以便在

、

堆栈溢出的第一篇文章。我会尽我最大的努力使格式正确。我正在开发一个很小的python脚本，我对它几乎没有经验，它可以从图像subreddits中抓取图像。目前，我可以从r/pics中提取html页面，但是我在解析图像urls时遇到了困难，特别是来自imgur的urls。我想做的是过滤掉表单的urls *******.png 变成一个元组，但我不知道该怎么做。我目前的尝试如下： from subprocess import call picture_url_list = [] return_code = call("wget -O redithtml www.

浏览 2提问于2014-05-13得票数 0

回答已采纳

3回答

如何从IG帖子中获取图片或视频url？

、、

我需要从instagram后链接抓取图像和视频(例如：)。当使用python的正常请求时，我在html响应中没有接收到图像url。请帮我拿一下。

浏览 0提问于2017-09-27得票数 4

1回答

什么是首选的、可访问的和语义正确的方法来编码这种类型的数据设计？

、、、、

什么是首选的、可访问的和语义正确的方法来编码这种类型的数据设计？表格乌尔，李迪夫，跨度对于图标，我应该在每个地方使用，还是我应该是CSS精灵的图标？如果我们在这里使用css，那么如何编码，以及当图像被禁用时会发生什么？每个链接将打开在新的窗口，我必须指出的文件大小，也为有视力和盲人的用户？那么，做这个设计的最佳方法是什么，显示图标的最佳方法是什么，并指示文件将在新窗口中打开的所有类型的用户，以及文件大小是什么？表格的内容在任何情况下都应尽可能好地便于查阅和理解。即使禁用图像，也适用于有视力的用户。供屏幕用户使用适用于文本浏览器用户如果c

浏览 4提问于2010-03-26得票数 1

4回答

如何通过传递File对象(而不是磁盘上文件的位置)在Python中使用ffmpeg

、、、

我正在尝试使用ffmpeg和Python的subprocess模块来转换一些音频文件。我从一个URL抓取音频文件，并希望能够将Python File对象传递给ffmpeg，而不是先将它们保存到磁盘。如果我能得到一个文件流，而不是让ffmpeg将输出保存到一个文件中，那就太好了。作为参考，我现在这样做： tmp = "/dev/shm" audio_wav_file = requests.get(audio_url) ## ## ## ## This is what I don't want to

浏览 7提问于2012-05-02得票数 9

回答已采纳

1回答

Python如何抓取图像、文本和指向音频文件url的链接

、、、

我正在尝试从以下url (http://www.ancient-hebrew.org/m/dictionary/1000.html)中抓取数据。因此，每个希伯来语单词部分以img开头，然后是2个文本，实际的希伯来语单词及其发音。例如，url中的第一个条目是"img1 img2 img3אֶלֶףe-leph“希伯来语单词是使用wget下载html后的unicode。我正在尝试按顺序收集这些信息，以便首先获得图像文件，然后是希伯来语单词，然后是发音。最后，我想找到音频文件的URL。而且，每个单词的每一行似乎都以我是新的网络抓取，所以以下是我所能做的。 from urllib

浏览 16提问于2019-06-11得票数 2

2回答

使用音频单元(混音器主机)从iPod库中播放，而不是预先选择的声音文件。

、、、

为了一个大学项目，我正在开发一个DJ混音应用程序。我基本上是从一种“通过谷歌搜索所有东西并分析预先存在的源代码来从头开始自学”的方式来处理这个项目的，所以很容易。我已经看过来自apple的Mixer Host示例项目，可以在这里找到：我不知道如何将预先选择的音频文件(吉他+节拍)替换为从媒体选取器中选择的iPod库中的歌曲URL，或者，在本例中是2个媒体选取器。这是一种抓取所选iPod库歌曲的URL并替换预先选择的音频文件的URL的情况吗？如果有人能给我指出正确的方向，告诉我我是如何完全走错了路，或者甚至为我做编码(笑话)，我将不胜感激。

浏览 1提问于2012-12-05得票数 3

1回答

如何在UIImageView中突出显示图像的一部分？

我正在从事一个项目，这是基于播放图像中显示的文本的音频文件。图像中的文本像下面的图像(ayah)那样被分割成句子，音频文件也是以同样的方式分割的。因此，当文本显示5个句子时，将依次播放5个音频文件。我需要突出显示与音频文件匹配的文本，如下所示。请注意，字体是特殊的，不能根据应用程序的目的进行更改。我不能使用OCR，因为文本不是英文的。编辑:下面的屏幕截图来自一个真实的应用程序，在这个url ()上有开源的代码。但我不知道他是怎么做到的..。任何支持都是非常感谢的。

浏览 10提问于2019-02-19得票数 1

1回答

Javascript抓取URL并插入Facebook Page Tab App的Pinterest按钮

、、

我正在尝试添加一个Pinterest按钮到一个Facebook Tab应用程序中的单个图像的产品页面。 Pinterest代码是从他们的好东西部分抓取的，并且必须包括URL、媒体URL和描述。我对Javascript不是很精通。我正在尝试拉取URL并将其插入到Javascript按钮中以获取单个项目。请看下面；谢谢。 <a href="javascript:document.write(location.href);&media=http%3A%2F%2Fwww.mywebsite.net%2Ffiles%2Ftest%2Fks3.jpg&descrip

浏览 2提问于2012-02-16得票数 0

回答已采纳

1回答

使用Python从HTML5网站抓取文本

、、

我需要从一个使用python的网站上抓取文本。我已经安装了BeautifulSoup 4、HTML和NLTK，但我似乎无法找到如何抓取。我真的需要一个简单的代码片段，我可以插入任何URL并获得纯文本。我正试着从那里得到它

浏览 1提问于2014-09-17得票数 0

回答已采纳

3回答

发布到源时图像的灰色条

、、

当我使用FB.ui函数生成提要帖子时，我发现附加到帖子上的图像经常显示为垂直灰色条。另一方面，如果我使用直接的 url生成我的提要帖子，图像100%都能正常工作。如果我提供Facebook调试器，它会将其检测为照片，并在底部显示图像。当我点击“查看我们的抓取器对你的URL到底看到了什么”时，它说“文档没有返回任何数据”。我想这是因为我的图像不是一个开放的图形对象？我在这里感到非常困惑。

浏览 0提问于2011-12-15得票数 0

回答已采纳

1回答

Java:从wave音频文件中获取元数据标签

、、、、

我已经从Audacity导出了一个wave (.wav)文件，在元数据中带有以下键的自定义标记: LOOP_START和LOOP_LENGTH。我唯一的问题是，我不知道如何在Java程序中获得这些键的附加值。我该怎么做呢？编辑:我更喜欢使用使用标准Java库的解决方案，尽管我不反对下载第三方库，如果这是唯一的方法。 Edit2:下面是我正在处理的一些代码： URL url = Main.class.getClassLoader().getResource("bgm/bgm4.wav"); AudioInputStream audioInputStream = AudioS

浏览 13提问于2017-12-24得票数 1

2回答

Rails -在字符串中转换Twitter @、#hashtag和URL

、

假设我有一个字符串，其中包含从Twitter抓取的文本，如下所示： myString = "I like using @twitter, because I learn so many new things! [line break] Read my blog: http://www.myblog.com #procrastination" 然后在视图中展示这条推文。但是，在此之前，我希望转换字符串，以便在我看来： @twitter链接到 URL被转换成一个链接(其中URL仍然是链接文本) 拖拉被转化为，其中拖拉是链接文本我相信一定有一块宝石能让我这么做，

浏览 14提问于2012-09-22得票数 2

回答已采纳

1回答

用Django/Python从网站上抓取图像的有效方法

、、

首先，我想我还是有点像Django/Python。我在一个允许用户输入URL的项目中，该站点从该页面中抓取内容并返回一定大小的图像和页面标题标记，这样用户就可以选择他们想要在其配置文件上使用的图像。我认为这是一个相当标准的场景。我使用Selenium (无头Chrome浏览器)获取目标页面内容，使用python来确定文件大小，然后使用Django视图将其全部释放到模板中。然后，我将其编码成这样一种方式，即用户选择的图像将被本地下载和存储。然而，我严重怀疑它的可伸缩性，因为它目前只是在本地运行，我非常担心如果有很多用户同时运行，这将如何处理。每次提出一个听起来不高效率的请求时，我都会启动无头铬

浏览 0提问于2018-05-09得票数 1

回答已采纳

5回答

正在使用PHP +SimpleXML抓取...我可以抓取图像，但不能抓取原始文本？

、、

我正试着从网站上抓取一些特定的原始文本。通过这个站点和其他资源，我学习了如何使用simpleXML和xpath获取特定的图像。然而，同样的方法似乎不适用于抓取原始文本。这是目前不起作用的地方。 // first I set the xpath of the div that contains the text I want $xpath = '//*[@id="storyCommentCountNumber"]'; // then I create a new DOM Document $html = new DOMDocument(); // then

浏览 4提问于2009-01-01得票数 2

1回答

如何在sphinx4中使用自适应声学模型

、、

在狮身人面像的文档中，它写道，在sphinx4和袖珍狮身人面像中，内置声学模型的适应性是相同的，还有一个文档，用于sphinx4适配。但是改编后如何转录音频文件呢？对于口袋狮身人面像，我们运行以下命令： pocketsphinx_continuous -hmm en-us-adapt -lm en-us.lm.bin -dict cmudict-en-us.dict -infile 01.wav>1.txt 它将在文本文件中转录音频文件，但在Sphinx4的情况下，如何将音频文件转录成文本文件。是否有使用Sphinx4直接转录音频文件的命令。

浏览 3提问于2016-07-05得票数 0

1回答

如何在WKWebview中添加观察者来播放和暂停音频文件的动作？

、、、、

我想添加通知播放和暂停行动的音频文件在wkwebview，图像显示音频文件是如何在WKWebview

浏览 7提问于2019-12-05得票数 0

1回答

如何在python语言中使用selenium和chromedriver抓取此页面？

我正在尝试使用selenium和chromedriver从网站“”中抓取数据。当我运行代码时，chromedriver成功地输入了url，但无法加载页面，显示了一个空白页面。我尝试将目标网站切换到google.com，但抓取成功。我的结论是目标网站服务器检测到selenium并拒绝发送回数据。那么如何在Python语言中使用selenium和chromedriver从网站抓取数据呢？我是一个Python初学者，感谢您的帮助。下面是我的简单代码： from selenium import webdriver my_driver_path = r"C:\python chrome driv

浏览 0提问于2020-05-29得票数 0

1回答

使用文件API获取Moodle中文件的实际URL

、、

简介:在moodle中的，我们需要创建一个问题(假设有4个选项的选择题)，其中包含图像(在问题文本或答案文本中)。我们能够把图像在问题文本以及答案文本和moodle显示这些图像完美地使用它的文件API。问题:我的问题是，我正在开发一个用于打印测试的自定义模块，在那里我无法显示这些图像。详细信息:当moodle将这些问题和答案保存在数据库中时，它以下列格式保存图像URL(请参见img的src属性)： <p><img src="@@PLUGINFILE@@/22-2-16.png" alt="" width="1366" hei

浏览 3提问于2016-04-05得票数 0

1回答

将图像和音频文件存储在android内存中

如何在android内存中存储图像和音频文件？以及如何检索回在imageview中显示图像？

浏览 1提问于2010-09-18得票数 0

回答已采纳

1回答

按html标记值计算的刮取链接提取器

、、

我使用抓取来抓取隐私政策，从它的主页抓取一个网站，我想智能地抓取包含特定关键字的页面中的特定链接(隐私、数据、保护等)。我看到了scrapy的CrawlSpider和对象只允许这样做，但是，我希望不仅对已发现的链接应用正则表达式，而且还要应用到<a></a>标记中的文本例如，为了更好地查明以下情况： <a href="http://example.com/legal">Check out our privacy policy</a> 其中，URL可能不是一个完美的匹配，但是HTML标记中的文本更有帮助。我看到scrapy的L

浏览 0提问于2019-06-05得票数 0

回答已采纳

2回答

php:从cli工具中获取stdout输出数据？

、、、

可以在php中从命令行工具中获取stdout输出数据吗？示例：我想上传一个动态的服务器创建的混合音频文件到客户端。SOX工具允许我混合输入mp3s并将结果发送到标准输出管道。我可以抓取这个组合并立即上传它，而不需要先将它保存为临时文件吗？

浏览 0提问于2010-01-23得票数 0

回答已采纳

2回答

从html页面抓取视频和图像

、

我正在做一个用JavaScript编写的小书签，用来从超文本标记语言页面抓取图片和视频。我很容易地抓取了所有的图像，比如， $('img', $('body')) 现在我想从Youtube，Vimeo，Dailymotion等不同的来源抓取网页中嵌入的所有视频，所以有人能给出一些关于如何用一些示例JavaScript代码来实现这一点的想法吗？注意:我只需要从外部网站获得嵌入式视频的链接。

浏览 1提问于2013-07-19得票数 2

1回答

如何将imageview运行时添加到listview中

、、

我在这个文本视图中有一个数组列表是固定的国家名称，但图像不是固定的它是10,50,100，但第一个国家名称是显示比所有图像是创建动态图像视图，所以这是可能的列表视图和这个国家名称和图像超过1如何做这个列表视图我已经做了这与表布局，但我不知道表布局懒惰加载所有懒惰加载是为列表视图，而不是表布局，所以我想问这是可能的列表视图，如表布局，所以我可以做这件事提前感谢在这里您可以看到图像，这样您就可以更好地理解

浏览 0提问于2012-05-31得票数 1

回答已采纳

1回答

使用request+ python绕过cookie

、、

我在python和scraping方面是个新手。我理解基础知识，但就是不能解决这个问题。我试图用python的请求和漂亮的汤库从www.tweakers.net中抓取内容。然而，当我抓取时，我总是抓取cookie语句，而不是实际的站点内容。希望有谁可以帮助我的代码。我在其他网站上遇到了类似的问题，所以我真的很想了解我如何解决这样的问题。这就是我现在拥有的。 import time from bs4 import BeautifulSoup import requests from requests.cookies import cookiejar_from_dict last_agree

浏览 16提问于2017-03-10得票数 1

1回答

Python获取锚文本链接和href值，但忽略图像链接。

、、

下面的Python代码可以从页面路径中抓取锚文本链接和相应的href值： from requests_html import HTMLSession from urllib.request import urlopen from bs4 import BeautifulSoup import requests url="https://www.mydomain.co.uk/contact-us" session = HTMLSession() r = session.get(url) b = requests.get(url) soup = BeautifulSoup(

浏览 2提问于2021-03-11得票数 0

回答已采纳

1回答

如何在facebook墙上发布具有指向某个URL的超链接的文本字符串

我正在开发一个应用程序，希望我设计一个张贴音频文件到墙上的功能，也有一个消息与音频文件。我已经成功地将音频文件张贴/共享到墙上，但现在我希望我的消息中的一些文本应该有一个指向某个URL的超链接。有人能帮你吗？

浏览 0提问于2010-12-10得票数 1

回答已采纳

1回答

图像和音频到视频

、

我有一些图像(幻灯片)和几个音频文件，我想要组合，使用C#，AForge和ffmpeg，或任何其他事情，您可能会建议。有几个音频文件，每个读取文本在一个单一的图像。图像分为两组-图像与相应的音频文件和图像没有相应的音频文件。没有音频的图像应该显示一些预定义的时间(例如，4秒)。带有音频的图像应该显示出来，音频从它们出现时开始，直到相应的音频播放。逻辑和机制都很简单，但我不知道如何实现。我将使用哪些类或对象？我需要在两幅图像之间画每一帧吗？注意:图像表示幻灯片，这是一个PowerPoint演示文稿，它的每一张幻灯片都保存为jpeg图片。编辑:例如，我有5个图像，其

浏览 3提问于2016-02-20得票数 1

回答已采纳

3回答

如何从MySQL表查询文件路径并将其显示为链接

、、

我需要弄清楚如何使用PHP将几列数据查询到网页上的一个表中，并获得一个列作为可点击的音频文件显示。在我的MySQL表中，音频列由保存在我的web主机磁盘上的文件夹中的音频文件的绝对路径组成。到目前为止，所有尝试都只成功地将文件路径查询为文本，而不是可点击的音频。我一直在使用PHP循环语句尝试将几个数据列查询到一个表中，如下所示： <?php $sql = "SELECT id, word, audio FROM dictionary"; $result = mysqli_query($conn, $sql); if (mysqli_num_rows($result)

浏览 8提问于2022-06-05得票数 0

2回答

如何用PHP从一些HTML代码中删除某些图像？

、、、

我只是想从可能包含5个不同图像的html文本块中提取某个图像--在我想要的图像中，url总是以"“开头，而其他图像没有相同的开始url结构。我只是想不出如何只抓取一个图像而忽略所有其他的图像。

浏览 1提问于2011-08-31得票数 0

回答已采纳

1回答

如何使用亚马逊s3托管从我的网站链接的音频文件？

、、

我想做一个网站，让用户下载音频文件。我可以把那些音频文件存放在哪里。我读过关于亚马逊s3的文章。它是什么，以及如何使用它来存储我的文件？如何将这些文件送达网站？这个网站也应该在亚马逊网站上托管吗？

浏览 0提问于2018-08-16得票数 1

2回答

如何在iOS中改变URL中的内容？

、、、

我有一个网址，其中包含图像和音频文件。我使用以下代码将图像和音频文件下载到文档目录： // urlsArray contains the list of images and audio urls for(int i= 0 ;i<[urlsArrray count]; i++) { NSString *urlString = [urlsArrray objectAtIndex:i]; NSString *escapedUrlString = [urlString stringByAddingPercentE

浏览 0提问于2013-02-22得票数 0

回答已采纳

1回答

更新Nutch以获取每个获取的URL的父URL

、

当我运行Apache Nutch 1.4爬虫时，我想存储一些额外的信息。我想存储每个URL的父URL。例如，我想抓取一个有两个指向b.html和c.html的锚链的页面a.html，所以当我抓取a.html时，我应该会得到这样的结果： a.html null b.html a.html c.html a.html 我想存储像这样的东西。我已经阅读了nutch的工作原理，并在eclipse中运行了nutch。我还读取了fetcher.java，并记录了它获取内容的位置。但是我没有成功地知道Nutch从哪里获取给定页面的子URL。我认为这一步发生在解析步骤之后。

浏览 0提问于2012-05-22得票数 1

1回答

如何在python中遍历csv文件以编辑存储的URL并将其打开？

、、、、

python是新手，但在C语言方面有大约3+年的业余经验。我在Excel中有一个.csv文件，其中一个列中有大约30个URL，格式如下： b'‘ 如何使用Excel文件中的这些URL遍历列，并编辑字符串以将其转换为如下所示的链接： '‘ 另外，我可以使用哪个模块打开链接并将其内容(文本)写入到新列中？我知道有很多模块可以抓取文章内容，但我不知道之后如何真正将其写入csv。非常感谢！

浏览 2提问于2018-01-01得票数 0

1回答

无法纠正- ValueError:未知url类型:链接

、、、、

我目前正在运行这段代码，以便将文章url链接刮到csv文件中，并访问这些url(在csv文件中)，将各自的信息抓取到文本文件中。我能够抓取到csv文件的链接，但是我无法访问csv文件来抓取更多信息(文本文件也没有创建)，并且遇到了一个ValueError。 import csv from lxml import html from time import sleep import requests from bs4 import BeautifulSoup import urllib import urllib2 from random import randint outputFile

浏览 1提问于2017-08-07得票数 1

回答已采纳

3回答

作为页面标题中的变量的url或内容

、、

我正在设计一个网站，其中各种形式的外部链接都在我的页面上显示。我正在使用 $url=$_GET['url']; $website_data = file_get_contents($url); echo $website_data; 因此，基本上用户只需单击类似www.test.com/display_page.php?url=http://www.xyz.com/article/2.jpg的超链接即可我的页面，list_of_images.php，通常有一个图像列表，页面上的每个图像都有href，当任何图像被点击时，它会转到display_page.php，它会在页面顶部显

浏览 2提问于2010-12-21得票数 0

回答已采纳

1回答

Scrapy只抓取了4页

、

这是抓取只有4个链接，并返回15个抓取项目/行，但我需要抓取20个链接与35+抓取项目。如果你们谁来帮我，那将对我很有帮助 from scrapy import Spider from scrapy.http import Request class TastySpider(Spider): name = 'tasty' allowed_domains = ['tasty.co'] start_urls = ['https://tasty.co/topic/game-day'] def parse(se

浏览 0提问于2018-12-18得票数 0

1回答

Facebook共享调试器抓取主页URL，而不是Angular 6中给定的URL

、、

Facebook共享调试器工具抓取了错误的页面。我给了一个完整的网址与slug (指向我的网站上的个人网页)，我希望它通过facebook分享按钮。它不是抓取我想要的页面，而是抓取我网站的主页。我想让它刮掉https://example.com/slug 相反，它抓取了https://example.com 我已经使用以下代码更新了og:url的meta标记 this.meta.updateTag({ property: 'og:url', content: 'https://example.com/'+this.slug }

浏览 5提问于2020-02-10得票数 1

2回答

当抓取一个使用Javascript的网页时(也许还有其他东西)

、、

我希望能够访问一个像这样的网页，并能够收集到各种结果的链接。我使用Python的urllib.request和bs4进行抓取。然而，尽我最大的能力理解我在看什么，链接在某种嵌入式Javascript对象的内部。我试着直接下载页面的HTML源代码，试图查看它并理解它，但是它作为一个包含图片和各种HTML文件的文件夹下载，我不知道一个网页怎么能是一个文件。但我所做的却是： import urllib.request as ul url = 'http://www.epicurious.com/tools/searchresults?search=banana' source =

浏览 4提问于2015-11-01得票数 2

回答已采纳

1回答

图像搜索排序

、、

在谷歌图像搜索? 中有哪些特定的图像因素有助于排名？寻找什么有助于排名和图像的相关性以上和以上的SEO主机网站本身。例如，我的在线图库在普通(文本)搜索中的关键字排名很好，但在图像搜索中则要少得多。此外，图像搜索的结果往往是错误的，而文本搜索结果则不然。具体来说，一些地方或纪念碑的照片经常出现，以寻找另一个地方。

浏览 0提问于2011-08-02得票数 3

回答已采纳

1回答

如何阻止S3桶上的公共访问，同时允许我的rest和移动应用程序访问这些文件

、、

用例:我希望能够：将图像和音频文件从后端上传到S3桶在后端列出并查看/播放内容返回API响应中的对象URL 移动应用程序可以查看/播放带有或不带URL的？来自移动侧的身份验证如果不公开S3桶，这是可能的吗？

浏览 3提问于2021-02-12得票数 0

1回答

如何检查是否没有加载音频？

、、、

我编写了一些音频抓取脚本，搜索mp3音频文件url链接，并将它的url加载到我的HTML audio's src中。然而，我发现一些mp3 url不能正常工作，因此audio无法执行load()，因为音频文件一开始就无法工作。我查找了audio\video dom html引用，但没有找到任何有用的方法或属性，如果音频加载不当，将返回值。假设我有以下代码： var url= $(data).find(".download_button a").attr('href'); $('source').attr("src", u

浏览 1提问于2015-11-05得票数 1

回答已采纳

2回答

从美丽的汤中抓取信息并将其放入文本文件？

、、

我已经开始学习如何使用urllib和漂亮汤从网站上抓取信息。我想从这个页面获取所有文本(在代码中)，并将其放入一个文本文件中。 import urllib from bs4 import BeautifulSoup as Soup base_url = "http://www.galactanet.com/oneoff/theegg_mod.html" url = (base_url) soup = Soup(urllib.urlopen(url)) print(soup.get_text()) 当我运行它时，它会抓取文本，尽管它输出的是所有字母之间的空格，但仍然显示H

浏览 0提问于2012-10-18得票数 1

回答已采纳

1回答

Sonos是否支持使用播放列表的直播无线电数据流，例如m3u/pls

一些实况无线电数据流使用m3u/pls播放列表，这是一个文本文件，其中包含指向其他音频文件或播放列表位置的一系列链接。 Sonos是否支持现场广播服务的这种播放模式？

浏览 0提问于2015-11-19得票数 0

1回答

有没有我可以使用的脚本，输入一个url，它就会抓取图片？

、

我正在开发一个需要在页面上抓取图像的网站...例如，我会向最终用户提供一个文本输入-他们输入url....and，如果他们在"x"px dimensions..for example..if上找到页面上的图像，他们输入亚马逊产品页面的url - ...it然后抓取产品图像……然后保存在我的服务器上。有没有人知道有现成的脚本可以做到这一点或在线教程？-想想Facebook..when，当你输入某个url...of进行分享时，它会抓取该页面上的image...and文本。谢谢。

浏览 0提问于2012-02-07得票数 0

回答已采纳

1回答

抓取href链接并从这些链接中抓取

、、、

我正在做python抓取，我试图获取href标签之间的所有链接，然后逐个访问，从这些链接中抓取数据。我是一个新手，不知道如何从this.The代码继续： import requests import urllib.request import re from bs4 import BeautifulSoup import csv url = 'https://menupages.com/restaurants/ny-new-york' url1 = 'https://menupages.com' re

浏览 12提问于2019-09-29得票数 0

1回答