如何使用BeautifulSoup在Python3中选择html文件中的特定日期'th‘元素来进行How抓取？ - 腾讯云开发者社区

、、

我只是想从这个网页https://www.history.navy.mil/content/history/nhhc/research/histories/ship-histories/us-ship-force-levels.html#1886上找出日期。日期在'th‘元素中，我尝试只获取包含日期的日期。我猜也许是通过使用正则表达式？我知道这是一件非常容易的事情，但是，我找不到任何教程或论坛问题来匹配我正在尝试做的事情。任何帮助都将非常感谢:D import requests from bs4 import BeautifulSoup import re r = requ

浏览 10提问于2019-10-06得票数 1

回答已采纳

1回答

如何每天更新数据并将数据保存到CSV文件？

我正在尝试记录网站上的covid数据，并每天更新新的案例。到目前为止，我已经成功地通过抓取将病例数量放入了文件中，但每天我都必须手动输入日期并运行文件以获取更新的统计数据。我该如何编写一个脚本来每天更新CSV，使用新的日期和新的案例数量，同时保存旧的以供将来使用？ import csv import bs4 import urllib from urllib.request import urlopen as uReq from urllib.request import Request, urlopen from bs4 import BeautifulSoup as soup #For

浏览 4提问于2020-05-13得票数 1

1回答

如何在没有类名的情况下刮取特定的标记？

、

我正在开发一个python脚本，用于从特定站点抓取数据：我在用BeautifulSoup。HTML页面上有趣的数据位于以下结构中： <div class="table-scrolling-wrapper"> <div class="abs-content clearfix text-formatted field field--name-field-abs-text-paragraph-content field--type-text-long field--label-hidden">

浏览 3提问于2022-08-07得票数 1

1回答

从html文件中删除空表

、

我有一个包含SQL O/P表的HTML文件，但是在每个想要的表之后，我也得到了一个空白表，我打算删除它。空白表被编码为- <table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> </tr> </thead> <tbody> </tbody> </table> 看起来就像我正在考虑使用BeautifulS

浏览 1提问于2019-08-23得票数 0

回答已采纳

1回答

如何在div中获取两个不同的类文本

、

我试着用Python和BeautifulSoup做一个网页抓取，但是我碰到了障碍。以下是原始页面标记： <div class="name">target 1<div class="date">updated 25th January 2019</div></div> 我只需要第一部分(“目标1") 我尝试用以下命令查找类"name“ mgroup[0].a.findAll("div",{"class":"name"}) 或者 mgroup[0].a

浏览 16提问于2019-06-21得票数 0

回答已采纳

1回答

导出到未对齐的表

、、

我试图从这个链接中抓取一个表：当抓取表时，名称和统计数据类别对齐，但数字本身不对齐。 import csv from bs4 import BeautifulSoup import requests soup = BeautifulSoup( requests.get("https://www.espn.com/nba/stats/player/_/table/offensive/sort/avgPoints/dir/desc", timeout=30).text, 'lxml') def scrape_data(url): # t

浏览 0提问于2019-10-28得票数 0

回答已采纳

3回答

如何用BeautifulSoup提取HTML表中的数据

、、

如何提取特定数据(本例中为39.74% )，然后在下面的F1示例中使用BeautifulSoup提取“Proj.EPS增长(Proj.EPS Growth (BeautifulSoup))”？我对Python完全陌生。谢谢! <div class="high_low_table" id="high_low_table"> </table> <tbody> <tr> <th class="alpha" scope="row">Proj. EPS Growth (Q1) &l

浏览 2提问于2021-08-20得票数 0

回答已采纳

1回答

尽管我已经成功地使用pip薄荷莎拉安装了BeautifulSoup4，但它仍然无法工作。

、、

我是一个全新的linux用户，使用linux，我刚刚安装了python3.5以及BeautifulSoup来进行一些web抓取。但是，当我输入以下命令时，会收到一个跟踪错误：从bs4导入BeautifulSoup 错误告诉我没有模块bs4。我也尝试过:从bs4 BeautifulSoup进口BeautifulSoup进口美汤这很奇怪，因为如果我进入终端并给出命令pip列表，它会显示我所有程序的列表，并声明我有beautifulsoup4 (4.5.1) 我成功地以同样的方式使用pip安装了一个名为requests的模块，它成功了。我认为有一件事可能阻碍了Linux，它安装了pytho

浏览 1提问于2016-09-21得票数 0

2回答

UserWarning:未安装soupsieve包。不能使用CSS选择器

、

嘿，伙计们，我需要你们的帮助，我在网络抓取领域迈出了我的第一步。当我试图关注youtube上的一个网络抓取教程视频时，我收到了这样的警告。我已经安装了soupsieve和BeautifulSoup (pip install等)，我甚至从我正在抓取的网站上得到了正确的结果，但仍然得到了这个恼人的警告，我该怎么办？我使用的是python 3，pycharm。 from urllib.request import urlopen as uReq`enter code here`; from bs4 import BeautifulSoup as soup; my_url = 'https:

浏览 0提问于2019-05-15得票数 2

2回答

如何使用BeautifulSoup在python中从网站中未加载的选项卡中抓取表数据

、、、

我正在尝试从这个website中抓取索引数据。我试图从索引选项卡中抓取滚动数据，但当我抓取表格时，其内容显示如下： <table cellspacing="0" class="derivatives_section table table-striped responsive dt-responsive nowrap derivatives_rollover_tbl" id="rollover_index_table" width="100%"> <thead> <tr> <th>

浏览 14提问于2021-04-08得票数 0

回答已采纳

3回答

Web抓取:用Python抓取多个Web

、、

from bs4 import BeautifulSoup import requests url = 'https://uk.trustpilot.com/review/thread.com' for pg in range(1, 10): pg = url + '?page=' + str(pg) soup = BeautifulSoup(page.content, 'lxml') for paragraph in soup.find_all('p'): print(paragraph.text) 我想

浏览 1提问于2019-01-13得票数 3

回答已采纳

2回答

facebook页面抓取需要登录

我正在抓取facebook页面数据，但要访问所有数据，我需要登录到我正在使用的帐户。 import wget from bs4 import BeautifulSoup url = "https://www.facebook.com/hellomeets/events" down = wget.download(url) f = open(down, 'r') htmlText = "\n".join(f.readlines()) f.close() print htmlText 如何登录账号，抓取页面的所有数据？

浏览 4提问于2015-06-17得票数 2

1回答

方法不允许第一个API

、、、

我已经经历了一些网络抓取教程，现在尝试一个基本的api抓取器。这是我的代码 from bs4 import BeautifulSoup import requests url = 'https://qships.tmr.qld.gov.au/webx/services/wxdata.svc/GetDataX' response = requests.get(url, timeout=5) content = BeautifulSoup(response.content, "html.parser") print (content) 提出了不允许的方法

浏览 10提问于2019-10-11得票数 0

回答已采纳

1回答

Python BeautifulSoup4只显示标签，不显示文本

、、

我正在练习网络抓取，使用BeautifulSoup4从网站抓取数据。然而，当我运行我的代码时，当我检查网站上的元素时，它只显示开始标记和结束标记，当它们之间有明显的文本时。我的代码： import requests from bs4 import BeautifulSoup as bs url = 'https://emenscr.nesdc.go.th/thaime/loanact/view.html?id=43k11nkm0VFwVVOZxlX9' r = requests.get(url).text soup = bs(r,'lxml') p_na

浏览 33提问于2021-07-28得票数 0

回答已采纳

1回答

使用Python的WebScraping :请求导入错误

、

我开始在网络上抓取“世界”。这是我的代码： import urllib import urllib.request from bs4 import BeautifulSoup theurl = "https://twitter.com/realdonaldtrump"; thepage = urllib.request.urlopen(theurl) soup = BeautifulSoup(thepage,"html.parser") print (soup.title) 当我尝试运行代码时，出现以下错误： Traceback (most recent c

浏览 0提问于2019-12-04得票数 0

1回答

如何在网站上搜索需要订购的多个值

、、

我试着用漂亮的汤来抓取NHL比赛的结果，但是我很难弄清楚比赛进行的日期和结果的顺序。游戏的日期在标签下，结果在课堂上的“字段内容”。目前，我能够找到这两个值，并将它们放在自变量中，但我希望保持它们在原始网站中出现的顺序，并将数据放在一个变量中。 import bs4 as bs import urllib.request sauce = urllib.request.urlopen("https://www.jatkoaika.com/nhl/ottelut").read() soup = bs.BeautifulSoup(sauce, features="html

浏览 1提问于2019-11-04得票数 0

回答已采纳

1回答

每次运行此程序时都调用datetime.now()

、

我正在使用漂亮的汤来抓取一个网站，我想将抓取的日期与调用datetime.date.today()得到的日期进行比较。 from BeautifulSoup import BeautifulSoup import datetime, urllib2, re opener = urllib2.build_opener() opener.addheaders = [('User-agent', 'Mozilla/5.0')] url = ('http://phoenix.backpage.com/SportsEquipForSale/') myUr

浏览 0提问于2013-07-10得票数 1

2回答

BeautifulSoup没有找到所有‘

、、

我目前正在尝试使用BeautifulSoup在Python3.7中刮取一个统计站点。我试图从一个表中抓取所有的标题作为我的列标题，但出于某种原因，BeautifulSoup没有抓取位于'th‘标记中的所有标头。这是我的代码： url = 'https://www.eliteprospects.com/team/552/guelph-storm/2005-2006?tab=stats' html = urlopen(url) scraper = BeautifulSoup(html,'html.parser') column_headers = [th.

浏览 1提问于2019-08-29得票数 0

回答已采纳

1回答

在python中从给定的url中抓取两列

、、、

我必须从中抓取数据，我只需要从表中获取公司的符号和名称，我已经为整个表编写了代码，但是如何才能获得所需的列？我的代码是： import requests from bs4 import BeautifulSoup import pandas url = 'https://finance.yahoo.com/trending-tickers' r = requests.get(url) soup = BeautifulSoup(r.text,'html.parser') table = soup.find("table",{"clas

浏览 0提问于2018-04-30得票数 2

回答已采纳

2回答

将列表的元素附加到多维列表中

、、、、

嗨，我在上用python的NBA数据做一些网络抓取。篮球参考的一些元素很容易被刮掉，但是这个元素给我带来了一些麻烦，因为我缺乏巨蟒知识。我能够抓取我想要的数据和列标题，但是我最终得到了两个数据列表，我需要根据它们的索引组合它们(我认为呢？)所以player_injury_info的索引0和player_names等的索引0成直线，我不知道该怎么做。下面，我已经粘贴了一些代码，您可以跟随这些代码。 from urllib.request import urlopen from bs4 import BeautifulSoup import pandas as pd from datetime

浏览 1提问于2021-07-31得票数 0

回答已采纳

1回答

在一列中解析特定内容的HTML表，并将生成的表打印到python文件中

、

我有一个带有表的文件test_input.htm： <table> <thead> <tr> <th>Acronym</th> <th>Full Term</th> <th>Definition</th> <th>Product </th>

浏览 4提问于2022-01-09得票数 -1

回答已采纳

1回答

为什么bs4中的find_next_sibling可以在一行代码上工作，而不能在另一行非常相似的代码上工作？

、、

我正在编写一个简单的网络抓取器，以便从德克萨斯环境质量委员会(TCEQ)网站获取数据。我需要的信息在'td‘标签里面。我通过引用前面的'th‘来抓取适当的'td’，它们都有相同的ID文本。我使用find_next_sibling将数据抓取到一个变量中。下面是我的代码： import requests from bs4 import BeautifulSoup URL = "https://www2.tceq.texas.gov/oce/eer/index.cfm?fuseaction=main.getDetails&target=323191"

浏览 31提问于2019-10-23得票数 1

回答已采纳

2回答

使用beautifulSoup查找标头后的表？

、、、

我正试着从一个网站上抓取一些数据。我想要的数据列在一个表中，但是有多个表，没有ID。然后我想到，我会在我正在搜索的表的上方找到标题，然后用它作为指示器。这真的困扰了我，所以作为最后的手段，我想问是否有人知道如何BeautifulSoup找到这张桌子。下面提供了HTML代码的一个片段，预先感谢:) 我感兴趣的那张桌子，就在<h2>Mine neaste vagter</h2>下面 <h2>Min aktuelle vagt</h2> <div>

浏览 1提问于2021-06-11得票数 2

回答已采纳

3回答

如何使用python从html中的动态表中抓取所有行

、、

下面是抓取的链接：我几乎尽我所能。我是网络抓取的初学者。我的代码： import requests from urllib.request import urlopen from urllib.error import HTTPError from urllib.error import URLError from bs4 import BeautifulSoup import pandas as pd import csv try: html = urlopen("http://5000best.com/websites/Games/") exce

浏览 3提问于2020-05-11得票数 0

回答已采纳

1回答

用BeautifulSoup实现对冲基金数据的网络抓取

、、

我想从hedgefollow.com上抓取数据。我尝试了以下代码，但没有获得每个股票所需的输出，而是只获得了标题，而不是实际数据(例如，第一行: AMZN，Amazon Com Inc，14.32%，180.70k，$ 352.31M，713.3%，158.48k等) 输出：股票。公司名称。占投资组合的百分比。共享。价值。更改百分比。变化。所有权历史记录。价格历史。日期。 import requests from bs4 import BeautifulSoup r = requests.get('https://hedgefollow.com/funds/Duqu

浏览 4提问于2020-05-25得票数 1

2回答

在PythonAnywhere上运行Python脚本时语法错误无效

我正在尝试运行我为抓取特定网站而编写的Python脚本，然后当价格达到特定数字时，我需要收到电子邮件通知，因此我使用了PythonAnywhere，但是当我在控制台中运行脚本时，我会得到以下错误，即使它在Pycharm上正常运行： File "<stdin>", line 1 python3 main.py ^ SyntaxError: invalid syntax 这是我的密码： from bs4 import BeautifulSoup import requests import smtplib response = req

浏览 2提问于2022-01-06得票数 0

1回答

使用单个URL在多个页面上刮取表

、、、

我正试着从Fangraphs中抓取数据。表格被分成21个页面，但所有页面都使用相同的url。我对webscraping (或者一般的python )非常陌生，但是Fangraphs没有公共API，所以抓取页面似乎是我唯一的选择。我目前正在使用BeautifulSoup来解析超文本标记语言代码，我能够抓取初始表，但那只包含前30个球员，但我想要整个球员池。两天的网络搜索，我被卡住了。链接和我当前的代码如下所示。我知道他们有一个下载csv文件的链接，但在整个赛季中这会变得单调乏味，我希望加快数据收集过程。任何方向都会有帮助，谢谢。 https://www.fangraphs.com/projec

浏览 21提问于2020-04-18得票数 1

回答已采纳

1回答

无法从web表中刮取新冠肺炎数据

、

我正在用Python研究新冠肺炎在科索沃的传播。问题是，从表上的web抓取中得到的结果是空的。网络是表，我需要它的记录：我使用了许多方法提取记录，但没有成功，使用的最新代码仅用于标题： import requests import pandas as pd from bs4 import BeautifulSoup link = 'https://corona-ks.info/?lang=en' # get web data req = requests.get(link) # parse web data soup = BeautifulSoup(req.co

浏览 2提问于2021-03-18得票数 1

回答已采纳

1回答

为什么我会得到“无”的回应?这到底意味着什么？

、、、

我正在学习python，在抓取一个web之后，我不太理解响应格式。为什么我没有得到作为这个代码的响应？ import requests from bs4 import BeautifulSoup quote_page = 'https://www.bloomberg.com/quote/SPX:IND' page = requests.get(quote_page).text soup = BeautifulSoup(page, "lxml") price_box = soup.find('span', class_="pric

浏览 0提问于2019-08-10得票数 0

回答已采纳

1回答

我的回调函数和正则表达式无法让漂亮的汤发挥作用

、、、

因此，我尝试使用以下代码从href属性匹配模式/how- to - use /a-zA-Z+的网站中抓取所有标记代码如下： import requests from bs4 import BeautifulSoup import re webpage = requests.get('https://www.talkenglish.com/vocabulary/top-1500-nouns.aspx').content soup = BeautifulSoup(webpage, "html.parser") def has_how_to_use(tag):

浏览 13提问于2021-10-27得票数 1

回答已采纳

2回答

Python 3 BeautifulSoup4从每个<tr>中选择特定的<td>标签

、、

我从以下格式的HTML表中抓取数据： <table> <tr> <th>Name</th> <th>Date</th> <th>Number</th> <th>Address</th> </tr> <tr> 1 <td> Name-1 </td> <td> Date-1 </td>

浏览 0提问于2016-10-25得票数 0

1回答

‘无法导入'bs4’pylint‘- vs代码

、、

我正在尝试使用Python (Python3)学习web抓取，但是我似乎无法导入任何包，特别是BeautifulSoup，我也尝试过导入openpyxl，但同样的错误也出现了。 import openpyxl as xl from bs4 import BeautifulSoup 我的控制台立即闪烁，并显示以下错误： unable to import 'bs4' pyline(import-error) [1,1] 我的语法是正确的，我已经检查了包是否已经安装，我甚至已经重新安装了它们，它们肯定在那里。我正在使用Mac，任何帮助都将不胜感激。

浏览 42提问于2021-04-08得票数 0

1回答

创建日期列表并在URL中插入

、、

我对Python还是比较陌生的，所以请耐心听我说，但这是我的问题。我有一个特定的日期列表，需要插入到URL中，然后循环通过每个URL来抓取web数据。我也做过类似的任务，但在不需要创建列表的情况下。下面是一个这样的例子。 url_template = "https://www.basketball-reference.com/play- index/lineup_finder.cgi?request=1&match=single&player_id=&offset={set}" lineup_df = pd.DataFrame() for set i

浏览 0提问于2018-03-09得票数 0

1回答

Selenium下载完整的html页面

、

我正在学习使用Python Selenium和BeautifulSoup进行web抓取。目前，我正在尝试抓取谷歌搜索趋势上的热门搜索这是我当前的代码。然而，我意识到完整的html没有下载，我只有最近几个日期的内容。我能做些什么来纠正这个问题？ from selenium import webdriver from bs4 import BeautifulSoup googleURL = "http://www.google.com/trends/hottrends#pn=p5" browser = webdriver.Firefox() browser.get(googl

浏览 1提问于2013-05-17得票数 15

1回答

Python+BeautifulSoup:从网页中抓取特定的表

、、

我正试着从：中抓取一个特定的表我想要的是股票信息。日期、公司名称、比率以及是否可以选择。到目前为止，我的情况如下： from bs4 import BeautifulSoup import urllib2 url = "http://biz.yahoo.com/c/s.html" page = urllib2.urlopen(url) soup = BeautifulSoup(page.read()) alltables = soup.find_all('table') 这段代码给出了页面上的所有表(不止一个)。 1)我不知道如何确定我需要的表格。 2

浏览 5提问于2016-01-07得票数 1

回答已采纳

1回答

网络擦除脚本正在输出数据3次。我做错什么了？

、、

我正在尝试通过在篮球参考网站上练习来更好地学习网络抓取。我从网站上抓取了我想要的东西，但它打印了三次，而我只想打印一次。我做错了什么？谢谢! import requests from bs4 import BeautifulSoup as bs result = requests.get('https://www.basketball-reference.com/leagues/NBA_2020.html') src = result.content soup = bs(src, 'lxml') teams = soup.find('div&#

浏览 22提问于2020-01-24得票数 2

回答已采纳

1回答

如何在python和BeautifulSoup中从html表中抓取url

、、

我想从的html表中刮取urls。我收集了的位置，数据，日期，摘要，总结，最后期限，。但是摘要字段有另一个页面的url。我想把整个表和这个url一起刮掉，这样我的刮下来的数据就变成了位置、日期、日期、摘要、截止日期、日期、摘要、截止日期、url、。 import requests as rq from bs4 import BeautifulSoup import pandas as pd url = 'https://www.tendersinfo.com/global-information-technology-tenders-{}.php' amount_of_pa

浏览 2提问于2020-05-29得票数 0

回答已采纳

1回答

如何对使用iframe的网站进行uses抓取？

、

我正在尝试抓取这个网站的https://swimming.org.nz/results.html'。在接下来的表单中，我只填写了年龄列8到8。我使用下面的代码来抓取StackOverflow中其他地方建议的表。我找不到那张桌子。如何获取这个年龄段8到8岁的所有表格。 import requests from bs4 import BeautifulSoup s = requests.Session() r = s.get("https://swimming.org.nz/results.html") soup = BeautifulSoup(r.content,

浏览 9提问于2021-05-04得票数 0

3回答

需要帮助从篮球中抓取HTML -参考

、、

我对使用python/BeautifulSoup/urllib.request进行new抓取非常陌生，并且一直在尝试如何抓取这个表。我在网上找到了一些其他的代码，并进行了尝试，试图了解它们是如何工作的，并对它们进行修改，但它们总是过滤掉第一列，这是我需要的。代码： from urllib.request import urlopen from bs4 import BeautifulSoup import pandas as pd import numpy # NBA season we will be analyzing month = "january" # URL

浏览 0提问于2021-01-14得票数 1

1回答

使用Vimeo API获取实时事件的日期

、

我有一个项目，涉及使用Vimeo主办的现场活动。我知道我们可以在Vimeo上抓取视频以及它们的详细信息，使用： $response = $vimeo->request('/me/videos', array('name' => 'video_name'), 'GET'); 这工作很好，并返回我们的所有视频，包括视频和未来的事件。但是，我找不到事件设置为在Vimeo返回的有效负载内发生的日期。它返回以下日期，这些日期都不是事件将发生的日期(3个月后)： "created_time" =>

浏览 12提问于2019-12-12得票数 1

回答已采纳

1回答

Python/BeautifulSoup抓取和打印到csv

、、

我正在编写一个代码来收集选举数据并组织成一个数据集。下面是我所做的： import requests import urllib.request import time from bs4 import BeautifulSoup response= requests.get('https://elections2018.wallonie.be/fr/resultats-chiffres?el=PR&id=PRA52011') soup = BeautifulSoup(response.text,"html.parser") soup.findAll(&

浏览 4提问于2021-03-02得票数 0

1回答

用于Pytest的模拟/Monkeypatch BeautifulSoup html对象

、、、

我正在用Python编写一个web抓取项目，并试图添加自动化测试w/ Pytest。我对web抓取并不陌生，但我对测试非常陌生，我相信这里的想法是，我应该模拟HTTP请求，用一些虚拟的html夹具代码来代替它，以测试函数的其余部分是否工作，而不必依赖于从实际的url中请求任何内容。下面是我的网页抓取功能。 import pandas as pd from bs4 import BeautifulSoup from urllib.request import urlopen def get_player_stats_data(): """ Web Sc

浏览 7提问于2022-01-18得票数 3

1回答

使用python 3的web抓取教程？

、、

我正在尝试学习python 3.x，这样我就可以抓取网站了。人们推荐我使用Beautiful Soup4或lxml.html。有人能告诉我Python3.x的BeautifulSoup教程或示例的正确方向吗？谢谢你的帮助。

浏览 0提问于2013-05-28得票数 5

回答已采纳

1回答

抓取数据时无法获取<tr>标签

、、

我尝试使用BeautifulSoup抓取所有tr标记，但它返回none。代码： from urllib.request import urlopen from bs4 import BeautifulSoup url = 'https://www.pro-football-reference.com/years/2020/defense_advanced.htm' html = urlopen(url) stats_page = BeautifulSoup(html, "lxml") column_headers = stats_page.findAll(

浏览 32提问于2021-01-15得票数 1

回答已采纳

2回答

如何更改我正在抓取的html的日期格式？

、、、

我正在刮掉一个网站的日期。日期在我的浏览器中以可用的格式显示，但是当我从网站中提取数据字符串时，格式会发生变化吗？以MM/DD/YYYY格式获取日期的最简单方法是什么？在网站上，日期是："12/ 05 /2013 9:26下午格林尼治时间“，当我在下面的脚本中摘录时，显示为”清华12月16日:26:24 EST 2013格林尼治时间“。我只想捕捉"12/05/2013“的值。 #Import libraries import urllib2 from bs4 import BeautifulSoup import datetime #create output docume

浏览 6提问于2013-12-06得票数 0

回答已采纳

3回答

使用BeautifulSoup抓取Javascript注入的文本

、、

我想要从网页中抓取日期，而日期的文本(脚本标记之后)是由JavaScript注入的:我想只使用Beautifulsoup来抓取它，而不是使用selenium <div class="row"> <span class="LName"><a target="_blank" href="http://google.com">[me too]</a></span> <script language="Javascript" type=&#

浏览 50提问于2020-06-29得票数 2

回答已采纳

1回答

使用BeautifulSoup获取特定标记后的值

、、、

我很难让BeautifulSoup为我刮一些数据。从这个代码示例中访问日期(实际数字，2008)的最佳方法是什么？这是我第一次使用Beautifulsoup，我已经知道了如何从页面中抓取urls，但是我不能把它缩小到只选择单词Date，然后只返回后面的任何数字日期(在dd括号中)。我要问的是什么可能吗？ <div class='dl_item_container clearfix detail_date'> <dt>Date</dt> <dd> 2008 </dd> </d

浏览 3提问于2014-09-11得票数 7

回答已采纳

3回答

Python版本弄乱了我的BeautifulSoup4

、、、

所以我只是下载了get-pip.py并运行它。一切看起来都很好(我得到了“成功安装pip")。当我运行时： pip install beautifulsoup4 我得到了： Requirement already satisfied (use --upgrade to upgrade): beautifulsoup4 in /Library/Python/2.7/site-packages/beautifulsoup4-4.3.2-py2.7.egg Cleaning up... 所以看起来我已经为python 2.7...yes设置了beautifulsoup4？我想把它设置为Py

浏览 0提问于2014-05-23得票数 0

1回答

如何在Python中安装诸如请求和BeautifulSoup之类的东西？

、

我是Python及其库和一般安装的极端初学者。我想做一个非常简单的谷歌搜索网络抓取工具。有人告诉我要使用请求和BeautifulSoup。我已经通过使用python3在Mac上安装了brew install python3，我想知道如何获得这两个库我搜索了一下，很多结果说，通过执行brew install python3，它将自动安装pip，这样我就可以使用类似于pip install requests的东西，但是它说pip:命令没有找到。通过运行python3 --version，它表示Python3.7.4

浏览 2提问于2019-08-26得票数 0

回答已采纳

3回答

如何解析历史BTC数据从协市帽？

、、、、

我正在学习如何使用从Coinmarketcap.com中抓取BTC历史数据。我想分析以下几点： 1)日期 2)关闭 3)体积 4)市值到目前为止，我的代码如下： import requests from bs4 import BeautifulSoup from fake_useragent import UserAgent ua = UserAgent() header = {'user-agent': ua.chrome} response = requests.get('https://coinmarketcap.com/currencies/bitcoin

浏览 3提问于2019-10-20得票数 3

回答已采纳