美汤解析medium python文章发表日期_python中的美汤模块解析问题_用python美汤解析NBA参考文献 - 腾讯云开发者社区

python、beautifulsoup

我正在使用python和漂亮汤(这两个都是新手！)，我想登录一个供应商网站。所以它们的形式看起来像(简化的)： <form name=loginform action=/index.html method="post"> <input name=user> <input name=pass"> </form> 有没有办法跟踪cookie？

浏览 2提问于2010-07-27得票数 7

回答已采纳

1回答

从我自己的页面解析HTML

javascript、html、google-app-engine

我已经构建了一个键盘快捷键:选择文本，然后按ctrl+alt+m -将文本灰显并将所选文本插入注释框中。但一旦刷新，灰色部分就消失了；如何将修改后的灰色文本保存回我的数据库？我想在用户提交评论时保存它。灰色部分是使用完成的。我似乎找不到一种方法来解析新的数据，而不使用漂亮汤，但美丽汤将要求我“获取与发出请求的URL相同的URL”。有没有更好的方法从我自己的页面获取数据？对其他可以达到类似结果的建议持开放态度。我在webapp2和jinja2中使用python。该页面的地址为：

浏览 0提问于2013-05-31得票数 0

回答已采纳

2回答

为什么美丽的汤忽略了CDATA

python、beautifulsoup

我正在为雅虎天气API (python2.7)使用Beautiful： url = 'http://weather.yahooapis.com/forecastrss?w=2344116' page=urllib2.urlopen(url).read() soup = BeautifulSoup(page) 但在此之后，在解析的url中，没有任何CDATA。为什么美汤忽视了这一点？如何防止忽略CDATA？在xml中： <img src="http://l.yimg.com/a/i/us/we/52/11.gif"/> 在已分析的页面中：正如

浏览 4提问于2014-10-26得票数 0

回答已采纳

1回答

内部网络刮板库

python、python-3.x

是否有不是用户或外部库的python web刮刀库？我发现了漂亮的汤、硒和请求作为用户创建的python web抓取库。在我开始做这个之前，我只想知道我是否不需要安装不同的库。

浏览 3提问于2022-03-13得票数 -1

回答已采纳

2回答

使用pandas读取下载的html文件

python、html、import、pandas

作为标题，我尝试使用read_html，但出现以下错误： In [17]:temp = pd.read_html('C:/age0.html',flavor='lxml') File "<string>", line unknown XMLSyntaxError: htmlParseStartTag: misplaced <html> tag, line 65, column 6 我做错了什么？更新01 HTML在顶部包含一些javascript，然后是一个html表。我使用R来处理它，通过解析html by XML

浏览 2提问于2014-07-31得票数 8

回答已采纳

2回答

美汤解析medium python文章发表日期

python、parsing、beautifulsoup

我需要解析“发表日期”的文章中使用美丽的汤。我成功地在循环中解析了作者、标题、阅读时间，但由于某种原因，“发布日期”对我不起作用。下面是一个例子： https://medium.com/interlay/archive/2020 因此prasing的输出将是Jun 18, 2020 ; Mar 5 , 2020 ; Feb 23, 2020 etc.

浏览 25提问于2021-11-06得票数 0

回答已采纳

1回答

BeautifulSoup刮擦:我很困惑

python、beautifulsoup

我正在尝试刮，我想检查所有的锚标记。我已经导入了漂亮汤4.3.2，下面是我的代码： url = """http://www.civicinfo.bc.ca/bids?pn=1""" Html = urlopen(url).read() Soup = BeautifulSoup(Html, 'html.parser') Content = Soup.find_all('a') 我的问题是，内容总是空的(即内容= [])。有人有什么想法吗？

浏览 9提问于2016-02-02得票数 0

回答已采纳

4回答

Python将html转换为文本并模拟格式

python、html、beautifulsoup

我正在学习BeautifulSoup，发现了许多"html2text“解决方案，但我正在寻找的解决方案应该模仿格式： <ul> <li>One</li> <li>Two</li> </ul> 会变成 * One * Two 和 Some text <blockquote> More magnificent text here </blockquote> Final text 至 Some text More magnificent text here Final text 我在看

浏览 0提问于2013-03-25得票数 11

回答已采纳

1回答

用BS4进行网络抓取:无法获取表

python-3.x、beautifulsoup

在浏览器中打开下面的URL时，你会看到一个紫色的图标，名字是“复制”。当您选择此图标(“复制”)时，您将实现一个完整的表，您可以粘贴到Excel中。如何将此表作为Python中的输入？我的代码在下面，它没有显示任何内容： import requests from bs4 import BeautifulSoup url = "http://www.kianfunds2.com/" + "ارزش-دارایی-ها-و-تعداد-واحد-ها" result = requests.get(url) soup = BeautifulSoup(result

浏览 1提问于2018-03-19得票数 0

回答已采纳

1回答

如何使用漂亮的汤将javascript添加到html中？

javascript、python、html、beautifulsoup

我正在使用美汤来编辑一个html文件。我已经能够添加标记，但是在script元素中添加javascript代码时遇到了问题。我有以下代码： soup = BeautifulSoup(differencehtml, 'html.parser') # create a new tag tag = soup.new_tag("script") tag.append = jscodestring # this is not adding the javascript to the html file # tag.string = jscodestring # al

浏览 33提问于2018-08-30得票数 1

1回答

美汤不认得按钮标签

python、button、tags、beautifulsoup、soundcloud

我目前正在试验Python2.7.6中的美汤4 现在，我有一个简单的脚本来刮Soundcloud.com。我正在尝试打印页面上按钮标签的数量，但我没有得到我期望的答案。 from bs4 import BeautifulSoup import requests page = requests.get('http://soundcloud.com/sondersc/waterfalls-sonder') data = page.text soup = BeautifulSoup(data) buttons = soup.findAll('button') p

浏览 6提问于2014-05-26得票数 4

回答已采纳

1回答

不要从汤中获取数据

python、web-scraping、beautifulsoup

我用python创建了bs4网络抓取应用程序。我的程序返回空列表以供审阅。因为汤程序正常运行。 from bs4 import BeautifulSoup import requests import pandas as pd data = [] usernames = [] titles = [] comments = [] result = requests.get('https://www.kupujemprodajem.com/review.php?action=list') soup = BeautifulSoup(result.text, 'html.

浏览 7提问于2021-12-10得票数 -1

3回答

“汤”和“美汤”中的“汤”是什么意思？

beautifulsoup、jsoup

“汤”和“美汤”中的“汤”是什么意思，为什么它被称为“汤”？

浏览 1提问于2014-05-19得票数 10

1回答

Python中的Web抓取

python、web-development、scraping

我需要学习高级python编程技能才能使用python进行web抓取吗？或者，我应该看一些关于网络抓取的教程，同时学习使用python。我对python没有任何经验，因为我是Laravel开发人员，这是我第一次在web抓取中做这样的工作。

浏览 0提问于2019-11-04得票数 -1

1回答

一个特定的href爬行在python中的美丽的汤

python、url、beautifulsoup、web-crawler、google-crawlers

我正在努力学习美汤。在网站上，它有相同的href，但结果不同。例如，我的代码的结果是： 0001545654 6798 嗨 0001459640 发送 0001269765 CA 0001456527 CA 0001001379 气体我只想带上数字数字的URL =a href="/cgi-bin/browse-edgar?action=getcompany&CIK=0001545654&owner=exclude&count=40&hidefilings=0">0001545654 区域URL =a href="/cgi-b

浏览 3提问于2020-05-25得票数 0

2回答

BeautifulSoup等待JavaScript/角内容

javascript、python、html、angularjs、beautifulsoup

我试着用python从特定的url获取所有的图像。所以漂亮汤的使用是严格向前的，但我面临的问题是，不是所有的img标签都打印在控制台上。仔细查看所需的HTML文件，会发现缺少的图像来自角度，因为它们有一个数据ng-src标记。有没有办法让汤等到所有的脚本都写完？或者还有其他的方法来检测所有的img标签？到目前为止我的代码是： import urllib2 from BeautifulSoup import BeautifulSoup page = BeautifulSoup(urllib2.urlopen(url)) allImgs = imgs = page.findAll('

浏览 3提问于2017-01-13得票数 3

3回答

使用时区反序列化JSON DateTime

c#、json、datetime

我做了两个小时什么都没做。以下是以JSON表示的日期： "\/Date(1330355834000+0100)\/" 我找到的所有东西都没有时区或JavaScript。如何将其转换为DateTime (而不是Date)？

浏览 0提问于2012-03-08得票数 1

回答已采纳

1回答

使用BeaufifullSoup同时清理300多个页面

python、beautifulsoup

我有一个来自webget的txt文件，里面有300个html文件。(utf.txt) 我怎么才能清理它..。我试过美汤，但它只清洗了第一个。我需要的标签是"font“。 from bs4 import BeautifulSoup with open("utf.txt", encoding='utf-8') as fp: soup = BeautifulSoup(fp) print (soup.find_all('font')) 致以敬意，

浏览 12提问于2019-04-29得票数 0

1回答

BeautifulSoup，递归地寻址带有字符串参数的标记

beautifulsoup、python-3.5

假设我的XML如下所示： <a> <b>Some</b> <c>Content</c> <d>Here</d> </a> <a> <b>Some2</b> <c>Content</c> <d>Here</d> </a> <a> <b>Some3</b> <c>Content</c>

浏览 1提问于2016-03-26得票数 1

回答已采纳

3回答

为什么我上传的图片被载入/上载/2015/02，而不是/上载/2016/01？

date、uploads

今天是2016-01-01在我的控制台。 date Fri Jan 1 14:24:04 CST 2016 现在我写了一篇文章，附了一张今天拍摄的照片，并在今天出版。我发现照片的URL显示为： <a href="http://hwy.local/wp/wp-content/uploads/2015/02/scan.png"> <img src="http://hwy.local/wp/wp-content/uploads/2015/02/scan-169x300.png" alt="scan" width="169

浏览 0提问于2016-01-01得票数 7

2回答

在数据库中搜索Mysql

php、mysql、sql、full-text-search

有数据表Programmer和Lang Programmer行：ProjectID，Person Lang行：Id，name 在编程器中有数据: 1，John；3，Mike；2，汤米在Lang有: 1，Java；2，C#；3，Python 如何获得像这样的数据：爪哇约翰 C#迈克 Python汤米使用Mysql和PHP，我不知道。

浏览 3提问于2012-07-12得票数 1

回答已采纳

1回答

美汤类名有多个空格，find_all提供[]

python、beautifulsoup

使用漂亮的汤，我试图提取值(317.69)，但得到的结果是空的。我试图提取的html代码块是： <span class="Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)">317.69</span> 我尝试了以下两种编码方式： value = soup.find_all(attrs={'class': 'Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)'}) 和 value = soup.find_all('span', class_=

浏览 18提问于2020-01-29得票数 0

1回答

Azure Devops安装并运行Databrick CLI

azure-devops、azure-pipelines

是一个Python模块，可以与Databricks通信，并且可以很容易地在Azure管道中安装pip： - stage: Test jobs: - job: InstallRequirements steps: - script: | python -m pip install --upgrade pip setuptools wheel pip install databricks-cli - script: databricks --version 但这会给第二个脚本带来一个意外的错误： /_

浏览 2提问于2022-11-17得票数 1

回答已采纳

1回答

某些数据的唯一属性

python、beautifulsoup

我正试图用美丽的汤来解析上的最后一个帖子日期，其中写着3天(选中的字符串)。到目前为止我试过： lastPost = soup.find_all('dl', attrs={'dt': 'Last post', 'data-format': 'medium'}) 但没有成功。对于页面中的其他项，所有其他标记和属性都是相同的。也是 data-time="random digits" 无法工作，因为不同页面/不同用户中的同一项不同，这将在最近被解析。唯一的重复和独特的是最后的帖子。检索上一次发布日期(即

浏览 0提问于2014-05-27得票数 0

回答已采纳

1回答

使用Jinja过滤器创建内容片段

python、flask、beautifulsoup、jinja2

我想为我的主页创建内容片段。一个示例文章看起来就像 <p>Your favorite Harry Potter characters enter the Game of Thrones universe, and you'll never guess what happens!</p> <readmore/> <p>...they all die</p> 在主页上，我只希望<readmore/>出现之前的内容。我在想，我可以在金佳过滤器中使用美丽的汤来删除阅读和之后的所有内容。如果没有<readmore

浏览 2提问于2015-06-05得票数 3

回答已采纳

3回答

如何使用Beautiful从python代码中获得javascript函数的结果？

javascript、jquery、python、html、web-scraping

我想从一个使用Python中的“美丽汤”的网站上抓取数据。网站根据用户的选择更改下拉菜单的值。在更改下拉菜单的值时没有api调用。仔细看一下，我注意到有一个javascript函数在内部调用，以获取下拉菜单的值。我的问题是下拉菜单的值不在页面源中。它们是通过调用js函数获得的，但是没有api调用，我不能请求那个值。有人能告诉我如何从python代码中调用javascript函数吗？我在用漂亮汤刮网。谢谢

浏览 7提问于2014-04-06得票数 1

回答已采纳

2回答

什么是漂亮的汤装订法？

python、django、beautifulsoup、robobrowser

我正在试验，这是一个基于漂亮的汤库的新的python库。我试图通过打开html页面并在django应用程序中返回它来测试它，但是我想不出如何完成这个最简单的任务。我的django应用程序包含： def index(request): p=str(request.POST.get('p', False)) # p='https://www.yahoo.com/' browser = RoboBrowser(history=True) browser.open(p) html = browser.find_all r

浏览 1提问于2014-05-01得票数 1

回答已采纳

1回答

在<TEXT>和</ text >之间搜索列表细文本

python-3.x、list、search

这是一个已处理的html文件，在python列表变量中。它也有一些换行符，所以文本是多行的。列表没有被标记。在边角括号(html标记)中有多组"TEXT“和"/TEXT”。我想提取这些匹配对之间的文本，并将它们附加到另一个列表中。感谢专家的帮助。 with gzip.open(.....) texty = [] for i, line in enumerate(opened_file): #reading file texty.append(line.strip(' \t\n\r') 阅读后，可以加入以下内容： lines.appen

浏览 1提问于2022-04-09得票数 0

1回答

Python代理脚本

python、proxy

我正在写一个简单的python脚本，这样我就可以从不同的ip地址测试我的网站。页面的url在querystring中给出，脚本获取页面并将其显示给用户。下面的代码用于重写包含urls的标记，但我认为它并不完整/完全正确。 def rel2abs(rel_url, base=loc): return urlparse.urljoin(base, rel_url) def is_proxy_else_abs(tag, attr): if tag in ('a',): return True if tag in ('form'

浏览 1提问于2008-12-29得票数 0

1回答

JSSoup是否支持提取文本？

beautifulsoup、jssoup

JSSoup是否支持提取类似于美汤soup.findAll(text=True)的文本文档没有提供关于这个用例的任何信息，但在我看来应该有一种方法。为了澄清我想要的是从页面上抓取所有可见的文本。

浏览 19提问于2021-11-20得票数 1

回答已采纳

2回答

Python 3 web抓取选项

python-3.x、web-scraping

我是Python的新手，所以很抱歉这是一个新手问题。我正在尝试构建一个涉及web抓取的程序，我注意到Python3的web抓取模块似乎比Python2.x系列少得多。美汤、机械化和scrapy -这三个模块向我推荐--似乎都是不兼容的。我想知道这个论坛上有没有人有使用python3进行网络抓取的好选择。任何建议都将不胜感激。谢谢，威尔

浏览 1提问于2011-08-11得票数 5

4回答

美丽的汤可以在Python 3.4.1上使用吗？

python、beautifulsoup

我想试着做一个可以从网上下载图片的程序，我找到了一个使用美汤的指南。我以前听说过美丽的汤，所以我想我会尝试一下。我唯一的问题是我似乎找不到适用于Python3的版本，我访问了他们的网站，但我找不到适用于Python3的版本。每当我运行setup.py文件时，我都会得到一个读起来太快的错误，但它看起来像是说语法错误。所以我看了看代码，发现应该打印的字符串前后没有任何括号。我尝试了许多不同的网页和不同的搜索，但都找不到答案。如果这不是一个与编程相关的问题，我也很抱歉，如果不是，请在这个问题上留下评论，我会尽快删除这个问题。

浏览 6提问于2014-07-06得票数 12

1回答

python中的多级/多页面web抓取

python、web-scraping、beautifulsoup

我对数据抓取很陌生，我很少检查过关于刮伤和漂亮汤的资源，但是我正在努力解决下面的问题。起始页面URL为。我想要的信息，如价格，地毯是为每个项目，然后点击项目链接现在我需要收集部分的内容-概述，便利设施，规格等，然后回到以前的列表页面，并重复这对所有项目列出的页面。同时，点击next按钮并对所有条目重复相同的操作。请告诉我如何在python中为这个用例实现一个抓取算法。下面是我尝试过的一个非常基本的级别代码： > import pandas as pd from pandas > import ExcelWriter > import requests,re,csv

浏览 1提问于2019-01-15得票数 0

回答已采纳

2回答

基于HTML标题标记内容的Python语句

python

我们试图用以下条件编写Python脚本来解析HTML：如果HTML标记包含字符串"Record不存在“，则继续运行一个循环。如果没有，请下载页面内容。我们如何根据条件编写if-语句？我们知道美汤，不幸的是我们没有在我们使用的机器上安装它的许可。我们的代码： import urllib2 opp1 = 1 oppn = 2 for opp in range(opp1, oppn + 1): oppurl = (something.com) response = urllib2.urlopen(op

浏览 6提问于2012-02-17得票数 0

回答已采纳

1回答

在md-select和ng-重复中使用ng模型的作用域来保存和显示JSON元素

angularjs、cordova、scope、angularjs-ng-model

我在phonegap的应用程序开发中有两个bug，我希望你们中的一个能帮我解决这个问题。我正在构建一个外卖应用程序，有三个不同的部分:菜单，选项和订单。在选项页面中，我有多个复选框和一个使用md的下拉列表.我要做的是，当用户从下拉列表中选择一个选项时，该选项将显示在order页面中。但是，我得到了一个额外的“未定义”文本，我不需要并且想要摆脱它。下面是我为此使用的相关脚本(柱塞中的index.html中的第278-281行)： $scope.selecteds = {}; angular.forEach($scope.items, function(value) { $scope

浏览 2提问于2015-10-21得票数 0

回答已采纳

1回答

如何提取文本html标记以保持其顺序

python、html

我想在字符串中处理带有html标记的文本。考虑一下字符串 str = "before <b>This text is bold</b> after. <i>italic</i>" 为了提供更多的上下文，我使用PIL ImageDraw对象来编写具有指定宽度的包装文本。代码的一部分如下所示 rect = Rectangle(x,y,width,height) curx = rect.x cury = rect.y for word in allWords: wordWidth, wordHight = fo

浏览 2提问于2021-11-30得票数 1

回答已采纳

2回答

用漂亮汤在网上刮枣桌

python、html、class、web-scraping、beautifulsoup

我想从不同的html网页中将日期表刮到csv文件中，但是日期正在导入编码格式。我用python 3使用漂亮的汤，也用编码utf-8的文件打开html页面。我正在尝试从页面导入表样本代码： rows = table.find_all('tr') csvFile = open("test12.csv","w+", newline='', encoding = "utf-8") try: writer=csv.writer(csvFile) for row in rows: csv

浏览 1提问于2019-07-10得票数 0

回答已采纳

1回答

对特定属性设置为nil的对象和最后一个未设置为nil的对象进行的查询。

ruby-on-rails、ruby-on-rails-4、rails-activerecord

Category有许多Post。我想要一个( AssociationRelation类的)集合，其中包含：属性published_at设置为nil的所有帖子连同最近的"published_at“日期的帖子单独地，这两个查询如下所示： .where("published_at is NULL") .order(published_at: :desc).limit(1) ，但是我怎么会有一个两者兼有的集合呢？

浏览 0提问于2014-04-29得票数 0

回答已采纳

5回答

从pandas dataframe单元格的乱七八糟的字符串中删除换行符？

python、string、pandas、split

我使用了多种方法拆分和剥离我的pandas数据帧中的字符串，以删除所有‘\n’字符，但出于某种原因，它根本不想删除附加到其他单词的字符，即使我拆分了它们。我有一个熊猫数据框架，它有一个列，可以使用Beautifulsoup从网页中捕获文本。美汤已经清理了文本，但无法删除附加到其他字符的换行符。我的字符串看起来有点像这样： “动手\n开发游戏。我们将学习与游戏\n相关的各种软件技术，包括编程语言、\n脚本语言、操作系统、文件系统、网络、模拟引擎和多媒体设计系统。我们还将\n研究一些来自计算机科学的基本科学概念和相关领域，包括\n” 有没有一种简单的python方法来删除这些"\n“字符

浏览 243提问于2017-05-28得票数 29

回答已采纳

1回答

用美汤刮擦

python、beautifulsoup

下面是一个示例html页面源代码 <html><body><div class="a-section a-spacing-medium a-spacing-top-small" id="feature-bullets"> <ul class="a-vertical a-spacing-none"> <li><span class="a-list-item"> Material: Cotton ; Colour: Light blue</span>

浏览 5提问于2016-02-19得票数 1

回答已采纳

1回答

BeautifulSoup不解析过去的标题标签

python、beautifulsoup

我正试图解析一个页面当我尝试findAll('b')时，我没有得到任何结果，和'tr‘一样。除了最初的标题标签之外，我找不到任何东西。此外，当我执行BeautifulSoup=(标记)并打印该汤时，我将得到整个页面，并在输出的末尾加上一个额外的我在BeautifulSoup 3.2.0中使用python2.6。为什么我的汤没有正确解析页面？

浏览 2提问于2014-10-15得票数 0

回答已采纳

1回答

谷歌未能识别权威网站？

google-search、google-ranking、syndication

我有一个情况，我不完全理解，有关辛迪加的内容。我的网站--我的文章的原始版本正在被发布，而不是被谷歌视为原始/规范版本。相反，将内容联合在一起的站点被视为原始版本。这看起来并不是简单的情况，这两个版本都是有效的，但联合网站只是更好的推广，但它实际上是原始版本，为几篇文章。例如：我的文章辛迪加文章搜寻银团版排名第三，我自己的内容没有出现在前100名结果中。辛迪加我的内容的网站确实有一个链接回到我的文章；它也有文章页面上的日期，但看起来这是更新的日期，而不是发布日期： <span class="date updated">May 7th, 2013<

浏览 0提问于2013-05-14得票数 1

回答已采纳

3回答

我怎么才能在漂亮汤里找到兄弟姐妹呢？

python、beautifulsoup、web-crawler

下面的代码是简化的html代码。 <html> ... <div class="info"> <span class="time">2017.01.16</span> </div> <div class="related_group"> <ul class="related_list"> <li> <p class="info"> <span

浏览 5提问于2017-01-16得票数 0

回答已采纳

1回答

使用ODBC的Insight.Database过程调用失败

sql、db2、odbc、insight.database

我正在通过ODBC提供程序在Insight.Database中使用C#来连接到iSeries DB2数据库。db2中有一个名为InsertBeer的存储过程。下面所有的电话都很好用！ List<Beer> beers = conn.QuerySql<Beer>("SELECT * FROM Beer WHERE Typee = @Typee", new { Typee = "IPA" }).ToList(); var beer = new Beer { ID=41,Typee="Medium", Description

浏览 0提问于2015-06-27得票数 0

1回答

使用BeautifulSoup提取CData

python、python-3.x、beautifulsoup、cdata

我试图使用bs4 4/Python3中的BeautifulSoup来提取CData。但是，每当我使用以下方法搜索它时，它都会返回一个空的结果。有人能指出我做错了什么吗？ from bs4 import BeautifulSoup,CData txt = '''<foobar>We have <![CDATA[some data here]]> and more. </foobar>''' soup = BeautifulSoup(txt) for cd i

浏览 4提问于2016-01-06得票数 3

回答已采纳

2回答

模型中的业务逻辑和验证

php、validation、oop、model、domain-driven-design

我对下面的情况有问题。我有一个物品实体： class Article { private $publishDate; public function updatePublishDate(DateTime $date = null) { $this->publishDate = $date; } } 我想为更新日期应用一些业务规则，例如：-只在日期尚未发布时更新日期-拒绝将日期设置为过去(必须是有效的发布日期)。因为在生成发布日期时有一些逻辑，所以我希望为此有单独的类，因为我知道它会改变： class PublishService { p

浏览 3提问于2014-11-28得票数 0

回答已采纳

1回答

我拿不到照片元数据

python、web-scraping、beautifulsoup

我需要帮助！我有一个映像，问题是当创建和修改该映像时，我无法获得包含的数据：但是当我使用查看源页面时，我发现日期位于最下面: view-source:。所以我的问题是如何得到日期，我用漂亮的汤

浏览 6提问于2022-09-18得票数 -1

1回答

每当用户在android应用程序中选择刷新时，运行python脚本

beautifulsoup

我已经创建了一个python脚本，它使用漂亮的汤从网站中提取一些链接。现在，这个python脚本编写一个HTML代码并将其保存到一个HTML文件中，比如test.html。每当用户单击安卓应用程序(使用jQuery移动创建)上的刷新按钮时，我都希望在应用程序中显示test.html。我怎么能这样？

浏览 3提问于2015-06-26得票数 0

回答已采纳

4回答

BeautifulSoup不能解析网页吗？

python、parsing、beautifulsoup

我现在正在使用漂亮的汤来解析网页，我听说它很有名，也很好，但它似乎不能正常工作。下面是我所做的 import urllib2 from bs4 import BeautifulSoup page = urllib2.urlopen("http://www.cnn.com/2012/10/14/us/skydiver-record-attempt/index.html?hpt=hp_t1") soup = BeautifulSoup(page) print soup.prettify() 我认为这是一种简单的方式。我打开网页，把它传给漂亮的汤。但这是我得到的： Warning

浏览 0提问于2012-10-15得票数 5

回答已采纳

1回答

用python ==$0内容进行的网络抓取与漂亮的汤是不可用的

python、html、web-scraping、beautifulsoup

我正试着用美丽的汤从当地的上擦拭湖水的温度。生成的源代码(通过在Chorme浏览器中显示源代码)或通过使用漂亮汤进行抓取的内容是空的。 url = 'https://www.goitzsche-tourismus.de/goitzsche-bitterfeld/specials/172-wassertemperatur/' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser') txt = soup.find("div", {"id"

浏览 4提问于2019-12-30得票数 1