腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
PYTHON
-
BEAUTIFULSOUP
如何将
空
TD
(
表
数据
)
作为
空
值
而
不是
跳过
python
、
csv
、
web-scraping
、
beautifulsoup
、
urllib
我想把一个网页抓取成一个4列的csv文件,有些表格
数据
不包含
数据
,我想把它写出来
作为
一个
空
的单元格
值
,
而
不是
用.text
跳过
它。href>,则附加<a>标记
数据
,如果没有,则附加<
td
>中的内容,但如果<
td
>没有
数据
,则将其写为
空
(或文本"None")
值
。from urllib.re
浏览 23
提问于2020-08-21
得票数 1
回答已采纳
1
回答
在
python
3中一列(
td
)为
空
时如何
跳过
HTML
表
行(tr)
python
、
html
我正在从HTML
表
中抓取
数据
,一旦我使用
BeautifulSoup
获得了HTML
数据
,我就会从列中生成一个浮动列表。它工作得很好,但是当有一个
空
单元格时,它就会掉下来,因为我的计算结果不同步--例如,listn与listn+2比较。这是我用来生成成对
值
列表的代码(这些
值
以字符串分数开始,然后转换为floats): amounts = table_body.find_all('
td
', attrs={'class'
浏览 24
提问于2016-11-14
得票数 0
回答已采纳
1
回答
如何使用
BeautifulSoup
从
表
中获得第一个和第三个
td
?
python
、
html
、
html-table
、
beautifulsoup
、
html-parsing
我目前正在使用
Python
和
BeautifulSoup
来抓取一些网站
数据
。我试图从格式化如下的
表
中提取单元格:
浏览 0
提问于2013-08-14
得票数 6
回答已采纳
1
回答
嵌套的for循环并附加到
空
对象
python
、
nested-loops
我提供了一个网站过滤器的
值
,以便生成不同的html,l解析。我希望将每个页面源代码保存到不同的
Python
对象,以便区分
数据
。我有一个
空
对象的列表,l将追加到这个列表中。解析页面源代码,并希望将每个页面源代码保存到其自己的
Python
对象中,该对象本身位于列表中。以这种方式html = browser.page_source soup = <e
浏览 7
提问于2016-09-16
得票数 0
1
回答
通过文本文件将NULL插入为DB null
pyspark
、
hive
、
null
、
dbnull
同时,将文本文件从、pyspark、、shell插入到组
表
。如果我查询单元
表
,只能使用筛选条件= 'NULL'
而
不是
is null重试记录。有谁能建议
如何将
数据
作为
DB NULLS插入
表
中?
浏览 2
提问于2020-05-26
得票数 0
回答已采纳
1
回答
如何使用
BeautifulSoup
清除隐藏的
数据
元素
python
、
beautifulsoup
Level2StockQuotes.com提供了免费的实时顶级引用,我想用
BeautifulSoup
用
python
捕获这些引用。问题是,即使我可以在浏览器检查器中看到实际的
数据
值
,我也不能将这些
值
抓取到
python
中。
浏览 0
提问于2019-08-13
得票数 0
3
回答
从html文件中导入
表
的行
作为
python
中的列表
python
、
html
、
python-2.7
、
beautifulsoup
我是一名
python
新手,我遇到了一些我无法解决的问题(即使在谷歌上搜索了大约一百万次)。 我有超过100个html文件,每个文件中都有几个
表
。最终,我希望将文件中第一个HTML
表
的每一行
作为
python
中的列表,但不使用HTML标记。对于第一步,我正在尝试找出如何摆脱HTML标记,然后我需要找出
如何将
其
作为
列表导入。>20</
td
><
td
>60.11</
td
&
浏览 3
提问于2013-02-20
得票数 2
回答已采纳
2
回答
用于获取onclick
值
的
Python
python
、
web-scraping
、
beautifulsoup
我正在使用
Python
和
BeautifulSoup
为我的一个小项目抓取网页。该网页有多个条目,每个条目在HTML中由一个
表
行分隔。我的代码部分工作,但是很多输出都是
空
的,它不会从网页中获取所有结果,甚至不会将它们收集到同一行中。class=channel>Title</
td
><
td
class=channel>Date</
td
><
td
class=channel>Time<
浏览 1
提问于2014-12-11
得票数 1
回答已采纳
1
回答
美丽的汤-刮掉
空
值
python
、
web-scraping
、
beautifulsoup
我有一些
Python
代码,它将特定赛季的NBA球员的游戏日志(例如:)抓取到一个csv文件中。我用的是美汤。www.basketball-reference.com/players/a/abdelal01/gamelog/1991/"问题是:从查看URL元素可以看出,
表
中的一些单元格具有空
值
<
td
class="right " data-stat="fg3_pct
浏览 1
提问于2018-07-21
得票数 0
回答已采纳
2
回答
SQL查询在开始和结束null之间获取
数据
sql
在某些项目中,我需要从一个
表
中选择在
空
值
之后开始的顶级
值
,
而
不是
一些
空
值
和进一步的
数据
。假设
表
名是
数据
,其中有一个名为Company的列
浏览 0
提问于2014-05-27
得票数 1
回答已采纳
1
回答
Scraperwiki -
python
-
跳过
表
行
python-2.7
、
web-scraping
、
scraperwiki
我正在尝试抓取一个
表
,该
表
使用TH
作为
前导列元素,并带有以下
TD
标记。问题是该
表
使用需要
跳过
的间歇分隔符,因为它们不包含TH标记。这是
表
中的一个示例:<tr><
t
浏览 6
提问于2014-05-14
得票数 2
回答已采纳
1
回答
BeautifulSoup
findall返回空列表
python
、
beautifulsoup
、
findall
所以我是
python
的新手,我正在尝试使用bs4和urllib从iso-ne.com/isoexpress/获取
表
中的
数据
。这是我到目前为止所知道的:from urllib import urlopenhtml=urlopen(website).read().decode('utf-8
浏览 0
提问于2015-02-25
得票数 2
2
回答
BeautifulSoup
-将HTML
表
转换为CSV并获取一列的href
python
、
html
、
csv
、
beautifulsoup
我正在用下面的代码抓取一个HTML
表
:import urllib2 try: finally: soup=
BeautifulSoup
(html) for tr in soup.find_all(
浏览 0
提问于2015-01-15
得票数 5
回答已采纳
1
回答
Dojo1.9
如何将
空白<
td
>添加到dojox/layout/TableContainer中?
javascript
、
dojo
我如何在dojo TableContainer中添加一个
空
的TableContainer?>widget2</
td
> </tr>
如何将
第三组<
td
>
作为
空
浏览 5
提问于2014-04-22
得票数 0
回答已采纳
1
回答
如何从SQLite
表
返回实
值
python
、
python-3.x
、
sqlite
我这样做是通过将
数据
存储在标有买卖价格的表格中。如果我把它们分开运行,它们就能正常工作。但第二次,我把他们放在同一个程序,他们不工作。我需要能够从列表中的每三个
值
中计算一个趋势,因为这是每只股票的记录数,但它们都被放入一个列表中。
浏览 3
提问于2017-01-15
得票数 2
回答已采纳
1
回答
jQuery模板忽略String.Empty
值
c#
、
asp.net
、
jquery-templates
我有一个ASP .Net .Net服务,它返回一个类似于System.Data.DataTable的对象(包含行和列,单元格
值
是字符串),它被序列化为JSON。我希望使用这个
数据
表
JSON结果来使用jQuery模板填充一个HTML。 如果一行包含一个
空
单元格(String.Empty),我仍然希望它打印<
td
></
td
>,否则我的
表
结构就会混乱。jQuery模板似乎将String.Empty视为null,并
跳过
它,<e
浏览 3
提问于2011-09-30
得票数 2
回答已采纳
1
回答
这两个Postgres查询的区别是什么?
postgresql-9.1
from table and time > '2013-12-31' 然后显式地计算sum(a)-sum(b)的
值
。
浏览 4
提问于2014-01-26
得票数 0
回答已采纳
1
回答
代码优先迁移:默认
值
为
空
Guid的外键
sql-server
、
asp.net-mvc
、
entity-framework
、
asp.net-mvc-5
由于这些查找
表
必须始终使用已选中的默认
值
加载,因此这些查找
表
中有一个
值
将始终以Guid.Empty
值
(00000000-0000-0000-0000-000000000000)
作为
其主键,以便很容易地将其标识为默认
值
我正试图找到一种方法,使使用这两个查找
表
的外键默认为
空
Guid,如果它们被传递为
空
值
。这是一种额外的保险,以防我错过了代码本身的一个位置,在这里我应该用一个
空
的Guid
浏览 3
提问于2016-07-21
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
抓取
表
python
、
beautifulsoup
、
screen-scraping
我有以下类型的页面,我想从其中收集最后一个
表
中的信息(如果您一直向下滚动,它就是标签为“Procedure”的框中的页面): <tbody><tr class="doc_title>
浏览 1
提问于2010-07-02
得票数 3
回答已采纳
1
回答
skipNul = TRUE在read.table()和read.csv()中做了什么(除了
跳过
/忽略嵌入的
空
值
之外)?
r
、
csv
、
read.table
、
read.csv
我认识到在skipNul = TRUE中设置read.csv(),read.table()
跳过
/忽略“嵌入的
空
值
”(参见?read.csv和)。
跳过
/忽略嵌入的
空
值
对R中的结果
数据
意味着什么?我想R的“
跳过
”或“忽略”意味着它们
作为
文本字符串保存,
而
理想情况下,它们将显示为NA
值
,但na.strings参数不足以捕获它们。
浏览 2
提问于2016-04-25
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何为你的机器学习项目抓取网页数据?
用Python做网页爬虫
别再用Ctrl+V,合并两个Excel表格很简单!
推荐:手把手教你用Python进行Web抓取
手把手教你用Python进行Web抓取
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券