腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
将我
的
dataframe
写出
为
给定
列
的
每个
值
一个
文件
?
pandas
、
dask
我有
一个
数据帧,它有
一个
名为key
的
列
,
值
的
范围从00到FF (以字符串形式)。理想情况下,我会将数据帧编写
为
每个
key
值
一个
或多个
文件
。也就是说,我不希望
一个
分区有多个可能
的
key
值
。我目前
的
方法不起作用,因为它只生成
一个
文件
: import dask.
dataframe
浏览 20
提问于2020-11-09
得票数 1
1
回答
具有
dataframe
名称
的
数据序列列表
的
变异
列
r
、
list
、
dataframe
、
function
、
lapply
我试图自动
为
给定
的
数据
文件
列表中
的
所有数据
文件
创建
一个
列
(名为FXN),以便生成
列
的
名称:ldf <- lapply("d
浏览 2
提问于2022-05-05
得票数 1
1
回答
将
列
添加到根据python中
的
列
数据类型显示布尔
值
的
dataframe
中
python
、
pandas
、
dataframe
、
alphanumeric
、
non-alphanumeric
我正在尝试向
dataframe
中添加布尔
值
的
列
,这些布尔
值
基于对当前要迭代
的
列
是字母数字、字母还是数字
的
判断。不幸
的
是,对于
每个
布尔测试,每一
列
都给出了False。我们
的
目标是,对于
给定
的
列
,我
如何
添加另
一个
列
来显示
给定
列
中
的</e
浏览 25
提问于2019-12-11
得票数 1
回答已采纳
3
回答
如何
在不删除没有新数据
的
分区
的
情况下在Spark中分区和写入
DataFrame
?
apache-spark
、
spark-dataframe
、
partitioning
、
parquet
我正在尝试使用DataFrameWriter以Parquet格式将
DataFrame
保存到HDFS,该
文件
由三个
列
值
划分,如下所示:但是,我在理解
如何
将数据组织到单分区
DataFrame
中
的
浏览 2
提问于2017-02-19
得票数 37
3
回答
选择在熊猫中呈现特定条件
的
列
python
、
pandas
、
filter
、
mask
、
any
我有
一个
关于物种和地点
的
数据。
每个
单元格包含
一个
丰度
值
。我只想选择那些在任何地点
的
丰富度高于5
的
物种。Site_2 0 0 0理想产出:Site_1 0 1Site_3 6 7 假设我有
一个
dataframe
150 x 150,我想要选择
每个
列
,并
写出
它们
的</em
浏览 6
提问于2021-03-17
得票数 0
回答已采纳
1
回答
如何
显示集合中
每个
项目的所有post标签?
eleventy
在.eleventy.js
文件
中,我
为
posts目录中
的
所有.md
文件
创建了
一个
getFilteredByGlob集合。 然后,对于该集合中
的
每一项,我从
每个
.md
文件
的
前面
写出
值
。这工作得很好,但我正在为
每个
.md
文件
的
标记而苦苦挣扎。大多数
文件
都有2个或更多
的
标签,我想让
一个
for循环分别
浏览 26
提问于2020-07-14
得票数 0
1
回答
导出excel时
如何
设置列表头?
python
、
pandas
我尝试更改标题标题:for item in df.columns.map(lambda x: {x: self._get_column_header(x)}):self._set_column_style(df).to_excel(xls_writer, startcol=1,
浏览 7
提问于2020-02-02
得票数 0
1
回答
对表中
的
每一
列
应用相同
的
聚合。
sql
、
postgresql
、
postgresql-8.3
我正在使用
一个
专有的mpp数据库,这个数据库已经从psql 8.3上分叉出来了。我正在尝试将
一个
简单
的
计数应用到
一个
宽表(大约450
列
),所以我想知道用
一个
简单
的
sql函数来做这件事
的
最好方法。我只是在计算
给定
列
中不同
值
的
数量,以及该
列
中空
值
数
的
计数。例如,我想对每一
列
进行泛化
的
查询 如果我想
浏览 2
提问于2013-01-14
得票数 3
回答已采纳
1
回答
从字典创建数据时发生
的
StopIteration错误
python
、
dataframe
、
csv
、
dictionary
因此,我从字典中创建了
一个
数据格式来执行时间序列练习。当我创建
dataframe
(我是在Google中这样做)时,该单元格正确运行。但是当我做full_df.head()
的
时候。my_dict[record[0]].append(record) my_dict[record[0]] = [record] full_df = pd.
DataFrame
.from_dict
浏览 5
提问于2021-11-25
得票数 0
回答已采纳
1
回答
Python -处理后将数据块列表转换为
dataframe
python
、
pandas
、
dataframe
、
preprocessor
、
chunks
我使用分块函数
为
ML预处理我
的
数据,因为我
的
数据相当大。在数据处理之后,我尝试将处理后
的
数据作为新
的
列
'chunk‘添加回原始数据框中,这给了我
一个
内存错误,因此我试图一次将块加载到数据帧中,但我仍然收到内存错误:lookup = { 'g': 0.50,
浏览 18
提问于2020-02-12
得票数 1
2
回答
如何
垂直组合具有不同
列
数
的
两只熊猫数据
python
、
python-3.x
、
pandas
、
dataframe
有两个
dataframe
,
一个
dataframe
的
列
可能比另
一个
少。例如,import numpy as np 'col1': ['A', 'B'], 'col3': [0, 1]df1 = pd.
DataFrame</
浏览 6
提问于2022-05-05
得票数 1
回答已采纳
1
回答
Pandas基于列表对行进行自定义排序
python
、
pandas
给定
一个
数据帧和
一个
列表,其中包含数据帧
的
列
的
值
。(列表是等长
的
,因为
dataframe
中
的
行和
每个
值
都恰好是1)
如何
根据列表中
的
顺序对
dataframe
中
的
行进行排序?import pandas as pd df = pd.
DataFrame
({'user': [
浏览 13
提问于2020-05-09
得票数 2
回答已采纳
1
回答
如何
使用openpyxl从列表中向excel添加额外
的
列
标题
python
、
pandas
、
openpyxl
我希望使用list和openpyxl
为
我
的
dataframe
添加额外
的
列
标题。请参阅下面的代码片段。import pandas as pdfrom openpyxl.styles import font..worksheet = workbook.active
浏览 7
提问于2022-07-17
得票数 -1
2
回答
如何
检查某个
值
是否
为
Scala中
的
unix时间戳?
scala
、
apache-spark
、
apache-spark-sql
在
DataFrame
df中,我有
一个
包含时间戳
值
的
列
datetime。问题是,在某些行中,这些是unix时间戳,而在其他行中,这些是yyyyMMddHHmm格式。
如何
验证
每个
给定
值
都是unix时间戳,如果不是要将其转换为时间戳?df.withColumn("timestamp", unix_timestamp(col("datetime"))) 我假设应该使用when...otherwise,
浏览 4
提问于2018-10-17
得票数 1
2
回答
Newbie事务问题:在读-计算-write中防止竞争
sql
、
sql-server
、
transactions
我想在
一个
事务中执行以下操作: 换句话说,SQL服务器能否用作<em
浏览 5
提问于2011-09-14
得票数 5
回答已采纳
1
回答
从2D数据帧创建多索引数据帧--将多变量时间序列数组转换为滞后
的
多索引数据帧。
python
、
pandas
、
dataframe
、
multi-index
我正在尝试将
一个
二维多变量时间序列形状(n_samples, n_channels)数组转换为
一个
具有多个索引
列
的
DataFrame
,该
列
具有最大
的
时间差。多索引
列
的
“通道”位于第一级,然后是第二级
的
时滞。生成
的
dataframe
的
每一行将由dataset
的
一个
时间窗口组成。-1我有
一个
<e
浏览 5
提问于2022-10-14
得票数 1
回答已采纳
1
回答
使用pandas读取和合并
文件
python
、
pandas
、
merge
我有几个.txt
文件
,格式
为
/folder/blahblah_*K.txt,其中星号表示开尔文温度。
每个
文件
包含3
列
(让我们称它们
为
'A','B‘和'C')。我想创建
一个
具有公共索引(第一
列
,称为'A')和来自
每个
文件
的
'B‘
列
的
单个
DataFrame</e
浏览 1
提问于2019-01-30
得票数 0
1
回答
多个数据存储中多
列
的
计算模式
r
、
loops
、
mode
我有限
的
智力意味着我真的在努力完成以下
的
任务,任何建议都会被感激地接受! 我现在有100个数据存储
为
一个
列表(my.dfs)。在
每个
dataframe
中有六
列
(a,b,c,d,e,f)。我想要计算a
列
在
dataframe
1,然后
dataframe
2,3,4.通过到
dataframe
100,并将结果存储在
一个
新
的
向量(a.mode)中。因此,a.mode应该有
浏览 3
提问于2013-10-23
得票数 1
1
回答
Spark Partition数据集(按
列
值
)
scala
、
apache-spark
、
sharding
、
data-partitioning
(我们知道
如何
组合shard S+update= new shard S) 如果这就是我们
的
设计,我们需要(1)通过它
的
一
列
(比如:
列
K)将
DataFrame
分片到|range(K)|分区中,其中保证分区中
的
所有行在
列
K中具有相同
的
值
,并且(2)能够找到与column_K=k相对应
的
DataFrame
文件
,知道k = row.uniqueID % numShard
浏览 19
提问于2019-05-03
得票数 2
回答已采纳
1
回答
通过对
每个
df
列
应用函数创建系列
python
、
pandas
、
function
、
dataframe
、
series
给定
一个
DataFrame
,我想在每一
列
中计数NaN
值
的
数目,将比例显示
为
直方图。我想出了nan_dict = {} nan_dict[col是否有一种方法可以将value_counts应用于所有
列
,以便返回
每个
列
都有
浏览 0
提问于2021-05-03
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
终极加分技能,8个Python高效数据分析的技巧,数行代码焕然一新
数据加载、存储与文件格式
最全攻略:数据分析师必备Python编程基础知识
pandas.dataframe 专题使用指南
肝了3天,整理了90个Pandas案例
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券