腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5480)
视频
沙龙
4
回答
向
python
pandas
数据
帧
添
加组
计数
的
最佳
方法
python
、
pandas
、
merge
我正在学习
Python
,并且正在使用泰坦尼克号
数据
集学习。一张票上有多个乘客在旅行,我想在行级上添加一个组大小
的
特性,以便与乘客一起使用。['ticket'] = tickets.index newTitanic = pd.merge(titanic, tickets, how= 'left', on = 'ticket') 有没有更快
的
方法
来做这件事
浏览 85
提问于2019-12-17
得票数 2
回答已采纳
3
回答
python
pandas
简单
数据
透视表和
计数
python
、
pandas
、
dataframe
、
group-by
、
pivot-table
我正在尝试找出对我
的
数据
进行简单透视
的
最佳
方法
:dfn =
pandas
.DataFrame({ "B" : [ 1, 10, 2, 30 ], "C" : [ 2,
浏览 0
提问于2016-06-22
得票数 6
1
回答
如何迭代大型Pyspark Dataframe中列
的
不同值?.distinct().collect()引发大型任务警告
python
、
pyspark
我正在尝试迭代一个大型Pyspark Dataframe列中
的
所有不同值。当我尝试使用.distinct().collect()执行此操作时,即使只有两个不同
的
值,它也会发出“任务太大”警告。['a', 'b', 'c']) # This code produces this warning 如何在不遇到内存问题
的
情况下迭代大型Pyspark Dataframe列中
的
浏览 1
提问于2020-01-14
得票数 1
1
回答
在h2o中探索图形
h2o
我想知道是否可以在h2o中执行基本
的
数据
探索,或者它是否是为此而设计
的
。 先谢谢你,基尔
浏览 0
提问于2017-03-29
得票数 1
1
回答
高效地将大型
Pandas
数据
帧
写入磁盘
python
、
pandas
我正试图找到使用
Python
将大型
数据
帧
(250MB+)有效地写入磁盘和从磁盘中写入
的
最佳
方法
。我已经尝试过 performance 中
的
所有
方法
,但是性能非常令人失望。这是探索将当前分析/
数据
管理环境从Stata迁移到
Python
的
更大项目的一部分。当我将测试中
的
读/写时间与Stata中
的
读/写时间进行比较时,
Python<
浏览 2
提问于2013-10-28
得票数 5
1
回答
将
pandas
数据
帧
写入HDF5
python
、
hadoop
、
pandas
、
dataframe
我使用
Python
语言处理大量文件,需要直接用HDF5编写输出(每个输入文件对应一个
数据
帧
)。我想知道从我
的
脚本直接
向
HDF5快速写入
pandas
数据
帧
的
最好
方法
是什么?我不确定是否有像hdf5,hadoopy这样
的
python
模块可以做到这一点。在这方面的任何帮助都将受到感谢。
浏览 10
提问于2016-08-12
得票数 3
1
回答
有没有一种通过列表理解来迭代两个
数据
帧
的
更快
方法
?
pandas
、
dataframe
、
list-comprehension
我有两个
数据
帧
,一个包含屏幕名称/显示名称,另一个包含个人,我正在尝试创建第三个
数据
帧
,每次屏幕名称/显示名称中出现姓氏时,在新行中包含来自每个
数据
帧
的
所有
数据
。从功能上讲,这将创建一个可能匹配
的
名称列表。我当前
的
代码运行得很好,但运行速度非常慢,如下所示:# cols = 'userid','
浏览 0
提问于2016-04-11
得票数 1
1
回答
将R data.table转换为
pandas
.DataFrame
的
最佳
方法
?
python
、
r
、
pandas
、
data.table
在您
的
经验中,将R data.table
帧
转换为
Pandas
数据
帧
的
最佳
方法
是什么?我研究了不同
的
选项,如hdf5 (3个库)、rpy (似乎没有此功能?),并决定问受人尊敬
的
社区:您有任何代码片段来完成它
的
最快、最简单和最可靠
的
方式吗? 最好是r和
python
代码片段。
浏览 3
提问于2016-08-22
得票数 5
回答已采纳
3
回答
Pandas
CSV仅输出特定行中
的
数据
(to_csv)
python
、
pandas
我只需要将
pandas
数据
帧
中
的
特定行输出到CSV文件。换句话说,输出只需要X行中
的
数据
,用逗号分隔
的
一行中,不需要其他任何
数据
。我在使用to_CSV时遇到
的
问题是,我找不到一种只处理
数据
的
方法
;我总是收到包含列
计数
的
额外行。data.to_csv(filename, index=False)0,1,2,3,4,5 X,Y,Z,A,B,C
浏览 0
提问于2016-11-04
得票数 3
回答已采纳
1
回答
Python
Pandas
从变量创建
数据
框列
python
、
pandas
我有一个变量存储字符串时间戳(以Unix时间表示),我希望将其作为列附加到现有的
Python
Pandas
数据
帧
中。也就是说,我希望该列包含143个重复
的
单个时间戳,因为这是
数据
帧
的
观测
计数
。谢谢。
浏览 1
提问于2013-07-08
得票数 3
1
回答
为什么
Pandas
df.mode()在实际
的
模式值之前返回一个零?
pandas
、
mode
当我在下面的
数据
框上运行df.mode()时,我得到了预期输出之前
的
前导零。为什么会这样呢?
浏览 2
提问于2020-07-24
得票数 2
1
回答
如何获取一个列表中附加
的
多个
数据
帧
的
均值、标准差和mad?
python
、
pandas
、
list
、
dataframe
我有几百个
数据
帧
被附加到一个列表中。所有
数据
帧
的
列数相同,但行数不同。列名也是相同
的
。所以我想取每一列
的
列值
的
均值、mad、std,我这样做:lst = [] 6
浏览 1
提问于2018-09-25
得票数 2
1
回答
DataFrame图:如何对X轴进行排序
python
、
pandas
我正在绘制
数据
帧
(
pandas
)字段中
的
一些
计数
,我发现X轴是按
计数
(降序)排序
的
。是否可以按字段
的
字母顺序进行排序?以下是
Python
代码: df['cartype'].value_counts().plot(kind='bar') 这是按
计数
排序
的
,但我想按车类型名称排序。有什么解决方案吗?
浏览 66
提问于2019-09-11
得票数 1
回答已采纳
3
回答
如何在
python
中组合csv
数据
python
、
pandas
、
csv
、
merge
我
的
第一个CSV文件名为vector_train.csv,第二个名为label_train.csvv1,v2,v3,v10055,72,45,90label_train.csvbad voice,0我想要这样
的
输出v1,v2,v3,v100,label
浏览 24
提问于2019-07-10
得票数 1
回答已采纳
1
回答
计划一种
方法
来比较两个
数据
集
的
趋势
python
、
pandas
、
data-visualization
、
data-analysis
我想得到一些关于如何用
python
(
pandas
、matplotlib和seaborn)解决下一个
数据
分析问题
的
建议。我在一家化工厂工作,是一名工程师,我想比较两个不同时间范围内
的
数据
集(如温度、压力浓度等)。第一个
数据
帧
表示正常状态,第二个
数据
帧
表示突然故障。例如,我有两个excel文件,它们具有相同
的
列参数名称(压力、密度、温度等)和从日期x到日期y
的
参数值。 比较两个<em
浏览 19
提问于2021-08-13
得票数 0
1
回答
将Google Analytics中
的
JSON
数据
保存到关系
数据
库
的
最佳
方法
python
、
json
、
pandas
、
google-analytics-api
、
rdbms
我正在寻找并行加载Google Analytics
数据
到关系
数据
库
的
最有效
方法
,这些
数据
以嵌套对象结构表示在JSON文件中,以便以后收集和分析这些统
计数据
。我发现了可以将嵌套
数据
扁平化为平面结构
的
pandas
.io.json.json_normalize,还有一个将json转换为
数据
帧
(如所述)
的
pyspark解决方案,但不确定是否存在性能问题。你能描述一下从Google Anal
浏览 0
提问于2019-12-09
得票数 0
1
回答
.`)、numpy.newaxis (`None`)和整数或布尔型数组才是有效
的
索引
python
、
pandas
、
dataframe
、
numpy
所以我使用了EvolutionaryFS库import numpy as npfrom sklearn.model_selection import train_test_split=0.9,prob_mutation=0.1,run_time=60000) best_colum
浏览 2
提问于2021-06-08
得票数 1
2
回答
从不均匀
的
数据
创建
pandas
数据
帧
python
、
python-2.7
、
pandas
、
dataframe
在
python
2.7中,我使用
的
数据
集既有年度
数据
,也有终生
数据
。我有一个存储终生
数据
的
字典,以及一个每年
数据
的
内部DataFrame。所以它看起来像这样{'color':'brown','stats': df1}其中
数据
帧
'df
浏览 0
提问于2016-05-25
得票数 1
1
回答
如何将最适合
的
滚动线应用于
Pandas
Dataframe
python
、
pandas
我需要对
数据
帧
中
的
每一天应用一行
最佳
拟合。, raw=raw, args=args, kwargs=kwargs)TypeError: only size-1 arrays can be converted to
Python
scalars 我真的不想手动迭
浏览 19
提问于2019-09-05
得票数 0
1
回答
python
,在sql
数据
库中转储熊猫
数据
帧
python
、
sql
、
pandas
、
mysqldump
将
pandas
数据
帧
转储到sql
数据
库
的
最佳
方法
是什么?首先将
数据
帧
转换为csv文件,然后转储csv文件或逐行写入sql
数据
库,哪个更好?
浏览 5
提问于2014-09-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分析神器Pandas:如何用1行Python代码挖掘数据?
Python一行命令生成数据分析报告
这样做能让你的 pandas 循环加快 71803 倍
如何只用一行代码让 Pandas 加速四倍?
pandas数据可视化快速入门1简单图
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券