腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
foor
循
环中
为
数据
集
创建
新
列
-
Pandas
Python
python
、
pandas
我有一个包含前一年学生出勤
数据
的
数据
框架。它看起来像这样,有许多
列
显示不同的日期,数字显示他们是否参加了该日期。因此,我尝试在
数据
集中
创建
另一个名为'StartDate‘的
列
,它显示孩子第一次参加会议的日期-因此他们要么收到0、1或2,要么代表出席。但我似乎不能
列
一
列
,并在其中添加每个学生的开始日期。上面注释掉的代码行给出了以下错误- KeyError:'StartDate‘ 有人知道怎么做吗?提前感谢
浏览 13
提问于2020-05-01
得票数 0
回答已采纳
1
回答
Pandas
中HDF文件帧中
列
的附加
python
、
csv
、
pandas
、
hdf5
我正在处理一个CSV格式的大型
数据
集
。我正在尝试一
列
一
列
地处理
数据
,然后将
数据
附加到HDF文件中的框架中。所有这些都是用
Pandas
来完成的。我的动机是,虽然整个
数据
集
比物理内存大得多,但
列
大小是可管理的。
在
稍后阶段,我将一个一个地将
列
加载回内存并对它们进行操作,从而执行按特性进行的逻辑回归。我能够
创建
一个
新
的HDF文件,并使用第一
列</
浏览 3
提问于2013-12-06
得票数 10
回答已采纳
1
回答
串联成
数据
帧时
创建
的NaN
列
python-3.x
、
pandas
、
dataframe
我已经
创建
了一个输出变量'a = pd.Series()',然后使用一个for循环运行多个模拟,该循环使用以下代码将临时存储
在
'x‘中的模拟结果附加到连续
列
中的'a’,每个
列
都重命名为与模拟编号一致,从第0个位置开始: a =
pandas
.concat([a, x.rename(sim_count)], axis=1) 由于某种原因,结果
数据
帧
在
我的第一
列
模拟结果的左侧包含了一
列
"N
浏览 33
提问于2019-04-02
得票数 0
回答已采纳
1
回答
在
for循
环中
为
pandas
数据
帧
创建
新
列
pandas
有一个包含3
列
A、B和C的
pandas
数据
帧9497 2017-03-03 44.149147 -70.230300914 2017-02-27 38.832256 -104.761086 我想遍历dataframe并在for循
环中
创建
一个
新
列
。我试着用下面的代码,但我得到了错误“
列
未定义”。任何建议都会很有帮助。
浏览 4
提问于2017-03-16
得票数 1
回答已采纳
1
回答
Python
Pandas
在
循
环中
创建
新
列
python
、
loops
、
pandas
我正在尝试通过划分两
列
来
为
每一
列
创建
一个
新
列
。df是一个熊猫
数据
帧...for column_1 in columns: df[new_column] = df[column_1] / df[column_2] 获取
浏览 0
提问于2015-09-12
得票数 3
1
回答
如何编码具有大量值的CATEGORICAL_COLUMNS?
pandas
、
tensorflow
、
machine-learning
、
scikit-learn
我正在使用Tensorflow、
python
、
Pandas
创建
一个类似于此的logistic回归模型。 我使用的不是MNist
数据
集
,而是我自己的
数据
集
。我使用
Pandas
创建
数据
格式,将nulls替换为填充it函数,然后使用from_tensor_slices将其转换为张量
数据
集
。但问题是,我的分类列有很大的词汇表(Ex: Zipcode.我的
数据
中有数千个邮政
浏览 2
提问于2020-03-30
得票数 0
回答已采纳
2
回答
使用
Pandas
将groupby聚合应用于原始
数据
框
python
、
pandas
、
group-by
我想做一些
在
电子表格中看起来很简单的事情,但是我不能理解
pandas
中的语法。我有一个可以分组的
数据
集
。我想要确定每个组的聚合统计信息,然后使用聚合在原始
数据
框中
创建
一个
新
列
。例如,如果我的
数据
框看起来像这样: d =
pandas
.dataframe({'class', : ['f1', 'f2', 'f3', 'f1
浏览 0
提问于2017-10-15
得票数 2
2
回答
如何使用
python
pandas
或networkx lib对两个依赖
列
进行分组并生成
新
的唯一键?
python
、
pandas
、
pandas-groupby
、
data-science
、
networkx
我们正在尝试
创建
新
的标识号(唯一密钥),用于使用
python
pandas
或
python
网络图(Networkx Lib)查找唯一客户: 两
列
相互依赖(反之亦然),需要按这两
列
分组并生成
新
的唯一键。下面是
python
pandas
dataframe中的示例
数据
列表。输入
数据
集
: r_vid d_ph_nm d_flg DQLA853 6
浏览 27
提问于2020-01-23
得票数 4
回答已采纳
2
回答
使用csv文件的一些
数据
创建
数据
集
python
、
pandas
、
csv
早上好,我试着用另一个
数据
集
(实际上是csv文件)
创建
一个
新
的
数据
格式。在下面的代码中,我将df[1]和df[3]放在一起,因为我打算
创建
一个
新
的
数据
集
,其中只有csv文件的这两
列
(第二和第四
列
) P.S:原始
数据
集
包含75
列
** import
pandas
as pddf = pd.read_csv(r'C:\Use
浏览 6
提问于2022-09-14
得票数 0
回答已采纳
1
回答
将行值解析
为
列
,并使用查找值
python
、
pandas
我希望将行值解析
为
列
,并使用它们
在
pandas
数据
帧中查找值import
pandas
as pd if sys.version_info[0] < 3: else:构建玩具
数据
集
20;
浏览 1
提问于2019-08-27
得票数 1
1
回答
将模式分配给pa.Table.from_
pandas
()
python
、
pandas
、
parquet
、
pyarrow
我
在
使用pyArrow将
pandas
.DF转换为parquet时遇到此错误:为了找出哪一
列
是问题所在,我
在
for循
环中
创建
了一个
新
的df,首先是第一
列</e
浏览 2
提问于2018-03-30
得票数 5
回答已采纳
1
回答
pandas
to_csv写入会一直消耗更多的内存,直到崩溃
python
、
python-3.x
、
pandas
、
memory-management
、
out-of-memory
更新:我已经意识到每次
新
的运行都会
创建
一个
新
的
Python
控制台,这会导致更多的内存消耗。我必须关闭
为
每次运行
创建
新
控制台的设置。由于某些原因,当我升级到Pycharm pro时,这个功能会自动启用。我的项目
创建
了一个名为'pressure_drop‘的csv,我想使用下面的代码
创建
一个
新
的
pandas
数据
帧。本例中的pressure_drop.csv有10150行和12
浏览 2
提问于2020-04-27
得票数 0
1
回答
使用
Python
脚本根据PowerBI中的当前
数据
集
创建
新
表
python
、
powerbi
、
powerbi-datasource
我有一个csv文件作为源
数据
集
。目前
在
表中有一
列
,我想使用
Python
循环并从每个单元格的字符串中提取
数据
。例如,
在
单元格中: 数量变化了10,价格变化了90。我想使用
Python
并提取"Quantity,Price“和"10,90”来
创建
具有这些属性和值的
新
表。然后使用
Python
创建
视觉效果,而不是使用PowerBI视觉效果。我该怎么做呢?我想遍历Prope
浏览 18
提问于2021-03-07
得票数 0
3
回答
pandas
-gbq目前是否支持参数化查询?
python
、
pandas
、
google-bigquery
我需要使用
Pandas
/
Pandas
-gbq
在
Python
语言中
创建
一个简单的ETL管道,每天将给定日期范围内的
数据
从BigQuery读取到
Pandas
数据
帧中,并根据查询结果
创建
单独的日表(写回BigQuery尽管可能有更好、更有效的方法(注意:我不是软件工程师),但我目前正在研究BigQuery中的来参数化日期
列
,并在
Python
中的for循
环中
迭代这一过程。有人
浏览 2
提问于2019-12-17
得票数 2
1
回答
Spark Dataframe
在
性能上如何优于
Pandas
Dataframe?
python
、
apache-spark
、
dataframe
、
pyspark
、
databricks
谁能解释一下为什么Spark Dataframe
在
执行时间上比
Pandas
Dataframes更好。我正在处理中等容量的
数据
,并进行
python
函数供电的转换import
浏览 0
提问于2019-04-30
得票数 3
2
回答
SQLite中的上插/合并表
python
、
database
、
pandas
、
sqlite
、
merge
我
在
python
中使用sqlite3
创建
了一个有数千个表的
数据
库。这些表中的每一个包含数千行和10
列
。其中一
列
是事件的日期和时间:它是一个格式化为YYYY-mm-dd HH:MM:SS的字符串,我将其定义
为
每个表的主键。我经常
为
这些表收集一些
新
的
数据
(数百行)。每个
新
数据
集
都从服务器中提取,并作为
pandas
数据
帧直接加载或存储
浏览 0
提问于2020-02-14
得票数 0
回答已采纳
2
回答
Python
Panda错误TypeError:不支持/的操作数类型:'str‘和'int’
python
、
pandas
我正在学习如何在
Python
中使用
Pandas
。我对我的Panda
数据
帧进行数学运算时遇到了问题。现在我的
数据
帧看起来像这样: 0 1 2 3 4 5 6这会产生错误 TypeError: unsupported operand type(s) for /: 'str' and 'i
浏览 1
提问于2016-11-22
得票数 1
回答已采纳
1
回答
滚动时间窗口功能-与
Pandas
的
数据
角力
python
、
pandas
、
feature-engineering
我有一个
数据
集
,其中每条记录都包含比赛级别的
数据
,例如MATCH_DATE | PLAYER1 | PLAYER2 |锦标赛|表面| PLAYER1_SERVE% | PLAYER2_SERVE% 09DEC2020|迈克|吉姆|罗马公开赛|克莱| 65% | 70% 我正在尝试
为
每个“播放器和表面”
创建
基于滚动时间窗口的
新
列
,例如LAST90DAYS_PLAYER1_CLAYSERVE%和LAST5MATCHES_PLAYER1然后,我需要将这些
新
<
浏览 20
提问于2020-12-11
得票数 0
1
回答
检查
Python
中两个字符串列是否相互包含
python-3.x
、
pandas
、
string
、
dataframe
给定一个小的
数据
集
如下:0 1 lol lolec2 3 ki pio3 4 iloc loc5 6 lambda lambda如果a等于b或的子字符串(反之亦然),则
创建
一个具有值1的
新
列
c,否则将其保持
为
浏览 1
提问于2021-08-02
得票数 0
回答已采纳
1
回答
如何根据
列
的值更改将
Pandas
数据
分割
为
多个csvs
python-3.x
、
pandas
、
dataframe
因此,我有一个带有三维点云
数据
(X,Y,Z,Color)的
数据
: 基本上,我需要根据颜色
列
(它的值
为
0、0.5和1)对
数据
进行分组。然而,我不需要一个整体分组(这很容易)。每当值发生变化时,我都需要它来
创建
新
的
数据
格式。也就是说,我希望
为
每一组后面跟着并前面有5个零的行提供一个
新
的
数据
格式(因为单个零有时错误地出现在我感兴趣的
数据
块中)。
浏览 1
提问于2022-10-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(三):DataFrame
这样做能让你的 pandas 循环加快 71803 倍
Python之Pandas使用教程(一)
Python笔记:Pandas数据处理
Python数据分析入门日记Day6:数据分析库Pandas:Series和Dataframe
活动推荐
运营活动
广告
关闭
领券