腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9915)
视频
沙龙
4
回答
反
规范化
Pandas
中
的
数据
:
如何
创建
col_1
、
col_2
等
并将
现有
值
添加到
列
?
pandas
我有一个
数据
帧,看起来像这样: key file1 1235 ghi.pdf3 1235 jkl.pdf 4 1235 lmn.pdf与每个键相关联
的
文档数量是可变
的
。lmn.pdf 如果我尝试使用df.pivot,我会得到一个为每个文档名称命名
的
新
列
,这不是我想要
的
。我已经查看了Reshaping and pivot tables —
pandas
1.1.0 documentation,但没有找到
浏览 32
提问于2020-08-20
得票数 1
回答已采纳
1
回答
使用Python,我
如何
对符合条件
的
所有行(不包括当前行)进行分组和获取值。
python-3.x
、
pandas
、
dataframe
、
group-by
我有一个
Pandas
,包含2
列
,都有连续整数。在逐行
的
基础上,通过将
col_1
中
的
所有相等值分组,我试图在
col_2
中
创建
所有
值
的
列表,不包括所讨论
的
行,
并将
其存储在一个新
列
(col_3)
中
。以下是完整
的
例子:
col_1
col_2
浏览 6
提问于2022-10-30
得票数 0
回答已采纳
1
回答
将
列
附加到
Pandas
Dataframe
python
、
pandas
在
Pandas
Dataframe上附加额外
的
列
def dataSerialize(TagModel): test = """Month;
Col_1
;
Col
只有在.csv文件
中
,"
Col_1
“
中
的
数据
才从”月份“移动到
数据
。来自"
Col_2
“
的
数据
移动
浏览 0
提问于2020-04-09
得票数 1
回答已采纳
2
回答
用不同
的
标量多
列
熊猫
数据
python
、
pandas
、
dataframe
我有一只熊猫DataFrame df和
col_1
,
col_2
, ..., col_n栏。 我想把熊猫
的
每一栏
数据
乘以一个不同
的
标量,基于该栏。例如,将
col_1
中
的
每个元素乘以n_1,将
col_2
中
的
每个元素乘以n_2
等
等
。,做这件事最简洁
的
方法是什么?目前,我
的
解决方案包括
创建
字典{
col_1</e
浏览 3
提问于2021-08-09
得票数 0
2
回答
awk集团&“减少”
awk
、
json
、
jq
假设我有如下
数据
:table_name
col_1
another_table_name id
如何
使用awk按第一
列
分组,
并将
第二
列
缩小为逗号分隔
的
列表?根据这个例子,输出应该是:another_table_name id,
浏览 0
提问于2021-01-25
得票数 1
回答已采纳
1
回答
星火scala dataframe群
scala
、
apache-spark
我有这个dataframe,我想
创建
另一个类似于预期
的
数据
。问题是,我想取同一组
col_2
的
col_1
'a‘
的
值
,
并将
它们放在不同
的
列
中
。有办法吗?#+-----+-----+-----+-#+-----+-----+-----+#| a|
浏览 4
提问于2022-07-26
得票数 0
回答已采纳
1
回答
基于其他
列
值
的
Pyspark
列
apache-spark
、
pyspark
、
apache-spark-sql
下面是我
的
数据
col_1
,col2 | x | y |...|n我想要在我
的
col_list
列
值
中
存在
的
concat
列
col_list |
col_1
|
col_2
|..
浏览 3
提问于2021-04-19
得票数 0
回答已采纳
2
回答
如何
检查
pandas
数据
帧
中
的
每一
列
是否为浮点型或是否可以转换为整数
python
、
pandas
我正在将csv文件加载到
pandas
数据
帧
中
,编辑它们并再次将其导出为csv (随着时间
的
推移,对许多不同
的
csv重复此过程)。有时,
数据
帧包含浮点
值
,而浮点
值
应该是整数,这导致我
的
导出最终无法使用。 在下面的示例
中
,
col_1
只包含整数(并且只包含0和1)。
col_2
也只包含0和1,但作为浮点数。no
col_1
col_2
浏览 273
提问于2021-01-19
得票数 0
回答已采纳
1
回答
熊猫-对于每一组,如果一
列
中
的
字符串在另一
列
中
,则
添加到
列
中
。
pandas
、
string
、
group-by
在组级别,如果另一
列
(
col_2
)
中
的
字符串存在于原始
列
(
Col_2
)
中
的
其他任何位置,那么
如何
将缺失字符串
添加到
列
(
col_2
)?下面的示例
数据
显示了问题。import
pandas
as pd'ID': {0: 1, 1: 1, 2: 1, 3: 1, 4: 2,
浏览 3
提问于2022-11-17
得票数 1
回答已采纳
1
回答
如何
使用具有相同列名
的
向量设置某些行
值
?
python-3.x
、
pandas
我想要一个快速和有效
的
方法来设置
列
'
col_1
‘和
列
'
col_2
’
的
值
在每一行与'id‘在'b','c’
的
基础上在另一个
数据
框
中
的
值
。下面是一个简单
的
例子,展示了我是
如何
使用df.update做到这一点
的
。data = {'id': ['a
浏览 14
提问于2019-03-15
得票数 2
回答已采纳
1
回答
如何
在一个混合了字符串和字符串列表
的
特定
列
中分隔包含列表
的
单元格?
python
、
pandas
、
dataframe
、
rows
我正在尝试用python组织一个
pandas
数据
框,它具有以下伪结构(为了便于理解,我更改了变量名): Initial_df 什么代码能够拆分
col_1
中
的
列表,使得该
列
只剩下单独
的
字符串,并且COL2
中
存在
的
这些单独字符串
的
计数根据从包含列表
的
行
中
获得
的
值
进行调整。最终
的
数据
框应如下所示: output_df
浏览 11
提问于2020-10-11
得票数 0
回答已采纳
2
回答
如果
值
是整数,则
如何
将前导零
添加到
Dataframe
列
,条件是另一
列
的
值
?
python
、
pandas
、
dataframe
、
conditional-statements
在以下情况下,是否有一种向Dataframe
列
添加前导零
的
有效方法:
col_2
是整数值(即不是"text"或"text2")
col_1
== "A" )。初始Dataframe: <e
浏览 4
提问于2022-09-06
得票数 -1
2
回答
将
数据
帧从内部保存为循环
python
、
pandas
、
loops
、
for-loop
我有一个函数,它接受一个dataframe并返回一个(精简) dataframe,例如: ''' takes in df, groups
col_1
accordingto
col_2
and returns df
浏览 0
提问于2019-05-22
得票数 1
回答已采纳
3
回答
我们能在德鲁伊进行改造吗?
scala
、
apache-spark
、
bigdata
、
druid
、
pydruid
我有一个场景,我将在csv文件
中
接收
数据
,在那里,我需要用
现有
的
列
生成一些
列
。示例:abc 1 No 123def1 Yes 345
Col_1
Col_2
Col_3 Col_4 Col_5 Col_6 abc 1
浏览 6
提问于2021-12-13
得票数 3
3
回答
如何
使用来自另一个dataframe
的
新值更新?
python
、
pyspark
我有两个火花
数据
:|
col_1
|
col_2
| ... | col_n |和
数据
交换B: |
col_1
|我想在spark
中
编写一个操作,其中我可以
创建
一个新
的
dataframe,其中包含来自dataframe A
的
行以及来自dataframe B
的
更新行和新行。首先,我
创建
了一个哈希
列
浏览 3
提问于2018-05-11
得票数 4
回答已采纳
2
回答
SQL用户定义函数
的
参数数量是否不确定?
mysql
、
sql
、
oracle
、
user-defined-functions
在Oracle和MySQL
中
,我
如何
创建
一个接受无限数量参数
的
函数,以便可以像GREATEST(value1,value2,...)那样调用它?通过某种标准比较两个
值
非常容易,但是将“较大”
的
值
传递给另一个比较似乎是我在SQL
中
做不到
的
。编辑(在Mike
的
评论之后):我正在寻找一种比较多
列
的
解决方案。具体来说,我
的
问题是
如何
将GREAT
浏览 4
提问于2011-11-14
得票数 6
回答已采纳
2
回答
如何
更新多行,基于多个条件?
spring
、
postgresql
、
spring-batch
我正在尝试为多行更新表
中
的
单个
列
,但根据其他两
列
的
唯一where条件,每行将具有不同
的
更新日期
值
。我正在从csv
中
读取
数据
,并简单地更新根据其他两
列
中
的
值
的
组合找到
的
行
中
的
date
列
。我见过这个 但是设置
的
值
不是静态
的
,
浏览 25
提问于2019-10-21
得票数 2
3
回答
在R中计算类别特定变量
r
我有大
数据
,
col_1
是第一类,
col_2
是第二类。我附上了一个样本表格(请参阅下图)。
数据
具有前四
列
(
col_1
、
col_2
、ice、fd)。我想要为
col_1
的
每个类别生成变量"ice_new“,方法是将
列
fd
的
和作为分母,将不同
col_2
的
"ice”
值
作为分子
并将
它们相加。我尝试在R中使用"a
浏览 18
提问于2019-11-27
得票数 0
2
回答
熊猫在加载
数据
之前声明dtype
python
、
pandas
我对内存
的
使用有一个问题--我从DB
中
获取了相当多
的
数据
,
并将
其注入到一个熊猫DataFrame
中
,在那里我做groub_by来列出一些DB不太擅长
的
东西。问题是,由于我获得了大约40
列
,熊猫并不是很好地确定每一
列
的
dtype。我希望为每一
列
分别指定dtype,这样熊猫就不会在任何地方使用object dtype来使用这么多内存。我知道,我可以在事后对
数据
进行转换,但这并不能解决R
浏览 4
提问于2022-11-21
得票数 1
2
回答
SQL或R:从具有二进制
数据
类型
的
列
中
查找和显示所有'1's
的
索引,并存储在另一个或多个
列
中
。
mysql
、
r
、
indexing
、
binary
我使用
的
是一个名为“data_1”
的
表,其中一
列
“
col_1
”具有二进制
数据
类型(Ex,1100000)。1)“
col_2
”存储
值
6和7,表示索引6和7处有'1's。2)或者我们可以将输出存储在多
列
'pos_ 1‘、
浏览 1
提问于2019-05-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用Python轻松取代Excel
利用Python实现表格中指定列的值替换
pandas 入门 1:数据集的创建和绘制
手把手教你做一个“渣”数据师,用Python代替老情人Excel
使用Pandas清理货币数据
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券