腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
python
pandas
中
通过
id
值
匹配
行
、
、
我需要
匹配
数据库
中
的联系人如何
通过
一个唯一的身份证号码联系。method", "from:", "column that I dont know how to make"]stackdata2 = pd.DataFrame(data2, columns=["
id
", "email", "phone", "slack"])
在
我的真实数据集中,我想要填写的是列“我不知道如何
浏览 9
提问于2019-06-19
得票数 0
回答已采纳
1
回答
如何将json文件附加到dataframe?
、
其中一列是产品
id
。每个产品都
通过
以下url链接到一个json文件:我需要做的是加载存储
在
json文件
中
的信息,并将其属性键与数据集中的列
匹配
的所有
值
附加到具有相同产品
id
的
行
,并填充那些不
匹配
的
值
。json
浏览 0
提问于2015-07-28
得票数 0
2
回答
如何根据
python
中
另一列
中
的
值
来移动单元格?
、
我有一个如下的数据框架:
id
| time1 | 10:222 | 10:402 | 10:50 我想添加一个新专栏,如下所示:
id
| time | new_time1 | 10:22 | 10:232 | 10:40 | 10:452 | 10:50 | None 这意味着,我希望
通过
匹配
id
列<em
浏览 14
提问于2019-02-25
得票数 4
回答已采纳
1
回答
是否只读取符合条件的.parquet文件的特定
行
?
、
、
其中一列'
id
‘唯一地标识了一台机器。我能够使用pyspark打开某个目录路径
中
的所有.parquet文件,然后从'
id
‘列创建一组
值
([])。我想打开所有其他文件
中
的所有其他
行
,其中'
id
‘与先前计算的集合
中
的一个
值
相
匹配
。 我可以
通过
pyspark做到这一点,但它相当复杂,需要我实例化一个本地spark服务器。我试图
通过
pyarrow找到一种方法来
浏览 27
提问于2019-10-19
得票数 1
回答已采纳
3
回答
熊猫:从两个数据
中
匹配
值
-多到一个。
、
、
、
我有两个数据帧,我需要逐行
匹配
。
在
发生
匹配
的地方,我需要在df1
中
增加字段的
值
+1。df2与df1有多个
匹配
项。我不想合并数据格式,只需根据与df2的
匹配
更新df2即可。我头脑中的基本逻辑是读取df1的第一
行
,然后尝试将TRANID
匹配
到df2的每一
行
。当发生
匹配
时,向NUMINSTS
值
添加+1。然后循环返回,并对df1上的下一
行
执行相同的操作。我只是不知道如何在
浏览 20
提问于2022-04-22
得票数 0
回答已采纳
1
回答
当与
Python
中
的
Pandas
系列完全
匹配
时,从dataframe获取
行
的
id
、
、
我有一个和一个单独的
Pandas
系列(实际上保留了一个
行
的
值
),它们与该dataframe
中
的一个
行
匹配
。我已经看到很多人在某些列
值
匹配
时找到
行
I,例如但是,我需要在行的所有列
值
中进行完全
匹配
浏览 3
提问于2021-04-29
得票数 0
回答已采纳
1
回答
用
Python
中
的CSV创建嵌套字典
我想从csv文件
中
读取播放器的统计信息到嵌套字典
中
。Games Playedplayer2 4 8 49最后,我希望能够
通过
调用访问球员的统计数据,例如:print(x) 对于
python
来说是非常新的,所以对于如何实现这一点的任何帮助都将是非常感谢的!
浏览 2
提问于2020-08-09
得票数 0
回答已采纳
1
回答
将数据
行
连接到
Pandas
中
的新数据
、
通过
Pandas
,我正在用
Python
处理大量数据。我有一个包含感兴趣的标识符的文件和一个数据文件,其中的
行
可能与这些标识符
匹配
,也可能与这些标识符不
匹配
。我编写了一段代码,它使用第一个文件
中
的标识符来查找与第二个文件
中
的标识符
匹配
的行数据。该代码目前将感兴趣的
行
输出到终端(
通过
"print")。我希望将我的代码找到的数据
行
加载到DataFrame
中</
浏览 1
提问于2014-07-21
得票数 1
回答已采纳
1
回答
保存csv文件而不执行任何操作后发生pd.to_datetime错误
、
、
、
来自
pandas
.core导入日期工具跟踪(最近一次调用):文件
pandas
.core第444
行
,
在
_convert_listlike
值
中
,tz = tslib.datetime_to_datetime64(arg)文件"
pandas
_libs\tslib.pyx",第1810
行
,
在
pandas
._libs.tslib.datetime_to_datetime64 (
pandas
浏览 6
提问于2017-11-15
得票数 0
1
回答
在
python
中
处理.csv
、
、
、
然后,我想检查另一个任意大小的.csv文件,文件B的每一
行
是否与列表1
中
的每个
值
相
匹配
。文件B的行数始终是文件A的200倍左右,每行32个元素,但我只对检查文件B的第11列
中
的
匹配
项感兴趣。当我找到一个
匹配
项时,我使用该行的索引将文件B
中
的整个
行
添加到一个新的2d列表list Y
中
,该列表包含所有32个元素。我已经成功地将这两个文件读入到它们自己的列表
中
,并创建了一个包含文件B的列表
中</e
浏览 0
提问于2020-10-09
得票数 0
1
回答
将特定列
值
复制到与特定字符串
匹配
的另一列
、
我使用的是
Python
lib
pandas
。对于数据框
中
特定列与特定字符串
匹配
的所有
行
,我希望将该
值
从左侧的列复制到当前列。例如,对于具有
值
为'not available‘的列City的所有
行
,我希望将
值
从左边的列复制到当前列City。import
pandas
as pd df = pd.DataFrame({'Country': ['France','
浏览 11
提问于2020-02-09
得票数 0
回答已采纳
1
回答
向Dataframe添加一个新列并设置MultiIndex
、
"histo_var.py",第202
行
,
在
cl_bal.set_index('app_vendor_
id
',‘货币’)文件cl_bal.set_index
中
第3909
行
,
在
"/Library/Frameworks_getitem_column(键)文件的第2695
行
中
,
在
"/Library/Frameworks/
P
浏览 2
提问于2019-07-23
得票数 1
回答已采纳
1
回答
熊猫“加入”怪事
、
、
、
如果我尝试这样做(
pandas
的两个不同的年份,一个
在
Python
2
中
,另一个
在
Python
3
中
)x = pd.DataFrame({"
id
": [1, 2,3], "value1": [5,5,5]}) y = pd.DataFrame({"
id
": [1], "value2": [10]})
浏览 1
提问于2018-06-17
得票数 2
回答已采纳
1
回答
如何根据包含
Python
中
列表的dataframe单元格进行分组?
、
、
、
我正在使用
Python
和
Pandas
,试图以一种有效的方式,根据I列表而不是唯一I来总结不同行
中
的dataframe
值
。] - 50r - 015 - ['hhh'] - 15 可以尝试用列表
中
的元素引爆每一
行
,但它可能会将
值
复制为求和,而且
在
时间和资源方面可能不是一
浏览 1
提问于2019-07-05
得票数 2
回答已采纳
1
回答
Python
--老熊猫合并的结果比新的熊猫多。
、
我有两个环境:
Python
3.7.5
Pandas
0.23.43.8.10
Pandas
1.3.4
Python
我
在
两个版本中都有相同的代码,没有对其进行任何修改。我
在
两个版本的调试器
中
检查了它们,它们是完全相同的,所以应该没问题。另外,left_on、right_on和suffixes变量在这两种环境中都具有完全相同的
值
(也
通过
调试器检查)。但是,当df_result由merge函数生成时,
在
浏览 1
提问于2021-12-14
得票数 0
回答已采纳
1
回答
比较来自不同
Pandas
数据帧的列,并替换其
值
<
Pandas
,
Python
>
、
、
、
我有两个类似的数据框(名为dfA,dfB),它们具有
ID
和代码。
ID
表示患者
ID
,code为疾病代码。dfA更大,所有的dfB实际上都在dfA
中
。但是,dfA
中
的疾病代码有些旧,需要
通过
dfB
中
的代码进行更新。 我的任务是将dfA的所有
ID
行
与dfB进行比较,如果有
匹配
的
ID
,则使用dfB更改dfA
中
的疾病代码
值
。以便正确地更新代码。对于普通的
python
浏览 15
提问于2018-08-28
得票数 0
回答已采纳
1
回答
如何在多个dataframe lambda函数上实现dask映射分区?
、
、
、
、
我已经使用
pandas
实现了两个数据帧之间的模糊字符串
匹配
算法。我的问题是如何将其转换为使用多核的dask操作?我的程序
在
纯
python
上运行大约3-4天,我想并行操作以优化时间成本。我已经使用多处理包
通过
以下代码提取了内核数量:emb = pd.read_csv与
在
中一
浏览 3
提问于2018-05-19
得票数 0
1
回答
检查
pandas
df2.colA
中
是否存在df1.
id
,并将(df2.colB,df2.colC)写入df1.colAB
、
、
、
、
在
列
id
中
,df1具有唯一的
id
。这些
id
在
df2.colA中出现(多次)。我想将df2.colA中出现的所有df1.
id
的列表(以及df1.
id
== df2.colA的
匹配
索引处的另一列)添加到df1的新列
中
。或者使用
匹配
的df2.colA的索引,或者附加地使用所有
匹配
的其他
行
条目。示例: df2
浏览 0
提问于2021-09-07
得票数 1
2
回答
从两个熊猫系列创建元素级词典( csv列为DataFrame)
、
、
我希望做一个逐行字典映射的两列标题多列csv
通过
pandas
DataFrame
通过
read_csv()读取。换句话说,对于每一
行
,将列X
中
的
值
作为键,Y列
中
的相应
值
作为
值
。由于
pandas
中
的许多操作都是按元素计算的,因此我推测,我可能
通过
以下一
行
程序来实现这一点:唉,没有这样的运
浏览 3
提问于2016-05-13
得票数 2
1
回答
如何根据基于
行
的计算将新列添加到我的
Pandas
DataFrame
中
?
、
假设我有一个带有两列的
Pandas
DataFrame : 1) user_
id
,2)步骤(其中包含给定日期的步骤数)。现在,我要计算前一个度量
中
的步骤数和步骤数之间的差异(
在
我的DataFrame
中
,度量保证是有序的)。因此,这基本上可以归结为
在
我的DataFrame
中
附加一个额外的列,其中此数据帧的
行
值
与这一
行
中
的列'steps‘的
值
相
匹配
,减去上面
浏览 2
提问于2015-01-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(五):数据连接
4个解决特定的任务的Pandas高效代码
Python数据分析中数据对齐功能都是自动的,这些你知道吗?
Python数据分析之Pandas读写外部数据文件
最全攻略:数据分析师必备Python编程基础知识
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券