腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
pandas
列
中
使用
许多
不同
的
匹配
项
、
我有一个熊猫
的
DataFrame是这样
的
: col1 col22 x4 y6y8 z10 z 我需要
的
是为col2
中
的
每个
不同
元素获取前2个col1实例。本例
中
的
输出应为1,2,4,5,8,9 我不知道该怎么做,我
在
StackOverflo
浏览 15
提问于2020-03-25
得票数 0
回答已采纳
1
回答
Excel
匹配
并复制到
在
Excel
的
A
列
中
,我有一个数据范围。
在
列
D
中
,相同
的
数据与
许多
其他行一起存在。我要查找
列
A和
列
D之间
的
匹配
项
,如果存在
匹配
项
,则将与
列
D中找到
的
匹配
项
相邻
的
列
C
中
的
浏览 3
提问于2017-07-19
得票数 0
1
回答
比较
pandas
中
的
数据帧
、
、
、
、
我有两个独立
的
pandas
数据帧(df1和df2),它们有多个
列
,其中有一些公共
列
。33 5
浏览 6
提问于2018-02-25
得票数 0
回答已采纳
1
回答
Python文本
匹配
-同义词
、
、
、
、
我
在
Pandas
中有两
列
:A和B,每一
列
都包含术语字符串。我
的
目标是
在
B
列
中找到与A
列
最相似的条目。我已经
使用
TF-IDF来做到这一点,但有时有一些同义词并不明显
匹配
,例如钱和货币。如何查找也包含同义词
的
匹配
项
?
浏览 5
提问于2017-05-18
得票数 2
2
回答
用NA替换
pandas
数据框中所有出现
的
值
的
快速方法
、
我正在
使用
python脚本来清理和连接
许多
大型.csv文件。具体地说,我正在
使用
pandas
read_csv函数读取文件,然后将它们作为dataframe对象进行处理,这非常有效。这是我第一次
使用
pandas
,所以我仍然
在
习惯它包含
的
所有令人难以置信
的
有用功能。 我正在读取
的
csv文件
使用
-99.9作为标记值来表示NA/NaN。由于这与我在其他地方表示丢失数据
的
方式<e
浏览 0
提问于2013-07-05
得票数 2
回答已采纳
3
回答
熊猫模糊检测重复
项
、
、
、
、
如何在
pandas
中
使用
模糊
匹配
来检测重复行(高效)如何找到一个
列
与所有其他
列
的
重复
项
,而不是转换row_i toString()
的
巨大for循环,然后将其与所有其他
列
进行比较?
浏览 10
提问于2016-09-14
得票数 4
回答已采纳
2
回答
在
Python
中
根据数据框创建正则表达式
匹配
列表,然后计算
匹配
数
、
、
、
我
在
试着我可以成功地
使用
正则表达式来查找
匹配
项
,但是我无法获得显示
的
列表并对它们进行计数我尝试
使用
str.extract()列出所有
匹配
,并
使用
str.contai
浏览 8
提问于2018-01-18
得票数 1
7
回答
在
一条线上搜索和标记成对
的
图案
、
、
、
以下是放置
在
单独文件
中
的
示例模式
的
简短列表,例如:LION,FOREST如果第2栏
中
的
项目与第1栏
中
的
项目
在
同一行之后和在同一行中出现,则会出现
匹配
。(matches)THETREEHAS
浏览 0
提问于2012-03-12
得票数 7
回答已采纳
1
回答
如何真正过滤熊猫数据集而不离开各地
的
Nans
、
、
假设我有一个巨大
的
DataFrame,它只包含少数几个与我执行
的
过滤
匹配
的
单元格。如何才能在一个新
的
dataframe
中
只获得与其
匹配
的
值(以及它们
的
索引和
列
),而不
使用
整个其他
的
DataFrame,而后者变成了Nan。
使用
dropna删除Nans只会删除整个
列
或行,而filter用Nans替换非
匹配
项
。这是我
浏览 2
提问于2020-12-18
得票数 1
回答已采纳
4
回答
向量化或加速
PANDAS
列上
的
Fuzzywuzzy字符串
匹配
、
、
、
我正在尝试
在
充满组织名称
的
PANDAS
列
中
寻找潜在
的
匹配
项
。我目前正在
使用
iterrows(),但它在大约有70,000行
的
数据帧上非常慢。fuzzy_match'] = x[0]实际上,对于每一行,我将组织名称与所有组织名称列表进行比较,获取前两个
匹配
项</e
浏览 4
提问于2018-10-04
得票数 14
1
回答
从URL创建名称
、
我正在DataFrame
中
创建一个NAME
列
,并根据另一
列
中
包含
的
子字符串设置它
的
值。df = pd.DataFrame([['www.
pandas
.org','low'], ['www.python.org','high']], columns= df['URL
浏览 0
提问于2020-06-25
得票数 3
回答已采纳
2
回答
如果两个文件具有相同
的
列
值,则合并这些文件
中
的
行
、
、
目前,我正在亚马逊
的
网站上搜寻一些数据。我遇到
的
问题是,我不能真正从同一个页面获得一个产品
的
所有数据。 我最终得到
的
是两个文件,它们具有相同
的
列
标题,但
列
本身
的
数据
不同
。例如,
在
一个.csv文件
中
,产品包含信息
的
“代码”、“名称”、“url”、“大小”,而在另一个文件
中
,它包含“代码”、“价格”、“image1”、“image2”等等。如果file2
中</
浏览 10
提问于2019-02-01
得票数 1
回答已采纳
2
回答
在
Python中
使用
循环根据字符串值修改新
列
中
的
行值
、
我想
使用
循环根据
pandas
中
的
字符串
匹配
重新编码
不同
列
中
的
行值。我找到了一种方法,每次创建一个全新
的
列
,但当我需要修改分析
中
不同
点处
的
多个
列
中
的
select行时,这种方法就不起作用了。以下是我
在
示例数据帧中
使用
的
解决方案: iris =
浏览 26
提问于2020-07-08
得票数 0
1
回答
写入Oracle: TypeError:期望字符串或字节对象
、
、
、
、
我试图将具有51
列
的
65000+行推送到oracle,但最终收到了一个类型错误。是否有办法找出该错误来自哪一
列
,以便进行调试。另一个问题--
在
Oracle
中
,python dataframe
中
的
Datatype "Object“能被读取为'Number‘Dtype吗?\io\sql.py", line 589, in to_sql File "C:\Progra
浏览 12
提问于2022-01-07
得票数 2
回答已采纳
1
回答
在
DataFrame
中
查找
不同
的
最佳
匹配
、
我不知道这是不是最好
的
标题,但这就是我得到
的
。 我正在寻找
的
是为第一
列
中
的
所有值找到最佳
匹配
(基于最小距离),而不会在第二
列
中有重复
的
匹配
。4bar test 4foo testy 5 bar testy 5 我希望为第一
列
中
的
三个唯一值找到最佳<em
浏览 11
提问于2020-04-16
得票数 0
回答已采纳
1
回答
什么算法可以用来模糊合并多个数据集?
、
、
、
问题描述假设我
的
数据是多个表,表A到Z。 可能会有
列
,我百分之百地肯定在
匹配
。例如,表A和表B
的
列
税ID是连接A到B
的
特定
匹配
项
,仅A和B都不能与C
匹配
,但
使用
来自A和B
的
列</e
浏览 0
提问于2019-01-02
得票数 1
1
回答
Pandas
:
在
某些
列
的
字符串
中
查找子字符串
、
我有一个2数据帧,
在
第一
列
,我应该在第二
列
中找到一些信息,我应该在第一个数据帧和
列
中找到什么,如果第一
列
中
的
字符串包含,我应该添加什么。Subcategorytwitter.com Social Network entertainmentdf1['Main Category']
浏览 13
提问于2017-01-19
得票数 0
1
回答
使用
Pandas
有效地根据现有
列
的
值向新
列
添加值
、
、
我
使用
下面的脚本来创建一个新
的
Dataframe
列
,该
列
的
值取决于REGEX与现有
列
中
的
值
的
匹配
:data,使其适用于更复杂
的
场景。我希望避免
使用
许多
行
的
df.loc,并且我想知道是否有一种方法可以
使用
例如字典来
浏览 0
提问于2019-09-02
得票数 0
回答已采纳
1
回答
为熊猫DataFrame创建另一个索引,如SQL
中
的
create索引
、
、
我可以
在
熊猫DataFrame
的
现有列上创建另一个索引吗?就像CREATE INDEX
在
SQL中所做
的
一样。例如:我
的
DataFrame有两
列
id_a和id_b,这两
列
对每一行都是唯一
的
,我希望有时用id_a索引行,而有时用id_b索引行(所以我认为MultiIndex不会对我起作用)。
浏览 6
提问于2021-05-20
得票数 4
回答已采纳
1
回答
尝试从另一个相关数据框有条件地向
pandas
数据框添加
列
、
、
我对
使用
pandas
是一个全新
的
尝试,我已经尝试寻找这个(看起来很简单
的
)问题
的
解决方案。我尝试有条件地向来自另一个数据帧
的
一个数据帧
的
某些行添加一
列
。df_1
中
活动标志为'Y‘
的
所有行。可以
使用
Acme ID
列
将df_2
中
的
项
连接到df_1
中
的
项
。'Ot
浏览 13
提问于2021-01-14
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券