腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
来自
具有
多个
值
的
dataframe
字符
串列
的
一种
热
编码
、
、
、
我有一个由1245行组成
的
数据帧"df1“,其中有一列文本(对象类型)和主题(对象类型)。主题栏包含与文本标签对应不同数字。1 7 1210 30 June 2019: The G20 Leaders’ Summit and asso... 7 8 9 11 12 13 14 15 17 我想获得一个像这样
的
热
编码
形式(也在列名中
的
数字前添加一个'S‘): text
浏览 19
提问于2021-02-09
得票数 0
回答已采纳
1
回答
在sklearn中应用一个
热
编码
、
、
、
如何将
一种
热
编码
仅应用于
具有
数字类别
值
的
列。我想修改相同
的
数据帧。
Dataframe
还
具有
字符
串
值
的
其他特性。谢谢
浏览 10
提问于2017-01-20
得票数 0
3
回答
在python循环中创建新
的
数据格式
、
、
、
我一直在做一个项目,我陷入了这样
一种
情况:我需要从一个
字符
串列
表中通过过滤
来自
另一个
dataframe
的
字符
串列
表
的
值
来创建
多个
数据文件,该列表中
的
列包含列表中相同
的
值
。我正在编写以下代码: df = pd.
DataFrame
({'A': range(1, 5), 'B': np.rand
浏览 1
提问于2018-05-23
得票数 0
回答已采纳
1
回答
从用逗号分隔
的
字符
串中获取列,考虑每一行
的
值
。
、
我想将以逗号或列表分隔
的
字符
串转换为如下所示
的
列A | X | [1, 2, 3] | B
浏览 4
提问于2022-06-04
得票数 0
回答已采纳
1
回答
如何从csv文件输入进行一次
热
编码
、
、
、
让我们调用一个数值列'num'和一个
字符
串列
'col'。我想做以下几点: 如果输入在字典列表中,这是很容易做到
的
。步骤1.在运行
浏览 6
提问于2016-09-02
得票数 3
1
回答
OneHotEncoding错误:类型错误: float()参数必须是
字符
串或数字,而不是“Timestamp”
、
我得到了TypeError: float()参数必须是
字符
串或数字,而不是'Timestamp‘。import KMeansdf = pd.
DataFrame
(df) enc = OneHotEncoder() enc.fit(df) 我写了做OneHotEncoding
的
代码 enc = OneHotE
浏览 19
提问于2019-12-12
得票数 0
5
回答
如何在一次
热
编码
后给出列名?
、
、
、
这是我
的
问题,我希望有人能帮我弄清楚。 在标签
编码
器之后,我使用了一个
来自
scikit
的
热
编码
器-重新学习,它是工作
的
。但问题是,我需要一个
热
浏览 2
提问于2019-05-28
得票数 29
回答已采纳
3
回答
朱莉娅DataFrames -如何做一个
热
编码
?
、
、
我在用朱莉娅
的
DataFrames.jl包。在它中,我有一个包含
字符
串列
表
的
列
的
dataframe
。“A型”、“B型”、“D型”)。然后如何执行一次
热
编码
?我无法在DataFrames.jl包中找到一个预先构建
的
函数。下面是我想要做
的
事情
的
一个例子:102 |[a] |102
浏览 15
提问于2020-10-28
得票数 12
回答已采纳
2
回答
为什么OneHotEncoder只适用于多达5个不同
的
分类变量值?
、
、
、
、
地理
的
独特价值是法国、西班牙、肯尼亚、博茨瓦纳和尼日利亚,而欧洲大陆
的
独特价值观是欧洲和非洲。我
的
目标是使用OneHotEncoder对地理列进行
编码
。,它看起来如下(还注意到X
的
大小): 但是,如果我将一个新
的
国家添加到TestData文件中,比如比利时。我们现在有6个不同
的
国家。现在,运行完全相同
的
代码将产生以下结果: 它在线路上失败了如您所见,X没有更改,也没有<e
浏览 1
提问于2021-08-29
得票数 1
回答已采纳
2
回答
拥有
多个
值
和一个
热
编码
(Python,Pandas)
的
数据共享密钥?
、
、
、
、
我有以下玩具
dataframe
示例:df = pd.
DataFrame
({'id': [0, 0, 0], 'key':['role', 'role', 'role'], 'val': ['admin', 'local_usr', 'fin_dep_ds']}) 正如您可能看到
的
,相同
的
键
具有</
浏览 6
提问于2022-04-16
得票数 1
回答已采纳
2
回答
在表中保存
多个
值
、
、
、
给予: 输出应保存为表。我怎样才能做到这一点?
浏览 3
提问于2017-03-30
得票数 0
2
回答
当
多个
列包含相同
的
值
时,如何对大型数据进行
热
编码
?
、
、
这个标题实质上反映了我
的
问题。我不确定这是否有帮助,但这是我
的
数据文件
的
head()。
浏览 12
提问于2017-10-09
得票数 3
回答已采纳
1
回答
使用非序数文本特征训练svm分类器
、
我真的无法找到如何训练svm分类器
的
文本功能是不序数,可以是任何可能
的
字符
串
字符
。我正在连续使用这样
的
标签数据集。Tajmahal印度21-08-1990年 现在,对于日期,我使用toordinal()函数进行训练,但对
字符
串
的
特征提取一无所知。
浏览 0
提问于2018-03-11
得票数 0
1
回答
如何将Pandas
Dataframe
中
的
字符
串转换为列表或
字符
数组?
、
、
、
、
我有一个名为data
的
dataframe
,其中
的
一个列包含
字符
串。我想从
字符
串中提取
字符
,因为我
的
目标是对它们进行一次
热
编码
,并使这些
字符
可用于分类。包含
字符
串
的
列存储在预测器中,如下所示:印刷
的</e
浏览 4
提问于2020-05-17
得票数 3
回答已采纳
1
回答
sklearn.linear_model.Lasso能否识别pandas数据帧中
的
分类数据类型?
、
、
我想在sklearn中使用套索回归来运行我
的
数据。我
的
dataframe
中
的
所有属性都是数字类型(数字,我
的
意思是它们都是整数)。但它们中
的
一些显然应该是分类
的
(例如,我
的
dataframe
中
的
“race”属性是一个
具有
三个
值
1,2,3
的
属性,其中每个
值
代表一个种族)。我所做
的
是首先使用astype('str'
浏览 12
提问于2020-05-20
得票数 1
回答已采纳
2
回答
在python altair图
的
热
图中添加间距
、
是否可以在Altair python图中使用mark_rect()创建
的
热
图中添加一些间距?图1中
的
热
图将转换为图2中
的
热
图。您可以假设该
热
图
来自
一个
dataframe
,并且每列对应一个变量。我故意画了这样
的
白条,以避免任何硬
编码
的
索引解决方案。基本上,我正在寻找
一种
解决方案,我可以提供列名和/或索引名,以便在垂直和/或水平方向上绘制白色间隔。
浏览 46
提问于2019-07-22
得票数 5
2
回答
一种
热
编码
分类特征-只限于稀疏形式
、
、
、
我有一个
具有
int和绝对特性
的
dataframe
。分类特性有两种类型:数字和
字符
串。 由于
dataframe
是巨大
的
,
具有
很高
的
基数,所以我只想将它转
浏览 0
提问于2017-03-28
得票数 4
回答已采纳
2
回答
sklearn-LinearRegression:无法将
字符
串转换为浮点数:'--‘
、
、
、
我正在尝试使用sklearn中
的
LinearRegression,但我得到了一个“无法将
字符
串转换为浮点型”
的
提示。数据帧
的
所有列都是浮点型
的
,输出y也是浮点型
的
。<class 'pandas.core.frame.
DataFrame
'>Data columns (total 8 columnsfrom sklearn.linear_model import Lin
浏览 0
提问于2017-09-07
得票数 7
回答已采纳
3
回答
二进制矢量化熊猫
DataFrame
列
、
、
在虚构
的
病人数据集中,可能会遇到下表: "Patients": ["Luke", "Nigel", "Sarah"],}) 现在,假设
具有
多个
疾病
的</em
浏览 1
提问于2019-05-12
得票数 5
回答已采纳
1
回答
当熊猫中有
多个
分类列和较少
的
数值列时,如何进行聚类?
、
、
、
、
假设我有一列(X),它保存客户id,并有其他多列x1、x2、x3、x4、x5、x6,它们只有这4个不同
的
值
(“高”、“低”、“中”、“南”)。请按上述附件。最近更新: 16/12/2021:我已经做了一次
热
编码
,现在除了X列还有19个特性,现在我需要知道如何对这些无监督
的
数据集进行集群部分
浏览 7
提问于2021-12-14
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习中的独热编码
Scikit-Learn大变化:合并Pandas
pandas系列学习(三):DataFrame
机器学习100天:第1天
肝了3天,整理了90个Pandas案例
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券