腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
Python
数据
帧
的
文本
列
中
的
特定
单词
创建
虚拟
变量
和
分类
变量
、
、
、
、
我正在尝试使用
Python
从
dataframe
中
的
文本
列
生成
虚拟
变量
和
分类
变量
。想象一下,在名为“Cars_listing”
的
数据
帧
中有一个
文本
列
“Cars_notes”: - "This Audi has ABS braking, leather interior and bucket如何
创
浏览 11
提问于2019-08-19
得票数 0
回答已采纳
1
回答
计算pyspark Dataframe
中
的
列
数?
、
、
、
我有一个有15
列
的
数据
帧
(4
列
是
分类
的
,其余
的
是数字
的
)。print typ
浏览 10
提问于2017-03-15
得票数 5
回答已采纳
1
回答
获取由get_dummies
创建
的
伪
变量
的
名称
、
、
我有一个
数据
帧
,其中包含大量不同类型
的
列
。我想使用get_dummies()对
数据
帧
中
的
分类
变量
进行编码。问题是:有没有一种方法可以获得get_dummies()
创建
的
编码
分类
列
的
列
标题 最困难
的
方法是提取
数据
帧
中所有
分类
变量</e
浏览 16
提问于2020-09-10
得票数 0
3
回答
如何去除R
中
的
一个因子级?
、
我需要将
变量
从
R
中
的
数据
帧
中
删除,我
的
数据
有一
列
有18个因素: drop if rama1 == 99 (rama1是因子
列
,99是“未
分类
”
浏览 1
提问于2015-08-30
得票数 1
回答已采纳
3
回答
从
列表
创建
虚拟
变量
、
因此,我试图
创建
虚拟
变量
来附加到
数据
帧
上,这取决于框架
的
特定
列
中
是否包含
特定
的
单词
。该
列
看起来如下所示:我将根据每
浏览 3
提问于2015-05-28
得票数 3
回答已采纳
1
回答
如何使用
文本
数据
清理
数据
集并将其用于
分类
、
、
我正在研究
数据
集上
的
性别
分类
器,其中包含了许多缺失
的
值
和
更多
的
范畴values.How,我是否应该将
分类
值转换为数值,以及应该使用哪种算法来获得更高
的
精度?
浏览 1
提问于2017-12-28
得票数 0
回答已采纳
1
回答
Python
:理解
分类
变量
的
d树输出
、
、
、
、
我在学习
Python
Scikit-学习。col_names =['city_name','signup_os','signup_channel'] df_with_dummies = pd.get
浏览 1
提问于2017-07-02
得票数 0
回答已采纳
1
回答
Pandas:如何
从
两个
数据
帧
的
联合
中
获取
虚拟
变量
列
?
、
、
、
、
我有两个
数据
帧
,每个
数据
帧
都有相同
的
变量
和
行长,但
分类
变量
(对象
列
)有时在一个
和
另一个中有不同
的
实现。 这就是我
的
意思。flakes row 3 | blue | cheerios ||| row 3 | green | flakes 正如您在上面的基本插图中所看到
的
,绿色只出现在第二个<em
浏览 11
提问于2019-01-13
得票数 0
回答已采纳
2
回答
将数组结构转换为dataframe以获取列名
、
、
我有一个
数据
帧
,我已经将其转换为数组,以便使用回归算法对
数据
进行建模。我使用了以下代码来完成此操作Y=df.iloc[:,345].values 因此,X&Y是数组,now.There是许多
列
,因为,
分类
变量
已经被
创建
为
虚拟
变量
,我想要得到我
的
分类
变量
的
值(X &Y是在为所有
分类</e
浏览 8
提问于2018-08-17
得票数 1
回答已采纳
2
回答
基于神经网络
的
时间序列预测(混合
数据
类型)
、
、
、
我有一个具有以下格式
的
数据
集:2015-02-05 | Action1 | XXX2015我试图根据
数据
集中
的
Actions历史来预测
特定
用户
的
未来Users。我
从
MATLAB
的
nt粪便开始,但它不能处理混合
数据
类型或非数字值。现在,我正在寻找其他方法来预测未来
的
Actions,并在记录中找到周期模式
浏览 0
提问于2016-05-25
得票数 0
回答已采纳
2
回答
如何管理多个
数据
集-机器学习Azure
、
是否存在接受多个
数据
集进行处理
的
模块?例如,“拆分
数据
”、“编辑元
数据
”
和
“选择
数据
集中
的
列
”不接受多个
数据
集作为输入。 这就是我所做
的
:在我
的
模型中有几个数字
和
分类
变量
。我使用“转换为指示器
变量
”模块为我
的
数据
创建
虚拟
变量
。如何将指标<e
浏览 28
提问于2019-04-11
得票数 0
1
回答
如何为大型
数据
集在R
中
添加
虚拟
变量
、
我有一个包含列名: ID
和
Property
的
大型
数据
集。可能有几行共享相同
的
ID,这意味着一个ID具有许多不同
的
属性(
分类
变量
)。我希望为属性添加
虚拟
变量
,最后在每一行
中
获得一个ID不同
的
数据
帧
,并使用1/0指示它是否具有该属性。原始
数据
有200万行
和
10000个不同
的
属性。因此,理想情况下,我将通过
浏览 1
提问于2017-02-01
得票数 1
回答已采纳
1
回答
Excel到
Python
的
大型面板
数据
,回归准备格式?
、
、
、
尝试将一些大型面板
数据
从
excel转换到
python
中
,这样我就可以进行一些GMM/横截面面板
数据
回归分析(想想sci-kit包)。我已经将
数据
从
excel转移到
Python
,但用于回归分析
的
格式不正确(见下文)。Scikit网站上有一些
数据
集可以使用,但对于讨论格式以及如何将您
的
数据
转换为类似的格式以将我
的
数据
转换为
Pytho
浏览 1
提问于2016-07-24
得票数 0
2
回答
多项式项
和
相互作用项
的
glmnet岭回归
、
、
、
我有一个包含9000个观察值
和
13个解释
变量
的
数据
集。 其中一些是
分类
变量
,因此我将它们转换为
虚拟
对象,并始终将一个类别设置为空,因为它是基本类别。现在我已经有了53个解释
变量
。我想做一个岭回归,以获得样本外预测
的
最佳模型。为此,我想使用glmnet包。在13个解释
变量
中
,我想
创建
2-10次
的
多项式,并构建正常
变量
和
所有多项式<
浏览 1
提问于2018-06-25
得票数 0
2
回答
编写R函数,该函数仅在声明时进行子集设置
、
、
、
、
我正在尝试编写一个函数,
从
特定
列
(深度)
的
数据
帧
中提取方法
和
min
和
max,它可以被两个
分类
变量
分类
,因此在函数
中
,一个是按类型
变量
分组
的
。另一个
分类
变量
是在2020年或2021年收集
的
数据
。我希望默认函数提取所有年份
的
数据
,除非在参数<e
浏览 2
提问于2021-12-13
得票数 0
4
回答
`检查输入
数据
、
、
、
我有一些
分类
预测因子(即
变量
)为0& 1
的
pandas
数据
帧
,以及一些数值
变量
。当我把它放到一个stasmodel
中
时:它抛出:在此之后,所有
数据
<
浏览 0
提问于2015-11-21
得票数 34
2
回答
为什么将
虚拟
变量
从一个
数据
帧
转移到另一个
数据
帧
创建
NAN值?
、
、
我有一个具有5195个不同值
的
分类
变量
,没有任何缺失
的
值,当我使用pd.get_dummies
创建
虚拟
变量
时,它会
创建
没有任何缺失值或NAN值
的
虚拟
变量
。df有5个
列
和
70万行输出0 5 4 6 -1 1 02 7 4fine&q
浏览 1
提问于2015-10-29
得票数 2
回答已采纳
2
回答
python
中
"Lasso“
的
输入可以包含
分类
变量
吗?
、
、
我想在
python
中使用套索执行多重线性回归。我不确定输入观测矩阵X是否可以包含
分类
变量
。我从这里阅读了说明:model = Lasso(fit_intercept=False, alpha=0.01)在上面的代码
中
,X是一个大小为n-x-p
的
观测矩阵,p个
变量
中
的
一个可以是
分类
类型吗?
浏览 0
提问于2019-11-16
得票数 2
1
回答
带范畴
变量
的
线性回归
、
、
、
、
我目前正在学习
和
探索机器学习,并了解基于两个数值
变量
的
线性回归
的
基础知识,但现在我希望更进一步,并需要一些指导,了解如何去做。具体来说,我现在正在学习关于线性回归
的
范畴
变量
,我理解它
的
要点:我们只是将范畴
变量
编码成某种数值表示形式(比如一种热编码),并将其放入模型
中
。太棒了。虽然网上有很多关于如何做各种编码方法
的
指南,但我还没有找到一个资源来解释这种方法
的
用例:在何种情况下使用
分类
浏览 0
提问于2021-04-10
得票数 1
1
回答
创建
具有200k唯一值
的
伪
变量
、
、
我试图为
分类
数据
集
创建
一个
虚拟
变量
,但问题是
python
没有兼容
的
ram来运行代码,因为唯一值太大而无法
创建
虚拟
变量
。它是一个具有500k行
和
200k唯一值
的
大型
数据
集。是否可以
创建
一个具有200k唯一值
的
虚拟
变量
?
浏览 0
提问于2021-04-21
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券