腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
正在
尝试
减少
数据
集
的
列
数
。
、
、
我
试图
减少
具有形状(20000,8000)
的
向量X
的
列
数
,但
减少
了
数据
集
的
行数,使其成为新
的
数据
集
X_5000,其形状为(5000,8000)。请让
我
知道
我
哪里出了错。当前
我
有形状(20000,8000)
的
-X向量所需
的
- X_5000 -形状(5000,8000)向量<em
浏览 20
提问于2019-06-24
得票数 0
2
回答
如何通过创建新
列
来降低
数据
集
的
维
数
我
正在
寻找一种方法,通过创建一个新
列
来降低
数据
集
的
维度。Gene ID1 ID2 ID3 ...但是,如您所知,
数据
集
的
维
数
太高,
我
无法将该表导入SQL
数据
库。这就是为什么
我
要将
数据
集
转换为以下形式
的
原因
浏览 1
提问于2021-02-23
得票数 0
1
回答
如何
减少
一次热编码后
的
列
数
、
、
、
、
我
正在
处理一个
数据
集
,该
数据
集
需要将一个分类
列
转换为一个数字等价物,因为dataset需要几种ML技术才能实现。
我
使用一种热编码技术将分类
列
(即国籍)转换为适合机器学习模型
的
数字
列
。然而,这种技术往往返回总共227
列
。只是想知道是否有一种方法可以
减少
实现OHE后获得
的
列
数
。谢谢。 图像附在上。
浏览 4
提问于2022-03-05
得票数 0
1
回答
在大型
数据
集
上使用rpart包
、
、
、
我
有一个将近10000行和10
列
的
大型
数据
集
。
我
想使用rpart包对此
数据
集
进行分类。但每
列
都有许多(超过50个)类。所以R就挂起来了。
我
有哪些选项来限制
数据
的
范围或
减少
每
列
中
的
类
数
?
浏览 2
提问于2016-03-22
得票数 0
1
回答
For循环打印出两个
数据
帧中都不存在
的
列
、
、
、
我
有两个
数据
集
,一个称为训练
集
,另一个称为测试
集
,它们都是熊猫
数据
框架。训练
的
数据
集
的
列
数
多于
数据
集
测试
的
列
数
。
我
仍然是python
的
新手,
我
正在
尝试
编写一个for循环,它比较两个
数据
帧
浏览 11
提问于2019-12-11
得票数 0
回答已采纳
3
回答
Mariadb专栏商店
的
最大限度是什么?
、
、
我
想在mariadb专栏商店中创建数千行
的
宽表。
我
没有找到存储引擎允许
的
最大
列
数
的
任何文档。
我
还想知道1000个整数列
的
列
存储性能如何?
浏览 2
提问于2018-05-15
得票数 1
回答已采纳
1
回答
如何加快Pandas中大型
数据
集
上相关矩阵
的
计算?
、
、
、
我
使用
的
数据
集
大约有460,000行和1,300
列
。
我
想通过使用熊猫
的
.corr()函数看到对分数影响最大
的
栏数来
减少
列
数
。 然而,在如此大
的
数据
集
上,计算相关矩阵大约需要20分钟。
浏览 0
提问于2022-11-21
得票数 1
回答已采纳
1
回答
保留百分比方差
的
PCA降维方法
、
、
、
我
试图使用PCA
减少
MNIST
数据
集
的
维度。诀窍是,
我
必须保留一定百分比
的
方差(例如80%),同时
减少
维
数
。
我
在用Scikit学习。
我
正在
做pca.get_variance比率,但它给我相同
的
值,不同
的
点位置,如9.7,或.97或.097。
我
也
尝试
过pca.get_variance(),但我认为这不是答案。<e
浏览 2
提问于2016-05-20
得票数 2
回答已采纳
1
回答
CUDA_OUT_OF_MEMORY in PyTorch head2head模型
、
、
、
我
正在
执行Github 中提出
的
head2head模型。当我使用以下命令运行代码时:将train_on_target.sh文件
的
内容设置为:
我<
浏览 1
提问于2021-03-05
得票数 0
回答已采纳
1
回答
加快用于变行和read_csv
列
的
大型csv
的
read_csv
、
、
我
正在
尝试
读取包含可变
列
数
和行
的
CSV文件,以便计算(Min,Max,Mean,75/95分位
数
)每
列
的
值。
我
对
数据
集
的
了解: 除了第一
列
之外,所
浏览 3
提问于2020-03-10
得票数 0
1
回答
SciKit-Learn:基本
的
PCA混淆
、
我
正在
尝试
使用SciKit-Learn在
我
的
数据
集
上执行PCA。
我
目前有2,208行和53,741
列
(特性)。因此,
我
想使用PCA来降低这个
数据
集
的
维
数
。
我
在关注Hands-On Machine Learning with SciKit-Learn and TensorFlow from sklearn.decompositio
浏览 7
提问于2017-07-06
得票数 2
回答已采纳
1
回答
最大一个
数据
点
、
、
、
、
我
对
数据
科学完全陌生,
我
希望缩小搜索范围,
减少
解决以下问题所需
的
学习曲线。
我
有一个7
列
的
数据
集
,A
列
(全部为正十进制)是
我
想要最大化
的
数据
点。B
列
和C
列
是布尔值,其余
列
是正数和负十进制
数
的
组合。
我
想从所有的专栏中找到一些关系和见解,这样<
浏览 0
提问于2020-01-06
得票数 2
回答已采纳
3
回答
为固定长度
的
输入创建快速哈希函数
、
目前
我
正在
做一个项目,其中一些信息必须进行哈希处理。由于
数据
集
很大(每天创建数百万条记录),因此
数据
转换
的
算法必须很快。必须散
列
的
数据
片段是固定长度
的
(11个十进制
数
-示例: 05018144298)。所以我想知道
的
是,为了显著
减少
处理时间,是否值得创建自己
的
散
列
函数而不是使用一些现有的散
列
函数(例如MD5),
浏览 2
提问于2010-09-05
得票数 3
回答已采纳
1
回答
范畴
数据
集
的
一种热编码:如何处理分类
数据
中
的
不同值(减数)
、
、
、
、
训练
数据
集
总分类栏: 27OH_encoder = OneHotEncoder(handle_unknown='ignore', sparse=False)在编码后,在准备测试
数据
用于预测时, 来自测试
数据
的
列
浏览 2
提问于2019-11-28
得票数 2
回答已采纳
1
回答
如何使用Office脚本删除表中
的
列
我
有一个表,
我
希望删除特定
的
列
,以便通过Office Scripts进行进一步处理。
我
也看过API参考,但我找不到这样做
的
方法。
我
总共有大约30
列
,但希望删除几个包含空行
数据
的
列
,之后计划使用getId()或getIndex()对
减少
的
列
集
执行进一步
的
操作。
我
担心
的
是,每个E
浏览 41
提问于2021-04-21
得票数 0
回答已采纳
3
回答
如何在java中逐行分割文本文件
、
我
正在
用Java读取一个文本文件,如下所示,Q2。在PCA中是否需要旋转?如果是,为什么?如果不旋转组件,会发生什么情况?
浏览 1
提问于2017-12-08
得票数 0
回答已采纳
3
回答
在Android上使用模式单例
、
我
正在
开发一个从服务器检索
数据
的
应用程序。
我
有两个选择:什么是最好
的
选择?
浏览 5
提问于2011-08-31
得票数 0
回答已采纳
1
回答
设置AMCharts ScrollBar
的
初始范围
、
我
已经使用实现了一个序列图,但是它
的
列
数
比窗口中实际显示
的
列
数
还要多。为了
减少
提取
的
数据
量,
我
添加了一个ChartsScrollBar,它可以完成这个任务,但最初它会选择所有
数据
。有人知道如何设置滚动条
的
初始缩放吗?
我
正在
尝试
让“缩放栏”在
浏览 0
提问于2012-09-25
得票数 5
回答已采纳
2
回答
面向大
数据
集
的
多标签分类
、
、
、
、
我
正在
解决一个多标签分类问题。
我
有大约600万行要处理,这些行是巨大
的
文本块。它们在单独
的
列
中使用多个标记进行标记。 任何关于哪些scikit库可以帮助我扩展代码
的
建议。
我
在其中使用了One-vs-Rest和SVM。但是它们不能扩展到超过90-100k行。
浏览 3
提问于2013-11-29
得票数 6
1
回答
如何将PCA应用于
数据
集
并打印相关特征
、
我
有一个有23行48
列
的
数据
集
。
我
正在
应用PCA来
减少
列维
数
。
我
使用了以下代码示例,并且
我
看到只有23个是必需
的
特性:import numpy as nppca = PCAseconddf_pca =
浏览 1
提问于2021-05-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何管理Spark的分区
查询和处理mysql锁表问题
《Python数据挖掘及大数据分析》第四讲 Kmeans聚类代码实现、作业及优化
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券