腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
sklearn
中
的
模型
如何
处理
python
中
的
大型
数据
集
?
scikit-learn
、
sklearn-pandas
现在我有10 8GB
的
数据
集
来训练
sklearn
中
的
模型
,但我
的
计算机只有8 8GB
的
内存,所以除了增量分类器之外,我还有其他
的
方法。
浏览 21
提问于2019-06-10
得票数 1
1
回答
使用
sklearn
.linear_model.Ridge描述训练
数据
的
最佳方法线性病态问题?
python
、
machine-learning
、
scikit-learn
、
linear-regression
、
inverse
问题陈述:我正在
处理
一个线性方程组,它对应于一个不适定
的
逆问题。我可以在
Python
中
手工应用Tikhonov正则化或岭回归,并获得对我
的
问题足够精确
的
测试
数据
的
解决方案。我想尝试使用
sklearn
.linear_model.Ridge来解决这个问题,因为我想在这个包
的
线性
模型
部分()
中
尝试其他机器学习方法。我想知道在这种情况下使用
sklearn
是否使用了错误<e
浏览 2
提问于2021-03-28
得票数 1
回答已采纳
1
回答
如何
在自然语言
处理
中找到答案类型和questionType
nlp
是否有任何开放
的
api,它将为我提供以下答案类型 “我们应该去哪里喝咖啡?”这里
的
答案类型是位置。
浏览 0
提问于2016-05-11
得票数 0
3
回答
与熊猫和雪橇一起学习机器
的
大量功能。
machine-learning
、
scikit-learn
、
pandas
我对
数据
科学比较陌生,我正在
处理
一个
大型
数据
集
。它有很多行和大约270个特征后,删除了大量
的
nan值和编码
的
分类特征。当我使用
sklearn
进行逻辑回归时,我
的
计算机就会耗尽内存并崩溃。我
如何
处理
这样
的
大型
数据
集
?
浏览 0
提问于2021-09-20
得票数 1
1
回答
Py-table vs Blaze vs S-Frame
python-3.x
、
pandas
、
hdf5
、
pytables
、
blaze
我正在使用
python
对一个巨大
的
数据
集
(大约2000万条记录和10列)进行探索性
数据
分析。我将分割、聚合
数据
并创建一些可视化,我也可以使用该
数据
集
创建一些决策树线性回归
模型
。由于
数据
集
很大,我需要使用
数据
帧来存储核心外
的
数据
。因为我对
Python
比较陌生,并且使用
大型
数据
集
浏览 11
提问于2017-07-21
得票数 0
1
回答
Python
中
拟合
sklearn
.KNN
的
内存错误
python
、
machine-learning
、
scikit-learn
、
knn
我在Ubuntu,
Python
和
sklearn
中
安装了一个32 GB DDR4内存
的
模型
。 knn = KNeighborsClassifier(n_neighbors = 14) import
浏览 1
提问于2018-11-02
得票数 0
2
回答
在Keras
中
fit()和fit_generator()有什么区别?
deep-learning
、
keras
在Keras
中
,fit()和fit_generator()有什么区别? 我什么时候应该使用fit()和fit_generator()?
浏览 0
提问于2018-07-13
得票数 29
回答已采纳
2
回答
支持向量机问题-名称“model_SVC”未定义
machine-learning
、
scikit-learn
、
data-science
、
svm
、
svc
我对这个代码有一个问题: model_SVC = SVC() model_SVC.fit(X_scaled_df_train, y_train
浏览 11
提问于2022-08-22
得票数 2
2
回答
查找套索
模型
中使用
的
特征
python
、
machine-learning
、
scikit-learn
我使用
的
是
sklearn
的
糖尿病
数据
集
。from
sklearn
.datasets import load_diabetes diabetesX_test, y_train, y_test = train_test_split(diabetes['data'], diabetes['target'], random_st
浏览 17
提问于2021-11-08
得票数 0
回答已采纳
1
回答
分层列车-测试拆分一个Tensorflow
数据
集
python
、
tensorflow
、
keras
、
train-test-split
、
imbalanced-data
我目前正在
处理
一个相当大
的
图像
数据
集
,我使用
python
中
的
ImageDataGenerator从tensorflow.keras加载它。由于我
的
数据
分类非常不平衡,我想做一个分层
的
列车测试分割,以可能达到更高
的
精度。我知道
如何
使用ImageDataGenerator进行简单
的
随机列车测试分割,但我找不到与
sklearn
中
<em
浏览 2
提问于2022-03-07
得票数 3
2
回答
交叉验证、scikit-learn、并行较慢
python
、
pydev
、
scikit-learn
我正在学习
如何
使用scikit-learn。在测试时,如果使用以下命令打开并行计算得到
的
结果要比我用我在64位
的
Windows7机器上使用PyDev,Anacondas3.3。从任务管理器来看,性能影响似乎是由许多
Python
实例被启动和停止造成
的
。为什么他们不开始,而是一直开始呢?
浏览 9
提问于2013-10-18
得票数 2
2
回答
具有最小协方差
的
混合高斯
模型
(GMM)
python
拟合加权
数据
python
、
opencv
、
scikit-learn
、
cluster-analysis
、
expectation-maximization
我想使用
python
将高斯混合
模型
拟合到一组加权
数据
点。 我尝试了
sklearn
.mixture.GMM(),它工作得很好,只是它对所有
数据
点
的
权重都是一样
的
。有没有人知道在这种方法
中
给
数据
点分配权重
的
方法?我多次尝试使用
数据
点来“增加它们
的
权重”,但这对于
大型
数据
集
似乎无效。我也考虑过自己实现EM算法,但这似乎比上面的GMM方
浏览 4
提问于2016-04-05
得票数 2
1
回答
DBSCAN
处理
大
数据
崩溃和内存错误
python
、
scikit-learn
、
out-of-memory
、
cluster-analysis
、
dbscan
我正在对一个包含400K
数据
点
的
数据
集
执行DBSCAN。) File "/usr/local/
Python
/2.7.13/lib/
python
2.7/site-packages/
sklearn
/neighbors/base.py", line 621,我该
如何
解决这个问题呢?DBSCAN
处理
海量
数据</e
浏览 1
提问于2017-05-23
得票数 0
1
回答
如何
在
python
中
捕获特定警告而不引发错误
python
、
scikit-learn
、
convergence
我正在运行不同
的
数据
集
,以确定每个
数据
集
的
最佳建模算法。我循环遍历每个
数据
集
以检查各种算法,并根据测试分数选择最佳
模型
。我知道对于特定
的
模型
,我
的
一些
数据
集
不会收敛(即: LogisticRegression),并收到收敛警告(即:“lbfgs未能收敛(status=1):")。我不想忽视这个警告。我
的
目标是返回收敛<
浏览 17
提问于2021-03-04
得票数 0
回答已采纳
1
回答
scikit学习中分类器拟合前进行特征缩放
的
必要性
python
、
scikit-learn
、
classification
我曾经相信scikit-learn
的
分类器(以及)会在训练前自动标准化我
的
数据
。为了测试我
的
假设,我决定手动缩放X
的
特性如下:scaler = StandardScaler()我发现在X上训练
模型
并不等同于在X_std上训练
模型
浏览 2
提问于2016-05-26
得票数 4
2
回答
不平衡类
的
逻辑回归学习
python
、
scikit-learn
、
classification
我正在用
python
中
sklearn
的
逻辑回归解决一个分类问题。 我
的
问题是一般
的
/一般
的
。我有一个包含两个类/结果(正/负或1/0)
的
数据
集
,但该集非常不平衡。有~5%
的
阳性和~95%
的
阴性。我知道有许多方法可以
处理
这样
的
不平衡问题,但还没有找到一个很好
的
解释来说明
如何
浏览 1
提问于2013-02-14
得票数 21
3
回答
PySpark
中
的
特征选择
python
、
machine-learning
、
pyspark
、
feature-selection
、
google-cloud-dataproc
我正在研究一个形状1,456,354 X 53
的
机器学习
模型
。我想为我
的
数据
集
做特性选择。我知道
如何
使用以下代码在
python
中进行特性选择。from
sklearn
.feature_selection import RFECV,RFE rfe = RFE(logreg, steprfe.support_)result = f
浏览 0
提问于2018-11-28
得票数 8
回答已采纳
1
回答
我应该使用火车
数据
集
上
的
MinMaxScaler来转换测试
数据
集
,还是使用单独
的
MinMaxScaler来拟合和转换测试
数据
集
?
machine-learning
、
dataset
、
normalization
、
predict
、
data-processing
另外,我有两个
python
脚本,如下所示:from
sklearn
.preprocessing import MinMaxScaler scaler = MinMaxScaler(然而,在tr
浏览 4
提问于2020-07-01
得票数 0
回答已采纳
1
回答
scikit-学习支持向量机与大量样本/小批量可能?
scikit-learn
、
svm
据报道,我读到:有没有一种方法可以在SVM
中
内置或使用类似minibatches
的
东西?
浏览 1
提问于2016-11-22
得票数 6
1
回答
如何
始终如一地标准化科学学习
中
的
稀疏特征矩阵?
scikit-learn
、
sparse-matrix
我正在使用
sklearn
的
DictVectorizer来构造一个
大型
的
稀疏特征矩阵,该矩阵被输入到ElasticNet
模型
中
。当预测器(特征矩阵
中
的
列)居中和缩放时,弹性网络(和类似的线性
模型
)工作得最好。
的
目的是构建一个在回归器之前使用StandardScaler
的
Pipeline,但是这并不适用于稀疏特性,如中所述。我想在normalize=True中使用ElasticNet标记,它似乎支持稀疏
浏览 2
提问于2015-03-23
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python sklearn模型中random_state参数的意义
Python数据处理技巧:如何将数据列表中的空值补0
如何处理大型机械结构设计中的设计思路?
Python数据分析中的Numpy图像处理实操!
如何处理日志中的结构化数据?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券