腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
读取
Java
中的大数据集
、
、
我正在使用
Java
从读取和
处理
一些数据集。我开始为每个数据集创建一个类,并使用特定的类文件。数据集中的每个属性都由所需类型的类中的相应数据成员表示。这种方法工作得很好,直到没有。属性<10-15。问题:我现在必须
处理
很多大型数据集。以这种方式
处理
具有>20-30属性的对象是非常乏味的。我不需要查询。我的数据
离散
化
算法只需要对数据进行4次扫描即可
离散
化
。我的工作在
离散
化
之后立即结束。
浏览 0
提问于2012-05-08
得票数 0
回答已采纳
1
回答
在Weka中,我如何阻止CfsSubsetEval对训练实例进行
离散
化
?
、
、
我正在尝试编写一个
java
程序,它在Weka中调用CfsSubsetEval类来执行特性子集选择。CfsSubsetEval对数据集进行
离散
化
,我试图避免这种情况,因为数据集已经被
离散
化了。下面是执行
离散
化
的CfsSubsetEval.
java
中的行。m_trainInstances, m_disTransform);由于class属性是在arff文件中定义的,如下所示:该属性不是数字属性,因此将执行<
浏览 3
提问于2014-11-02
得票数 0
回答已采纳
1
回答
如何使用
Java
离散
化
SVG路径?
、
在
Java
语言中,如何读取SVG路径的d属性,并对其进行
离散
化
,以便将所有的贝塞尔曲线适当地细分为
离散
点,从而允许我指定一个阈值来说明尖锐的角度?经过大量的搜索,我找到的唯一解决方案是使用Apache Batik以较短的间隔遍历路径,并统一采样点,但这会沿着直线生成一堆不必要的点,并且不能
处理
锐角的情况。
浏览 0
提问于2015-04-18
得票数 1
1
回答
fayad和伊拉尼
离散
化
的实现
、
有没有
java
代码来实现法亚德和伊拉尼基于熵的
离散
化
?我已经尝试读取文件,然后计算熵和信息增益。如何获得bounday积分?我必须实现法亚德和伊拉尼的
离散
化
算法,它是基于熵和信息增益的(法亚德和伊拉尼,1993
浏览 3
提问于2014-10-16
得票数 0
4
回答
基于matplotlib的
离散
值直方图
、
有时,我不得不用matplotlib直方图
离散
值。在这种情况下,选择二进制可能是至关重要的:如果您使用10桶直方图0、1、2、3、4、5、6、7、8、9、10,那么其中一个回收箱的数量将是其他的两倍。在其他术语中,绑定大小通常应该是
离散
化
大小的倍数。虽然这个简单的例子比较容易自己
处理
,但是是否有一个指向库/函数的指针可以自动
处理
这个问题,包括浮点数据,其中
离散
化
的大小可能由于FP四舍五入而略有变化? 谢谢。
浏览 1
提问于2015-05-07
得票数 29
回答已采纳
2
回答
Scikit Learn - Random Forest:如何
处理
连续特征?
、
、
通常,具有文本数据的特征被转换为数字类别,并且连续的数字数据被原样馈送,而不进行
离散
化
。它会在内部对连续的数字数据进行绑定吗?或者将每个数据视为
离散
级别。RF如何
处理
连续数据?在进料之前
离散
化
连续数据(在本例中为经度和纬度)是否可取?或者这样做会丢失信息?
浏览 1
提问于2015-09-20
得票数 2
1
回答
归一
化
音频信号
、
、
、
、
我希望使用可靠地将录制的音频(通过麦克风)和
处理
过的音频(WAV文件)转换为相同的
离散
表示形式。 用F
浏览 3
提问于2013-09-15
得票数 4
回答已采纳
1
回答
与Orange python库的交叉验证
、
、
、
我想用(1)数值属性
离散
化
和(2)特征选择的交叉验证来验证模型。在研究了Orange之后,我编写了以下脚本。-15s %5.3f %5.2f" % (learners[i].name, orngStat.CA(results)[i],
浏览 6
提问于2016-12-07
得票数 1
1
回答
什么时候申请双关?
我读过很多关于
离散
化
技术、测量WoE和IV等的文章,但是基本的问题--什么时候值得使用二进制和什么时候不值得--还不完全清楚。一方面,对我来说,
离散
化
的结果似乎相当“漂亮”,更容易
处理
,但另一方面,人们总是强调,绑定总是会导致信息丢失。你能提供一些线索,什么时候应该使用这种技术?
浏览 0
提问于2016-09-27
得票数 0
2
回答
将pandas间隔转换为字符串(然后再转换回来)
、
、
、
、
由于各种原因,我们希望数据是
离散
的,因此有一些连续变量需要
离散
化
。我在pandas中发现了qcut,它似乎可以做我想做的事情--我可以设置一些存储箱,它会将变量
离散
到那么多的存储箱中,试图保持每个存储箱中的计数相等。因为分类器是在
离散
化
的数据上训练的,所以新的测试实例在可以使用之前需要
离散
化
。因此,我希望能够做的是读入一个新实例,对其应用已经建立的
离散
化
方案,将其转换为字符串,并在随机森林中运行它。然而,我被“应用<
浏览 136
提问于2019-08-26
得票数 10
回答已采纳
2
回答
函数近似:平铺编码与高度
离散
的状态空间有何不同?
、
、
、
我从连续状态空间的
离散
化
过渡到函数近似。我的动作和状态空间(3D)都是连续的。我的问题主要是由于混叠错误和长期训练后几乎没有收敛。另外,我不知道如何选择合适的步长进行
离散
化
。1)与高度
离散
的状态空间相比,性能有何不同?对于RL中的连续问题,似乎没有任何详尽的Python编码教程。
浏览 3
提问于2016-05-04
得票数 8
回答已采纳
2
回答
Weka:属性选择过程中的监督
离散
化
问题和错误“训练实例不足”
、
、
、
、
我正在做的是写一个程序,它将过滤一组特定的数据,并最终为它构建一个贝叶斯网络,一周前,我已经完成了我的
离散
化
类和属性选择类。就在几天前,我意识到我需要将我的
离散
化
函数更改为supervised,并最终使用了默认的Fayyad &伊朗方法,在我这样做之后,我开始在我的属性选择类中得到这个错误:at Runner.main(Runner.
java
:70) 我在更改之前选择的属性运行得很好,所以我认为我可能在
离散
类中做错了什么。我这个问
浏览 1
提问于2012-10-22
得票数 3
1
回答
存储2D游戏地图的最佳方法
、
我正在用
Java
实现轰炸机克隆。它的地图标度为17*13瓦片。现在我将游戏地图存储在ArrayList中。显然,这是无效的,因为游戏机制只提供
离散
的移动(右,左,上,下)。炸弹也只能有
离散
的位置。因此,在使用ArrayList时,我必须在
处理
冲突或火灾生成时,通过整个列表查找四个相邻的瓷砖。那么在
Java
中存储这些映射的最佳实践是什么呢?
浏览 2
提问于2017-10-20
得票数 0
回答已采纳
2
回答
如何对连续数据进行分类?
、
如何对值进行
离散
化
/归类?我不是在寻找聚类算法,我特别感兴趣的是获得“有意义的”
离散
类别,我可以随后在贝叶斯分类器中使用。论文,书籍,在线课程的指针,都非常感谢!
浏览 0
提问于2012-05-08
得票数 1
1
回答
WEKA训练用例和测试用例不匹配
、
、
、
我需要通过训练样本来学习分类器,并对测试样本进行分类。我的例子是很长的文本。我想使用一个特征集,其中第i个元素是第i个最频繁的单词,例如,第一个特征是最频繁的单词。你有解决方案吗? 我希望能够使用每个文本中最频繁的50个单词的特征集,并且训练示例的arff不应该受到测试示例的影响。此外,我希望能够使用多种分类器(如smo、朴素贝叶斯、j4
浏览 3
提问于2013-08-12
得票数 0
1
回答
什么是朴素的贝叶斯属性: useKernelEstimator和useSupervisedDiscretization
、
、
、
、
我在Weka数据挖掘工具中使用朴素贝叶斯作为学习算法。朴素贝叶斯中有一些参数选项,如'useKernelEstimator‘和'useSupervisedDiscretization’。有人能告诉我这两个参数是什么吗?
浏览 4
提问于2015-11-23
得票数 0
回答已采纳
1
回答
GAM (mgcv封装)预测的重现性
、
、
、
、
我使用在bam() R包中使用mgcv函数建立的广义加性模型来预测二进制响应的概率。该模型是使用如下公式建立的: data=data, select=TRUE,
浏览 6
提问于2021-10-04
得票数 0
回答已采纳
2
回答
强化学习:为连续动作和连续状态空间选择
离散
化
步骤和性能指标的困境
、
、
然而,这两个流行的例子都有非常少的可能的
离散
操作。我有三个问题: 1)如果您没有少量的
离散
操作,那么
处理
此类问题的正确方式是什么?为操作A选择
离散
化
步骤也会影响我对状态变量Y
离散
化
的精细程度。我如何选择
离散
化
步骤?非常感谢!
浏览 0
提问于2016-04-07
得票数 1
1
回答
测试数据集的
离散
化
、
我使用BayesNet算法,因此需要对数据集中的数值进行
离散
化
。我读到,在
离散
化
测试数据集时,我需要使用训练数据集作为输入格式,以便
离散
化
的训练数据集和测试数据集是兼容的()。这是我的测试数据集
离散
化
代码: int[] discIndices = {0,2,5,6例如,我有一个数值属性,当我
离散
化
浏览 5
提问于2017-10-25
得票数 0
1
回答
Drake中的
离散
化
、
因此,我正在做一个零阶保持积分技术来进行
离散
化
。在中,有一个描述
离散
动力学的显式表达式。 我该如何看待来自Drake的线性
化
系统的显式形式?我想知道A、B和C矩阵,以便明确地写出我的
离散
时间动力学。另外,Drake中有没有实现
离散
化
的技术?
浏览 17
提问于2020-05-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习第四篇之离散值处理
Java 异常处理
Java 时间处理
机器学习模型为什么要将特征离散化?
Java:使用Java线程的并行处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券