首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

weka manual 3.6 翻译:1.1 引言

你应该给java虚拟机增加堆的最大容量来避免内存错误,一般是通过 -Xmx1024M 或者 -Xmx1024m 分配1GB的空间,默认的64MB太小了。...如果你遇到了“找不到指定类”的错误,检查你的CLASSPATH目录下面有没有存放weka.jar。你也可以使用 -cp 命令来显式指定 CLASSPATH 目录。...我们会从基础的概念和思想讲起,然后是 weka.filters 包,它用来转换输入数据,例如预处理、转化、特征聚集以及其他。 接着,我们会关注机器学习的算法本身,他们在weka中叫做分类器。...我们会限制在所有分类器的通用设置上,并稍微讲解一下机器学习中所有主要方法的典型方法。 再接着,会提供一些实践性的例子。 最后,在weka的文档目录中,你可以找到所有weka中的java类。...它们可以在 weka-src.jar 中找到,并且可以在jdk提供的jar工具里查看(或者任何可以解压缩zip格式文件程序都行)。

28630

基于机器学习的Hello World程序

你必须通过反复试验才能发现它。这也意味着你会犯一些错误。 在这篇文章中,你会发现一个简单的技巧,让你应用在刚开始的机器学习上。...你不要想着找到最好的算法,没有最好的机器学习算法,如果对所有问题使用同一种算法或一类算法,则会严重的限制你可以实现的结果。...同样,在你运行完你的第一个算法之后,你也会惊奇地发现,这是多么的微不足道,而你还有更多的东西需要你做。 很简单的流程: 选择一个工具。如果你不是程序员,我推荐Weka,因为它提供了一个图形用户界面。...如果你使用Weka,你可以按照这个方法。当然,我也有使用R和scikit-learn的方法。 运行这个方法。 查看结果。 根据你运行结果的准确性,思考这意味着什么。...事实上,正因为这么简单,你更应该这么做,这让你在所有主流的机器学习工具和库中,都能轻松地处理简单的问题。 除了选择最喜欢的算法之外,另一个问题是选择一个最喜欢的工具或库。

78460
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    做股票数据挖掘的一些日志

    于是我们先找了老师问,各种找,找了各种老师,得到了各种资料,什么挖文本的,挖银行的,挖教育的,就差没挖坟了。...其实最重要的原因是大家都觉得这样没基础的团队是申请不到钱的,特别是团队成员绩点又很低的情况下(其实就是指在下的2.0,其他人都是3.3以上)。...于是我上网去找决策树算法,发现网上的人很多程序都不好,写的很不完整。...百度一下,了解KDJ的内在涵义以后,我们可以很快把K值可以划分成0-10,10-90,90-100,三类,D值划分成0-20,10-80,80-100,三类,J值可以划分成小于10,10-100,100...以上,三类,然后二元化,就是9个二元属性,这样预处理就完了。

    2K50

    《解锁Weka:数据挖掘实战的得力助手》

    通过Weka的实验环境(Experimenter),对比不同算法在训练集和测试集上的表现,最终发现决策树算法在该数据集上具有较高的准确率和可解释性。...二、Weka在电商用户行为分析中的应用一家电商企业为了提升用户体验和精准营销效果,借助Weka分析用户的浏览、购买行为数据。他们将用户的历史浏览记录、购买商品种类、购买频率等数据导入Weka。...通过关联规则挖掘算法,如Apriori算法,发现用户购买行为之间的潜在关联。...例如,发现购买笔记本电脑的用户往往也会购买电脑包和鼠标,基于此,电商平台可以在用户浏览笔记本电脑时,精准推荐相关配件,提高用户购买转化率。...同时,利用聚类算法对用户进行分类,将具有相似行为模式的用户归为一类。

    6900

    Weka机器学习使用介绍(数据+算法+实战)

    Weka机器学习使用介绍(数据+算法+实战) Weka是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis)的英文字首缩写,新西兰怀卡托大学用Java...QQ浏览器截图20210111165154.png 一、 Weka介绍 下载链接:https://waikato.github.io/weka-wiki/downloading_weka/,里面有windows...Weka的主页面窗口有四个模块: Explorer:进行数据的特征选择、分类、回归、聚类、关联规则、数据可视化等功能,口语进行不同的实验对比不同算法的结果。...该模块有6个选项卡,用来选择不同的功能面板,从左到右依次是Preprocess(预处理)、Classify(分类)、Cluster(聚类)、Associate(关联规则)、Select attribute...Confusion Matrix给出了测试样本的分类情况,通过它,可以很方便地看出正确分类或错误分类的某一类样本的数量。 我们采用常用的J48决策树分类器进行4折交叉验证,得到的实验结果如下: ?

    13.8K43

    盘点:为 Java 开发者量身定制的五款机器学习库

    █ Weka http://www.cs.waikato.ac.nz/ml/weka/index.html ? 毫无疑问,Weka 是目前首选的 Java 机器学习库。...但同时它也支持数据预处理、聚类、关联规则挖掘、时间序列预测、特征选择、和异常检测等场景。”...其内部实现的机器学习算法包括:分类、回归、聚类、孤立点检测、概念漂移检测和推荐系统等。此外,MOA 还提供了多种评估工具,以及活跃的社区讨论、博客等配套资源。...主要应用于统计自然语言处理,文档分类,聚类,主题建模,信息提取等文本类分析场景。 MALLET 内部实现了许多功能强大的工具,包括用于文档分类的高级工具,用于序列标记的工具,和用于主题建模的工具等。...KDD-Applications Supported by Index-Structures,即由索引结构支持的 KDD 应用开发环境,这里 KDD 是指 Knowledge Discovery in Database,即知识发现

    1.2K140

    为 Java 开发者量身定制的五款机器学习库

    Weka 地址:http://www.cs.waikato.ac.nz/ml/weka/index.html ? 毫无疑问,Weka 是目前首选的 Java 机器学习库。...但同时它也支持数据预处理、聚类、关联规则挖掘、时间序列预测、特征选择、和异常检测等场景。”...其内部实现的机器学习算法包括:分类、回归、聚类、孤立点检测、概念漂移检测和推荐系统等。此外,MOA 还提供了多种评估工具,以及活跃的社区讨论、博客等配套资源。...主要应用于统计自然语言处理,文档分类,聚类,主题建模,信息提取等文本类分析场景。 MALLET 内部实现了许多功能强大的工具,包括用于文档分类的高级工具,用于序列标记的工具,和用于主题建模的工具等。...KDD-Applications Supported by Index-Structures,即由索引结构支持的 KDD 应用开发环境,这里 KDD 是指 Knowledge Discovery in Database,即知识发现

    1.2K110

    Weka中BP神经网络的实践(参数调整以及结果分析)

    实践部分讲稿正文: Weka是什么? Weka是由新西兰怀卡托大学用Java开发的数据挖掘常用软件,Weka是怀卡托智能分析系统的缩写。...Weka中BP神经网络的实践: Weka中的神经网络使用多层多层感知器实现BP神经网络。...注意的是这个错误值(error value或者误差值吧)是基于网络的计算值的变化的 一旦网络训练完毕它会再次停止并且等待结果是否被接受还是继续训练 注意的是如果没有设置GUI,这个网络将不需要任何的交互...注意的是如果这个网络偏离了并且没有被允许去reset其将在训练的步骤失败并且返回一个错误信息 seed Seed用于初始化随机数的生成。...、训练集 三类分别为:setosa, versicolor, virginica 数据包含4个独立的属性,这些属性变量测量植物的花朵,比如萼片和花瓣的长度等.”

    4.3K80

    Weka机器学习平台的迷你课程

    如果数据集的类数相等,则会预测第一个类别的值。 在糖尿病数据集中,这导致65%的分类准确性。(diabetes:糖尿病) 对于回归问题,ZeroR算法将始终预测平均输出值。...第9课:分类算法之旅 Weka提供了大量的分类算法。 在本课中,您将会发现可以在分类问题上使用的5种最重要的分类算法。 打开Weka GUI Chooser,然后打开Weka Explorer。...在本课中,您将发现可以用于回归问题的5个最佳的回归算法。 您可以从Weka数据集下载一套标准回归机器学习数据集。...使用您的时间去熟悉Weka的集成算法是值得的。在本课中,您将发现您可以使用的5种顶级集成机器学习算法。 打开Weka GUI Chooser,然后打开Weka Explorer。...机器学习的Weka迷你课程的回顾 恭喜你,你做到了。做得好! 花点时间回头看看你到底走了多远 尽管可能是第一次,但您已经发现了如何启动和使用Weka Explorer和Weka实验环境。

    5.6K60

    数据科学家成长指南(下)

    哪怕同一类,如时间日期,也会因为时区的不同而有差异。 对数据格式的了解有助于后续工作的开展。 Data Discovery 数据发现 这是一个挺大的问题,我也不清楚作者的真实含义,姑妄言之。...Discovery即是发现,也是探索。 从小细节看,是针对数据进行探索性研究,观察各变量的分布、范围。观察数据集的大小。主要目的是了解数据的细节。...错误数据,如果数据系统不健全,会伴随很多错误数据,例如日期格式不统一,存在1970错误,中文乱码,表情字符等等。思路最好是从错误根源上解决。...常用的降维方法有主成分分析法(PCA)和线性判别分析(LDA)。 当然暴力些也能直接选择全部变量,扔进RF或者XGBoost模型中跑一个晚上,直接根据Gini指数查看重要性。...Weka, Knime, RapidMiner Weka是一款免费的,基于JAVA环境下开源的机器学习以及数据挖掘软件。 KNIME是基于Eclipse环境的开源商业智能工具。

    74320

    数据挖掘系列(4)使用weka做关联规则挖掘

    weka数据集格式arff arff标准数据集简介   weka的数据文件后缀为arff(Attribute-Relation File Format,即属性关系文件格式),arff文件分为注释、关系名...、属性名、数据域几大部分,注释用百分号开头%,关系名用@relation申明,属性用@attribute什么,数据域用@data开头,看这个示例数据集(安装weka后,可在weka的安装目录/data下找到...car 如果设为真,则会挖掘类关联规则而不是全局关联规则。2. classindex 类属性索引。如果设置为-1,最后的属性被当做类属性。3....可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。...numRules 要发现的规则数。8. outputItemSets 如果设置为真,会在结果中输出项集。9.

    2.9K60

    ML Mastery 博客文章翻译(二)20220116 更新

    玻璃识别数据集的不平衡多类分类 多类不平衡分类 每个不平衡分类度量的朴素分类器是什么?...教程 Weka 机器学习迷你课程 使用 Weka 加快应用机器学习的进度 如何在 Weka 中更好地理解你的机器学习数据 我开始机器学习时犯的最大错误,以及如何避免 如何在 Weka 中逐步完成二分类项目...如何获得更多 Weka 机器学习工作台的帮助 如何使用 Weka 处理机器学习数据中的缺失值 如何在 Weka 中运行你的第一个分类器 如何在 Weka 中调整机器学习算法 在 Weka 中为更好的预测使用提升...、装袋和混合集成 如何在 Weka 中加载 CSV 机器学习数据 使用关联规则学习的菜篮子分析 如何在 Weka 完成多类分类项目 如何在 Weka 中规范和标准化你的机器学习数据 如何在 Weka 中用机器学习数据执行特征选择...Weka 机器学习工作台之旅 如何在 Weka 中转换你的机器学习数据 如何在 Weka 中调整机器学习算法 如何在 Weka 中使用分类机器学习算法 如何在 Weka 中使用集成机器学习算法 如何在

    4.4K30

    深度|DT时代的核心竞争力---数据分析与挖掘

    比如某电商平台的数据挖掘应用,可定义一下数据挖掘目标: (1) 分析挖掘用户数据,建立用户画像与物品画像等 (2) 基于用户画像实现动态商品智能推荐,帮助用户快速发现自己感兴趣的商 品,同时确保给用户推荐的也是企业所期望的...建立模型是一个螺旋上升,不断优化的过程,在每一次聚类结束后,需要判断聚类结果在业务上是否有意义,其各群特征是否明显。如果结果不理想,则需要调整聚类模型,对模型进行优化,称之为聚类优化。...聚类优化可通过调整聚类个数及调整聚类变量输入来实现,也可以通过多次运行,选择满意的结果。...通常可以依据以下原则判断聚类结果是否理想:类间特征差异是否明显;群内特征是否相似;聚类结果是否易于管理及是否具有业务指导意义。...WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

    1.2K40

    开源的数据挖掘工具

    在这个方面,Weka(它几乎是开源数据挖掘软件的代表)就提供了文档全面的Java函数和类库,非常适合扩展。当然,您首先需要充分了解Weka的架构,并掌握Java编程技术。...discriminant analysis等等; 模型评估和评分工具,包括对结果的图形化展示(比如ROC曲线和lift图); 推断模型的可视化功能(例如用树状结构来显示训练好的决策树,用气泡图来显示聚类,...同时,Weka也为普通用户提供了图形化界面,称为Weka KnowledgeFlow Environment和Weka Explorer。...该项目的另一个特色是能够很好的支持中文文本的分类、聚类等操作。...;KNIME和Orange看起来都不错,Orange界面看上去很清爽,但我发现它不支持中文。

    1.6K30

    【玩转 GPU】GPU加速的AI开发实践

    HK-WEKA的设计是为了尽可能实现最低的延迟和最高的性能。HK-WEKA的小型4K块大小与NVMe SSD介质块大小相匹配,以实现最佳性能和效率。...HK-WEKA将元数据处理和直接数据访问均匀地分布在所有存储服务器上(没有后端网络),进一步降低了延迟,提高了性能。更重要的是,HK-WEKA设计了低延迟的性能优化的网络。...用于AI的HK-WEKA数据平台包括无缝扩展其命名空间到对象存储和从对象存储扩展的能力。所有数据都位于一个HK-WEKA命名空间中,所有元数据都位于闪存层上,以便快速、轻松地访问和管理。...Riva 文本转语音或语音合成技能可生成类人语音。...提供的 Tensor Core 计算单元之上,深势科技跨尺度建模的计算效率得到稳定保障,能够高效准确地对微观尺度下物质结构与性能进行计算模拟,打造性能优越的微尺度工业设计平台,加速新药研发与新材料发现

    1.1K00

    数据报告分享|WEKA贝叶斯网络挖掘学校在校人数影响因素数据分类模型

    WEKA 使用流程 WEKA使学习应用机器学习方便,高效和乐趣。这是一个GUI工具,它允许您加载数据集,运行算法设计及运行试验与统计结果。 1. 进入软件 启动Weka的。...这可能涉及发现它在程序启动或双击该文件weka.jar。这将启动GUI的Weka选配。...它还提供了其他的功能,如数据过滤,聚类,关联规则提取和可视化,但现在我们不会使用这些功能的。 点击“打开文件...”按钮,打开“数据”目录中的数据集并双击。...WEKA提供了一些常见的小机器学习数据集,你可以用它来练习上。 ---- 01 02 03 04 3....这是用于运行针对Weka的一个装载数据集的算法的区域。 点击“开始”按钮,运行该算法。 数据 本次分析的数据来自广东省统计年鉴的各级各类学校在校学生数数据。

    20820

    【大数据】数据挖掘工具:发现数据中的宝藏

    **数据挖掘的概念:** 数据挖掘是一项从大量数据中自动发现模式、趋势和隐藏信息的过程。它的核心任务包括分类、聚类、关联规则挖掘、异常检测和预测。数据挖掘工具通过算法和技术来实现这些任务。...以下是一些常见的数据挖掘工具: - **Weka:** Weka是一款开源的数据挖掘工具,提供了广泛的机器学习算法和数据预处理工具。...- **医疗保健:** 数据挖掘可用于疾病预测、药物发现和患者护理。 - **金融服务:** 银行和金融机构使用数据挖掘来进行欺诈检测、信用评分和投资策略。...kmeans.fit(data) # 输出聚类结果 print(kmeans.labels_) ``` 这个示例代码演示了如何使用Python进行K均值聚类,其中K均值是一种常用的聚类算法,用于将数据分为不同的簇...**结论:** 数据挖掘工具已经成为发现和分析数据中隐藏信息的关键工具。理解数据挖掘的核心概念和使用方法对于解决复杂的数据问题和提取有用信息至关重要。

    30610
    领券