首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

开源的数据挖掘工具

开源数据挖掘工具的演进过程 从上世纪八十年代起就出现了早期的模型推断和机器学习程序,它们一般都是以命令行的方式执行(从UNIX或DOS的命令行启动),用户在命令中指定输入数据文件名和算法相关参数。...这些程序大多被用在医疗领域,比如癌症的诊断和预测。 这些程序一般并不包括数据抽样等处理功能,用户通常是使用一些脚本语言(例如Perl)来做这些事情。...当然,图形化的界面更容易使用,但使用脚本语言来开发新算法则可以满足一些特定分析需求。...如果缺乏编程技能,也可使用图形界面,比如使用R Commander(http://socserv.mcmaster.ca/jfox/Misc/Rcmdr/)或Rattle(http://rattle.togaware.com...Orange的好处是使用更简单一些,但缺点是控制能力要比KNIME弱。

1.6K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    60款顶级大数据开源工具汇总

    这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由Apache基金会管理,与Hadoop密切相关。 请注意:本文没有做什么排名;相反,项目按类别加以介绍。...它最初是由谷歌开发的,但现在也被本文介绍的另外几个大数据工具所使用,包括CouchDB、MongoDB和Riak。 支持的操作系统:与操作系统无关。...SpagoBI Spago被市场分析师们称为“开源领袖”,它提供商业智能、中间件和质量保证软件,另外还提供Java EE应用程序开发框架。...Rattle Rattle的全称是“易学易用的R分析工具”。它为R编程语言提供了一种图形化界面,简化了这些过程:构建数据的统计或可视化摘要、构建模型以及执行数据转换。...相关链接: http://rattle.togaware.com 49. SPMF SPMF现在包括93种算法,可用于顺序模式挖掘、关联规则挖掘、项集挖掘、顺序规则挖掘和集群。

    3.6K00

    干货|大数据人推荐:60款顶级大数据开源工具

    这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由Apache基金会管理,与Hadoop密切相关。 请注意:本文不是要搞什么排名;相反,项目按类别加以介绍。...它最初是由谷歌开发的,但现在也被本文介绍的另外几个大数据工具所使用,包括CouchDB、MongoDB和Riak。 支持的操作系统:与操作系统无关。...SpagoBI Spago被市场分析师们称为“开源领袖”,它提供商业智能、中间件和质量保证软件,另外还提供Java EE应用程序开发框架。...Rattle Rattle的全称是“易学易用的R分析工具”。它为R编程语言提供了一种图形化界面,简化了这些过程:构建数据的统计或可视化摘要、构建模型以及执行数据转换。...相关链接:http://rattle.togaware.com 49. SPMF SPMF现在包括93种算法,可用于顺序模式挖掘、关联规则挖掘、项集挖掘、顺序规则挖掘和集群。

    1.1K90

    【开源工具】60款顶级大数据开源工具!总有一款适合你~

    这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由Apache基金会管理,与Hadoop密切相关。 请注意:本文不是要搞什么排名;相反,项目按类别加以介绍。...它最初是由谷歌开发的,但现在也被本文介绍的另外几个大数据工具所使用,包括CouchDB、MongoDB和Riak。 支持的操作系统:与操作系统无关。...相关链接:http://community.pentaho.com SpagoBI Spago被市场分析师们称为“开源领袖”,它提供商业智能、中间件和质量保证软件,另外还提供Java EE应用程序开发框架...相关链接:https://rapidminer.com Rattle Rattle的全称是“易学易用的R分析工具”。...相关链接:http://rattle.togaware.com SPMF SPMF现在包括93种算法,可用于顺序模式挖掘、关联规则挖掘、项集挖掘、顺序规则挖掘和集群。

    902100

    《Spring实战》读书笔记-第3章 高级装配

    本章中所介绍的技术也许你不会天天都用到,但这并不意味着它们的价值会因此而降低。 3.1 环境与profile 在开发软件的时候,有一个很大的挑战就是将应用程序从一个环境迁移到另外一个环境。...如果设置了spring.profiles.active属性的话,那么它的值就会用来确定哪个profile是激活的,但如果没有设置spring.profiles.active属性的话,那Spring将会查找...如果给定条件为true,则创建这个bean,反之,不创建。...: 'Rattle and Hum' } ’ // 如果disc.title的值为空,返回'Rattle and Hum' 11....尽管将某个bean设置为首选bean是很简单的,但这种方式也有其局限性,所以我们讨论了如何将一组可选的自动装配bean,借助限定符将其范围缩小到只有一个符合条件的bean。

    67430

    分子动力学模拟算法框架

    技术背景 分子动力学模拟在新材料和医药行业有非常重要的应用,这得益于分子动力学模拟本身的直观表述,用宏观的牛顿力学,结合部分微观的量子力学效应,就能够得到很好的符合统计力学推断的结果。...原子本身收到的作用力大小;2. 原子的质量;3. 在控温控压,有可能受到系统粘滞作用力的影响或者碰撞影响,也有可能被缩放;4....对于加了约束条件的过程,还会受到施加的约束作用,比如等效的键向作用力(施加约束的过程,本身就是为了控制部分原子之间相对位置大小)。...而这里提到的约束条件,相对的就更加具体,常见的比如LINCS算法、SETTLE算法、RATTLE算法和SHAKE等,其基本思想就是固定某两个原子之间的距离保持不变。...除了存储完整的坐标轨迹之外,还需要存储一些必要的参数,比如单步的速度等,这样即使程序终止,下一次启动程序的时候也可以从断点开始,而不需要重新开始。

    98320

    R语言数据可视化综合指南

    虽然有专门的工具,如Tableau, QlikView 和 d3.js,但没有任何东西能代替有很好可视化能力的建模/统计工具。尤其是它有助于做若干探索性数据分析和特征化工程。...数据可视化简史 从历史来看,数据可视化的进化已经被著名的从业者在工作中完成了。威廉.普莱菲(William Playfair)是统计图形化方法的创始人。...,main="Greys 8 colors") hist(VADeaths,col=brewer.pal(8,"Greens"),main="Greens 8 colors") 请注意,如果间隔数少于被指定的颜色数..., parallel=FALSE, bg="black", axis.scales=TRUE, grid=TRUE, ellipsoid=FALSE) 您还可以使用Lattice包来做3维图。...RCcommander和KMggplot及Rattle用于数据挖掘,Deducer用于数据可视化。这些有助于自动完成多个工作。

    2.6K60

    关于审计技术和工具 101事

    审计类型:取决于项目的范围/性质/地位,但一般分为以下几类: 全新审计:针对正在启动的新项目 重复审计:针对正在修订的现有项目的新版本,有新的/固定的功能 修复审计:审查对当前/以前的审计结果的修复。...真阳性结果有时可能被归类为假阳性结果,从而导致漏洞被利用而不是被修复。 假阴性:是指遗漏的发现,这些发现本应表明漏洞的存在,但事实上根本就没有报告。...Rattle[64]是一个 EVM 二进制静态分析框架,设计用于部署的智能合约(不再活跃开发)。...分析这些工具的输出需要对工具本身、其特定领域的语言,有时甚至是其内部工作原理有大量的专业知识。...如果有任何资金损失或锁定,那么其影响被评估为高。不影响资金但扰乱系统正常运作的漏洞通常被评估为中等。其他的都是低影响。

    1K10

    【学习】用R语言进行数据可视化的综合指南

    虽然有专门的工具,如Tableau, QlikView 和 d3.js,但没有任何东西能代替有很好可视化能力的建模/统计工具。尤其是它有助于做若干探索性数据分析和特征化工程。...数据可视化简史 从历史来看,数据可视化的进化已经被著名的从业者在工作中完成了。威廉.普莱菲(William Playfair)是统计图形化方法的创始人。...main="Greys 8 colors") hist(VADeaths,col=brewer.pal(8,"Greens"),main="Greens 8 colors") 请注意,如果间隔数少于被指定的颜色数..., parallel=FALSE, bg="black", axis.scales=TRUE, grid=TRUE, ellipsoid=FALSE) 您还可以使用Lattice包来做3维图。...RCcommander和KMggplot及Rattle用于数据挖掘,Deducer用于数据可视化。这些有助于自动完成多个工作。

    3.2K40

    【深度学习】翻译:60分钟入门PyTorch(二)——Autograd自动求导

    背景介绍 神经网络(NNs)是作用在输入数据上的一系列嵌套函数的集合,这些函数由权重和误差来定义,被存储在PyTorch中的tensors中。...我们需要在Q.backward()中显式传递gradient,gradient是一个与Q相同形状的张量,它表示Q w.r.t本身的梯度,即 同样,我们也可以将Q聚合为一个标量并隐式向后调用,如Q.sum...在前向传播中,autograd同时完成两件事情: 运行所请求的操作来计算结果tensor 保持DAG中操作的梯度 在反向传播中,当在DAG根节点上调用.backward()时,反向传播启动,autograd...from torch import nn, optim model = torchvision.models.resnet18(pretrained=True) # 冻结网络中所有的参数 for param...# 只优化分类器 optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9) 注意,尽管我们注册了优化器中所有参数,但唯一参与梯度计算

    1.5K10

    如何正确地在Android手机上安装国产软件?

    国产app的全家桶问题一直被大家诟病,一个应用启动后就会“唤醒”其“家族”内的其他应用,有时还会通过其他方式确保应用始终在后台运行;与此同时,很多应用还会申请与之功能完全不符的权限,这些严重破坏了Android...要获得一个纯净的体验,我们需要解决的是两种问题,首先是软件自启动、驻足后台、频繁唤醒;其次是应用对手机信息的读取。 对应这两个问题,我们要寻找各种解决方案,而手机本身的环境也是我们需要考虑的因素。...要想收音机不会因此启动,有两个办法,要么屏蔽这个节点,使你无论是否插入耳机线,都不产生这个节点的信号,要么我们冻结收音机程序,让他感受不到这个节点。...不过它提供了非常方便的launcher,让你能够快速地启动冻结app。 保护隐私方面,对于已经Root的手机,可以使用AppOps应用控制应用权限。...对于TouchWiz系统,我们可以利用KNOX Standard SDK的机制冻结应用(包括系统应用),常见的利用这一机制的软件包括“空调狗”、“冻住”,它们都可以做到应用使用后立即冻结,从根源拒绝“关联启动

    3.8K70

    DAY74:阅读Runtime

    前者你知道如果父kernel和子kernel是相对的概念, 父kernel可以等待自己的子kernel而被交换到显存冻结,子kernel又可能又自己的子kernel, 做为自己的子kernel的父kernel..., 它在等待的时候也可能被冻结到显存,这样一层一层的冻结, 每层都需要一定的显存容量空间.所以存在一个同步层次(或者说深度)的概念, 需要在进行的同步越深, 则需要提前保留出来的显存容量越大(很好理解吧...然后本章节的后一部分, 还有一个pending launch count, 也就是等待启动中的最大子kernel数量限制和资源占用问题.动态并行本身会维持一个需要被动态启动的子kernel列表的,这个列表本身也占用空间...的时候, 才能总是假定kernel此时方能执行, 以及, 必须此时假定父kernel一定可能会被冻结1个或者多个或者全部blocks.但实际上的情况可能要比这宽泛, 例如父kernel的blocks和线程规模很小...(虽然根据目前的NV的暗示, 将来会引入动态的kernel任务切换,一个kernel的blocks可能再GPU被反复的调度进来SM, 调度出去的,但用户现在不应当假设这点),论坛上的用户代码的BUG都是用户写的太随意造成的

    42710
    领券