前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >微软发布开源跨平台机器学习框架ML.NET 0.2版本

微软发布开源跨平台机器学习框架ML.NET 0.2版本

作者头像
程序你好
发布2018-07-23 10:01:33
4100
发布2018-07-23 10:01:33
举报
文章被收录于专栏:程序你好程序你好

上个月在Build 2018年微软发布了ML.NET 0.1,一个跨平台的开源机器学习框架。今天又发布了ML.NET 0.2。这个版本侧重于添加新的ML任务,比如集群,使验证模型更容易,为ML.NET示例添加一个全新的repo,并解决我们在GitHub repo中收到的各种问题和反馈。

下面提到了ML.NET 0.2版本的一些亮点:

新的机器学习任务:集群

集群是一种无监督的学习任务,它根据项目的特征对项目集进行分组。它识别哪些项目比其他项目更相似。

这在一些场景中可能很有用,比如根据主题将新闻文章组织成组,根据用户的购物习惯对用户进行分段,以及根据观众对电影的喜好对观众进行分组。

Iris Flower示例演示了如何使用ML.NET 0.2中的集群

通过交叉验证和培训测试更容易进行模型验证

交叉验证是一种验证模型统计性能的方法。它不需要单独的测试数据集,而是使用您的训练数据来测试您的模型(它将数据划分为不同的数据,以便进行培训和测试,并多次执行)。使用ML.NET 0.2,您现在可以使用交叉验证,这里有一个很好的例子。(https://github.com/dotnet/machinelearning/blob/78810563616f3fcb0b63eb8a50b8b2e62d9d65fc/test/Microsoft.ML.Tests/Scenarios/SentimentPredictionTests.cs#L51)

Train-test是在单独的数据集中测试模型的快捷方式。参见这里的示例用法。(https://github.com/dotnet/machinelearning/blob/78810563616f3fcb0b63eb8a50b8b2e62d9d65fc/test/Microsoft.ML.Tests/Scenarios/SentimentPredictionTests.cs#L36)

使用具有CollectionDataSource的数据对象进行训练

net 0.1允许从带分隔符的文本文件加载数据。net 0.2中的CollectionDataSource增加了使用对象集合作为LearningPipeline输入的能力。

下面的代码片段展示了如何使用ML.NET 0.2中的CollectionDataSource。

新的ML.NET示例repo

我们创建了一个新的repo https://github.com/dotnet/machinelearning-samples,并添加了一些开始和结束应用程序示例。

  • 情绪分析(二进制分类)

这个示例演示了如何使用ML.NET分析客户评论的情绪(正面或负面)。该示例使用了IMDB和Yelp评论。

  • 鸢尾花的分类(多类分类)

这个样本的中心是预测虹膜花的类型(setosa, versicolor,或virginica)基于花的参数,如花瓣长度,花瓣宽度等。

  • 出租汽车费预测(回归)

出租车票价预测示例演示了如何构建一个ML.NET模型来预测纽约市出租车票价。本样本采用回归模型,考虑了乘客数量、信用类型和旅行距离等特征。

  • 虹膜数据集聚类分析(聚类)

这个示例演示了如何通过对Iris数据集执行集群分析,从而使用ML.NET构建集群模型。

  • GitHub问题分类(多类分类)

这是一个E2E示例,展示了如何使用ML.NET构建GitHub的问题分类器。

这篇博文只介绍了一些ML.NET 0.2版本的顶级声明,在这里可以找到ML.NET 0.2的完整版本说明(https://github.com/GalOshri/machinelearning/blob/f026db2cdba1858b0e8bea2ddf2a4092a61bd708/docs/release-notes/0.2/release-0.2.md)。

帮助建立ML.NET以满足您的需求

如果你还没有使用过机器学习,请试试ML.NET。

https://github.com/dotnet/machinelearning

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序你好 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档