教程 | 如何使用JavaScript构建机器学习模型

选自:hackernoon

作者:Abhishek Soni

参与:李泽南

目前,机器学习领域建模的主要语言是 Python 和 R,前不久腾讯推出的机器学习框架 Angel 则支持 Java 和 Scala。本文作者 Abhishek Soni 则用行动告诉我们,开发机器学习模型,JavaScript 也可以。

JavaScript?我不是应该使用 Python 吗?甚至 Scikit-learn 在 JavaScript 上都不工作。

这是可能的,实际上,连我自己都惊讶于开发者对此忽视的态度。就 Scikit-learn 而言,Javascript 的开发者事实上已经推出了适用的库,它会在本文中有所提及。那么,让我们看看 Javascript 在机器学习上能够做什么吧。

根据人工智能先驱 Arthur Samuel 的说法,机器学习为计算机提供了无需明确编程的学习能力。换句话说,它使得计算机能够自我学习并执行正确的指令,无需人类提供全部指导。

谷歌已经把自己移动优先的策略转换到人工智能优先很久了。

为什么 JavaScript 在机器学习界未被提及过?

  • 慢(真的假的?)
  • 矩阵操作很困难(这里有库,比如 math.js)
  • 仅用于 Web 开发(然而这里还有 Node.js)
  • 机器学习库通常是在 Python 上的(还好,JS 的开发者人数也不少)

在 JavaScript 中有一些可供使用的预制库,其中包含一些机器学习算法,如线性回归、SVM、朴素贝叶斯等等,以下是其中的一部分。

  • brain.js(神经网络)
  • Synaptic(神经网络)
  • Natural(自然语言处理)
  • ConvNetJS(卷积神经网络)
  • mljs(一组具有多种功能的子库)

首先,我们将使用 mljs 回归库来进行一些线性回归操作。

参考代码:https://github.com/abhisheksoni27/machine-learning-with-js

1. 安装库

$ npm install ml-regression csvtojson

ml-regression 正如其名,负责机器学习的线性回归。

csvtojson 是一个用于 node.js 的快速 CSV 解析器,它允许加载 CSV 数据文件并将其转换为 JSON。

2. 初始化并加载数据

下载数据文件(.csv),并将其加入你的项目。

链接:http://www-bcf.usc.edu/~gareth/ISL/Advertising.csv

如果你已经初始化了一个空的 npm 项目,打开 index.js,输入以下代码。

const ml = require('ml-regression'); const csv = require('csvtojson'); const SLR = ml.SLR; // Simple Linear Regression const csvFilePath = 'advertising.csv'; // Data let csvData = [], // parsed Data X = [], // Input y = []; // Output

我把文件放在了项目的根目录下,如果你想放在其他地方,请记得更新 csvFilePath。

现在我们使用 csvtojson 的 fromFile 方法加载数据文件:

csv() .fromFile(csvFilePath) .on('json', (jsonObj) => { csvData.push(jsonObj); }) .on('done', () => { dressData(); // To get data points from JSON Objects performRegression(); });

3. 打包数据,准备执行

JSON 对象被存储在 csvData 中,我们还需要输入数据点数组和输出数据点。我们通过一个填充 X 和 Y 变量的 dressData 函数来运行数据。

function dressData() { /** * One row of the data object looks like: * { * TV: "10", * Radio: "100", * Newspaper: "20", * "Sales": "1000" * } * * Hence, while adding the data points, * we need to parse the String value as a Float. */ csvData.forEach((row) => { X.push(f(row.Radio)); y.push(f(row.Sales)); }); } function f(s) { return parseFloat(s); }

4. 训练模型开始预测

数据已经打包完毕,是时候训练我们的模型了。

为此,我们需要写一个 performRegression 函数:

function performRegression() { regressionModel = new SLR(X, y); // Train the model on training data console.log(regressionModel.toString(3)); predictOutput(); }

performRegression 函数有一个方法 toString,它为浮点输出获取一个名为 precision 的参数。predictOutput 函数能让你输入数值,然后将模型的输出传到控制台。它是这样的(注意,我使用的是 Node.js 的 readline 工具):

function predictOutput() { rl.question('Enter input X for prediction (Press CTRL+C to exit) : ', (answer) => { console.log(`At X = ${answer}, y = ${regressionModel.predict(parseFloat(answer))}`); predictOutput(); }); }

以下是为了增加阅读用户的代码

const readline = require('readline'); // For user prompt to allow predictions const rl = readline.createInterface({ input: process.stdin, output: process.stdout });

5. 大功告成!

遵循以上步骤,你的 index.js 应该是这样:

const ml = require('ml-regression'); const csv = require('csvtojson'); const SLR = ml.SLR; // Simple Linear Regression const csvFilePath = 'advertising.csv'; // Data let csvData = [], // parsed Data X = [], // Input y = []; // Output let regressionModel; const readline = require('readline'); // For user prompt to allow predictions const rl = readline.createInterface({ input: process.stdin, output: process.stdout }); csv() .fromFile(csvFilePath) .on('json', (jsonObj) => { csvData.push(jsonObj); }) .on('done', () => { dressData(); // To get data points from JSON Objects performRegression(); }); function performRegression() { regressionModel = new SLR(X, y); // Train the model on training data console.log(regressionModel.toString(3)); predictOutput(); } function dressData() { /** * One row of the data object looks like: * { * TV: "10", * Radio: "100", * Newspaper: "20", * "Sales": "1000" * } * * Hence, while adding the data points, * we need to parse the String value as a Float. */ csvData.forEach((row) => { X.push(f(row.Radio)); y.push(f(row.Sales)); }); } function f(s) { return parseFloat(s); } function predictOutput() { rl.question('Enter input X for prediction (Press CTRL+C to exit) : ', (answer) => { console.log(`At X = ${answer}, y = ${regressionModel.predict(parseFloat(answer))}`); predictOutput(); }); }

到你的终端上运行 node index.js,得到的输出会是这样:

$ node index.js f(x) = 0.202 * x + 9.31 Enter input X for prediction (Press CTRL+C to exit) : 151.5 At X = 151.5, y = 39.98974927911285 Enter input X for prediction (Press CTRL+C to exit) :

恭喜!你刚刚在 JavaScript 中训练了第一个线性回归模型。(PS. 你注意到速度了吗?)

本文为机器之心编译,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2017-06-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏技术总结

算法(1)

2447
来自专栏Python爬虫与算法进阶

爬取 Stackoverflow 100 万条问答并简单分析

作为一个热爱编程的大学生,怎么能不知道面向 stackoverflow 编程呢。 打开 stackoverflow 主页,在 questions 页面下选择按...

3145
来自专栏机器学习和数学

[Tensorflow] TensorFlow之Hello World!(1)

哇!今天挺开心的,30天的时间,19篇文章,2459人阅读,5313人次阅读!今天开通的原创标识,恩!除了激动,就是非常感谢大家的支持!感谢大家的支持!大家的支...

3416
来自专栏算法channel

基本算法|图解各种树(四)

基本算法|图解各种树(一) 基本算法|图解各种树(二) 基本算法|图解各种树(三) 01 局部性 刚被访问过的数据,极有可能很快地再次被访问,这一现象在信息...

3777
来自专栏ATYUN订阅号

使用Tensor2Tensor和10行代码训练尖端语言翻译神经网络

有许多库可以帮助人们构建深度学习应用程序,但如果想使用最新架构的最先进模型和最少的代码,有这样一个API脱颖而出:Google的Tensor2Tensor。我通...

2162
来自专栏编程心路

人人都可以用C语言写推箱子小游戏

C语言,作为大多数人的第一门编程语言,重要性不言而喻,很多编程习惯,逻辑方式在此时就已经形成了。这个是我学习 C语言 后写的推箱子小游戏,自己的逻辑能力得到了提...

8054
来自专栏吕晟的专栏

机器学习库初探之 TensorFlow

什么是TensorFlow?TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表...

7441
来自专栏机器之心

教程 | 如何通过PyTorch上手Tensor Comprehensions?

选自pytorch 作者:Priya Goyal等 机器之心编译 参与:乾树、黄小天 Tensor Comprehensions 是一个降低高性能代码编写门槛的...

3037
来自专栏章鱼的慢慢技术路

用OpenGL实现粒子的随机运动

1565
来自专栏UAI人工智能

实战派 | PaddlePaddle 你其实也可以真正地上手

1844

扫码关注云+社区

领取腾讯云代金券