二维机器学习测试数据生成

最近在看机器学习,讲的是线性回归和逻辑回归的内容

当然就难免写点代码来进行实验,总喜欢自己做一些数据而不只是写一个原函数再加上噪声

毕竟自己点点点出来然后得到学习的直线比较有feel,所有就需要这样一个东西:

一个坐标系上点点点出一些点,然后自动生成点的数据放在程序里来跑

估计是东西太小,都没看人做个,纠结一番还是自己动手做了一个

http://justdark.github.io/my_html/get_liner_samples.html

我学javascript和html也比较浅,反正各种参考最后是搞出来了

大概的界面就是下面这个样子,可以输入宽和高调节坐标系的大小

(负数就没搞出来了,反正是学习用的)

点生成数据按钮在下面的文本框里得到数据,可以选择是否在每个样例前添加一个常数1(具体啥用知道的都知道)

可以选择regression(X内容是x的坐标,y的内容是点的y轴的坐标值)

或者logistic模式(X的内容是点的完整坐标,y的内容是点的标号)

默认是regression模式的

生成的数据可以直接放在python里面跑,比如:

生成的数据放在python里的fit出来的结果就是:(下面的横轴坐标不均匀,所以看起来有点变形,其实没有)

而上图生成的logistic样例就是下面这样,这样就不用苦逼地自己去编数据了,点点几下东西就出来了^_^

[python] view plaincopy

  1. X=[
  2. [1,1.7611110925674438,3.6876739501953124],
  3. [1,2.7111110925674438,5.637673950195312],
  4. [1,4.311111092567444,6.2876739501953125],
  5. [1,3.4611110925674438,4.087673950195312],
  6. [1,5.261111092567444,5.5376739501953125],
  7. [1,6.4111110925674435,6.437673950195313],
  8. [1,6.6611110925674435,3.7376739501953127],
  9. [1,3.811111092567444,2.2876739501953125],
  10. [1,2.9611110925674438,2.2376739501953127],
  11. [1,4.961111092567444,3.9876739501953127],
  12. [1,5.861111092567444,12.337673950195313],
  13. [1,6.861111092567444,14.137673950195312],
  14. [1,7.111111092567444,12.637673950195312],
  15. [1,8.311111092567444,10.837673950195313],
  16. [1,9.211111092567444,11.537673950195312],
  17. [1,8.861111092567445,14.237673950195312],
  18. [1,9.911111092567443,14.137673950195312],
  19. [1,9.111111092567445,13.537673950195312],
  20. [1,10.161111092567443,11.987673950195312],
  21. [1,11.011111092567443,11.687673950195313],
  22. [1,13.011111092567443,6.087673950195312],
  23. [1,13.711111092567444,8.137673950195312],
  24. [1,15.161111092567443,7.0376739501953125],
  25. [1,15.461111092567444,5.137673950195312],
  26. [1,15.811111092567444,2.7376739501953127],
  27. [1,13.761111092567443,3.9876739501953127],
  28. [1,14.511111092567443,5.837673950195312],
  29. [1,16.261111092567443,8.337673950195313],
  30. [1,16.611111092567445,6.487673950195313],
  31. [1,17.461111092567442,4.187673950195313],
  32. [1,18.011111092567443,8.037673950195312],
  33. [1,18.361111092567445,9.787673950195312],
  34. [1,18.611111092567445,10.037673950195312]]
  35. y=[
  36. [0],
  37. [0],
  38. [0],
  39. [0],
  40. [0],
  41. [0],
  42. [0],
  43. [0],
  44. [0],
  45. [0],
  46. [2],
  47. [2],
  48. [2],
  49. [2],
  50. [2],
  51. [2],
  52. [2],
  53. [2],
  54. [2],
  55. [2],
  56. [1],
  57. [1],
  58. [1],
  59. [1],
  60. [1],
  61. [1],
  62. [1],
  63. [1],
  64. [1],
  65. [1],
  66. [1],
  67. [1],
  68. [1]]

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2015-11-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏信数据得永生

《Scikit-Learn与TensorFlow机器学习实用指南》第2章 一个完整的机器学习项目

87418
来自专栏AI研习社

实例+代码,你还怕不会构建深度学习的代码搜索库吗?

本文展示了一个端到端的实例,说明如何构建一个可以语义化搜索对象的系统。项目作者是 Hamel Husain (https://www.linkedin.com/...

573
来自专栏决胜机器学习

机器学习(五) ——k-近邻算法进一步探究

机器学习(五)——k-近邻算法进一步探究 (原创内容,转载请注明来源,谢谢) 一、概述 现采用k-近邻算法,进行分类应用。数据源采用《机器学习实战》提供的数...

3174
来自专栏PPV课数据科学社区

基于Libsvm的图像分类

关于Libsvm的废话 基于Libsvm的图像分类实例 说说图像分类的处理结果 1. 关于Libsvm的废话 先来一段废话,大家有心情看看就行,那就是关于支持...

2764
来自专栏向治洪

基于OpenCV的跳一跳外挂实现原理

最近,微信跳一跳小游戏迅速走红并且在朋友圈刷屏,游戏的规则很简单,就是控制一个小矮子再各个墩子上跳来跳去。由于游戏比较简单,一时间大家都玩起来了,这也带动了一些...

2898
来自专栏人工智能LeadAI

TF使用例子-情感分类

这次改写一下,做一个简单的分类模型和探讨一下hidden layer在聚类的应用场景下会有什么效果。为了能写的尽可能让读者理解,本文也会写一下keras来实现(...

4583
来自专栏IT派

六行代码!完成你的第一个机器学习算法

Google出了一个面向新手的机器学习教程,每集六七分钟,言简意赅,只掌握最基础的Python语法知识,便可以实现一些基本的机器学习算法。接下来我准备分几次...

3416
来自专栏数据小魔方

创意玫瑰图(Rose chart)

今天跟大家分享的图表是创意玫瑰图! ▽▼▽ 这种图表形似玫瑰,故而得名,其效果与我们常用的饼图,圆环图及雷达图类似。 ? 可以反映数据结构的比例、大小,但因其形...

36010
来自专栏奇点大数据

你的“跳一跳”榜上有名了吗?聊聊“跳一跳”开挂方法

最近“跳一跳”在朋友圈风靡一时,吃饭的时候,人家跟你聊跳了多少步,你要没上200都不好意思跟人家打招呼。作为AI研发的机构,我们更关心怎么样才能自动让AI走的更...

3386
来自专栏Python中文社区

Kaggle搭积木式刷分大法: LB 0.11666(排名前15%)

專 欄 ❈本文作者:王勇,目前感兴趣项目商业分析、Python、机器学习、Kaggle。17年项目管理,通信业干了11年项目经理管合同交付,制造业干了6年项目...

18710

扫码关注云+社区