前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >二维机器学习测试数据生成

二维机器学习测试数据生成

作者头像
机器学习AI算法工程
发布2018-03-13 10:34:18
7300
发布2018-03-13 10:34:18
举报
文章被收录于专栏:机器学习AI算法工程

最近在看机器学习,讲的是线性回归和逻辑回归的内容

当然就难免写点代码来进行实验,总喜欢自己做一些数据而不只是写一个原函数再加上噪声

毕竟自己点点点出来然后得到学习的直线比较有feel,所有就需要这样一个东西:

一个坐标系上点点点出一些点,然后自动生成点的数据放在程序里来跑

估计是东西太小,都没看人做个,纠结一番还是自己动手做了一个

http://justdark.github.io/my_html/get_liner_samples.html

我学javascript和html也比较浅,反正各种参考最后是搞出来了

大概的界面就是下面这个样子,可以输入宽和高调节坐标系的大小

(负数就没搞出来了,反正是学习用的)

点生成数据按钮在下面的文本框里得到数据,可以选择是否在每个样例前添加一个常数1(具体啥用知道的都知道)

可以选择regression(X内容是x的坐标,y的内容是点的y轴的坐标值)

或者logistic模式(X的内容是点的完整坐标,y的内容是点的标号)

默认是regression模式的

生成的数据可以直接放在python里面跑,比如:

生成的数据放在python里的fit出来的结果就是:(下面的横轴坐标不均匀,所以看起来有点变形,其实没有)

而上图生成的logistic样例就是下面这样,这样就不用苦逼地自己去编数据了,点点几下东西就出来了^_^

[python] view plaincopy

  1. X=[
  2. [1,1.7611110925674438,3.6876739501953124],
  3. [1,2.7111110925674438,5.637673950195312],
  4. [1,4.311111092567444,6.2876739501953125],
  5. [1,3.4611110925674438,4.087673950195312],
  6. [1,5.261111092567444,5.5376739501953125],
  7. [1,6.4111110925674435,6.437673950195313],
  8. [1,6.6611110925674435,3.7376739501953127],
  9. [1,3.811111092567444,2.2876739501953125],
  10. [1,2.9611110925674438,2.2376739501953127],
  11. [1,4.961111092567444,3.9876739501953127],
  12. [1,5.861111092567444,12.337673950195313],
  13. [1,6.861111092567444,14.137673950195312],
  14. [1,7.111111092567444,12.637673950195312],
  15. [1,8.311111092567444,10.837673950195313],
  16. [1,9.211111092567444,11.537673950195312],
  17. [1,8.861111092567445,14.237673950195312],
  18. [1,9.911111092567443,14.137673950195312],
  19. [1,9.111111092567445,13.537673950195312],
  20. [1,10.161111092567443,11.987673950195312],
  21. [1,11.011111092567443,11.687673950195313],
  22. [1,13.011111092567443,6.087673950195312],
  23. [1,13.711111092567444,8.137673950195312],
  24. [1,15.161111092567443,7.0376739501953125],
  25. [1,15.461111092567444,5.137673950195312],
  26. [1,15.811111092567444,2.7376739501953127],
  27. [1,13.761111092567443,3.9876739501953127],
  28. [1,14.511111092567443,5.837673950195312],
  29. [1,16.261111092567443,8.337673950195313],
  30. [1,16.611111092567445,6.487673950195313],
  31. [1,17.461111092567442,4.187673950195313],
  32. [1,18.011111092567443,8.037673950195312],
  33. [1,18.361111092567445,9.787673950195312],
  34. [1,18.611111092567445,10.037673950195312]]
  35. y=[
  36. [0],
  37. [0],
  38. [0],
  39. [0],
  40. [0],
  41. [0],
  42. [0],
  43. [0],
  44. [0],
  45. [0],
  46. [2],
  47. [2],
  48. [2],
  49. [2],
  50. [2],
  51. [2],
  52. [2],
  53. [2],
  54. [2],
  55. [2],
  56. [1],
  57. [1],
  58. [1],
  59. [1],
  60. [1],
  61. [1],
  62. [1],
  63. [1],
  64. [1],
  65. [1],
  66. [1],
  67. [1],
  68. [1]]
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-11-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据挖掘DT数据分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档