二维机器学习测试数据生成

最近在看机器学习,讲的是线性回归和逻辑回归的内容

当然就难免写点代码来进行实验,总喜欢自己做一些数据而不只是写一个原函数再加上噪声

毕竟自己点点点出来然后得到学习的直线比较有feel,所有就需要这样一个东西:

一个坐标系上点点点出一些点,然后自动生成点的数据放在程序里来跑

估计是东西太小,都没看人做个,纠结一番还是自己动手做了一个

http://justdark.github.io/my_html/get_liner_samples.html

我学javascript和html也比较浅,反正各种参考最后是搞出来了

大概的界面就是下面这个样子,可以输入宽和高调节坐标系的大小

(负数就没搞出来了,反正是学习用的)

点生成数据按钮在下面的文本框里得到数据,可以选择是否在每个样例前添加一个常数1(具体啥用知道的都知道)

可以选择regression(X内容是x的坐标,y的内容是点的y轴的坐标值)

或者logistic模式(X的内容是点的完整坐标,y的内容是点的标号)

默认是regression模式的

生成的数据可以直接放在python里面跑,比如:

生成的数据放在python里的fit出来的结果就是:(下面的横轴坐标不均匀,所以看起来有点变形,其实没有)

而上图生成的logistic样例就是下面这样,这样就不用苦逼地自己去编数据了,点点几下东西就出来了^_^

[python] view plaincopy

  1. X=[
  2. [1,1.7611110925674438,3.6876739501953124],
  3. [1,2.7111110925674438,5.637673950195312],
  4. [1,4.311111092567444,6.2876739501953125],
  5. [1,3.4611110925674438,4.087673950195312],
  6. [1,5.261111092567444,5.5376739501953125],
  7. [1,6.4111110925674435,6.437673950195313],
  8. [1,6.6611110925674435,3.7376739501953127],
  9. [1,3.811111092567444,2.2876739501953125],
  10. [1,2.9611110925674438,2.2376739501953127],
  11. [1,4.961111092567444,3.9876739501953127],
  12. [1,5.861111092567444,12.337673950195313],
  13. [1,6.861111092567444,14.137673950195312],
  14. [1,7.111111092567444,12.637673950195312],
  15. [1,8.311111092567444,10.837673950195313],
  16. [1,9.211111092567444,11.537673950195312],
  17. [1,8.861111092567445,14.237673950195312],
  18. [1,9.911111092567443,14.137673950195312],
  19. [1,9.111111092567445,13.537673950195312],
  20. [1,10.161111092567443,11.987673950195312],
  21. [1,11.011111092567443,11.687673950195313],
  22. [1,13.011111092567443,6.087673950195312],
  23. [1,13.711111092567444,8.137673950195312],
  24. [1,15.161111092567443,7.0376739501953125],
  25. [1,15.461111092567444,5.137673950195312],
  26. [1,15.811111092567444,2.7376739501953127],
  27. [1,13.761111092567443,3.9876739501953127],
  28. [1,14.511111092567443,5.837673950195312],
  29. [1,16.261111092567443,8.337673950195313],
  30. [1,16.611111092567445,6.487673950195313],
  31. [1,17.461111092567442,4.187673950195313],
  32. [1,18.011111092567443,8.037673950195312],
  33. [1,18.361111092567445,9.787673950195312],
  34. [1,18.611111092567445,10.037673950195312]]
  35. y=[
  36. [0],
  37. [0],
  38. [0],
  39. [0],
  40. [0],
  41. [0],
  42. [0],
  43. [0],
  44. [0],
  45. [0],
  46. [2],
  47. [2],
  48. [2],
  49. [2],
  50. [2],
  51. [2],
  52. [2],
  53. [2],
  54. [2],
  55. [2],
  56. [1],
  57. [1],
  58. [1],
  59. [1],
  60. [1],
  61. [1],
  62. [1],
  63. [1],
  64. [1],
  65. [1],
  66. [1],
  67. [1],
  68. [1]]

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2015-11-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI研习社

OpenAI 开源最新工具包,模型增大 10 倍只需额外增加 20% 计算时间

AI 研习社消息,近日,OpenAI 在 GitHub 上开源最新工具包 gradient-checkpointing,该工具包通过设置梯度检查点(gradie...

3287
来自专栏ATYUN订阅号

使用FastText(Facebook的NLP库)进行文本分类和word representatio...

介绍 现在, 社交软件Facebook面临诸多挑战。Facebook每天处理大量的各种形式的文本数据,例如状态更新、评论等等。而对Facebook来说,更重要...

1.8K5
来自专栏专知

【干货】手把手教你用苹果Core ML和Swift开发人脸目标识别APP

【导读】CoreML是2017年苹果WWDC发布的最令人兴奋的功能之一。它可用于将机器学习整合到应用程序中,并且全部脱机。CoreML提供的机器学习 API,包...

3096
来自专栏企鹅号快讯

Hinton胶囊理论代码开源,上线即受热捧

当前的深度学习理论是由GeoffreyHinton大神在2007年确立起来的,但是如今他却认为,“CNN的特征提取层与次抽样层交叉存取,将相同类型的相邻特征检测...

2046
来自专栏CreateAMind

dcgan人脸生成效果复现-多图及代码学习

https://github.com/carpedm20/DCGAN-tensorflow

1511
来自专栏ATYUN订阅号

ChainerCV: 一个用于深度学习的计算机视觉库

ChainerCV是一个基于Chainer用于训练和运行计算机视觉任务的神经网络工具。它涵盖了计算机视觉模型的高质量实现,以及开展计算机视觉研究的必备工具集。 ...

4317
来自专栏编程

隐马尔科夫模型 python 实现简单拼音输入法

关键时刻,第一时间送达! ? 在网上看到一篇关于隐马尔科夫模型的介绍,觉得简直不能再神奇,又在网上找到大神的一篇关于如何用隐马尔可夫模型实现中文拼音输入的博客(...

3480
来自专栏云时之间

深度学习与神经网络:基于自建手写字体数据集上的模型测试

1053
来自专栏图像识别与深度学习

2018-06-30 TensorFlow实战:SoftMax手写体MNIST识别(Python完整源码)

1434
来自专栏大数据智能实战

facebook Faiss的基本使用示例(逐步深入)

针对上一篇文章,安装完毕之后,可以对faiss进行基本的案例学习,具体步骤如下: step1:构造实验数据 ? step2:为向量集构建IndexFlatL2索...

9745

扫码关注云+社区