MMD_2b_NearestNeighborLearning

Large scale machine learning ways

  • k-nearest neighbor(instance based learning)
  • support vector machine
  • decision tree

main question: how to efficiently train (build model and find model parameters)?

Instance Based Learning

概述

具体方法

  • 1NN
  • KNN
  • KernalRegression

发现NN

通常,有两种发现问题:

  1. 选择距离最近的K个
  2. 设定距离的阈值,发现小于该阈值的NN点

当数据量大到一定程度时,不可能分别比较每个点与query点得距离,这样的话所用的时间是线性的,不适合解决大规模的问题。 这个时候,使用LSH(local sensitive hashing),可以缩减问题的规模,使得所用的时间是constant的。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏我和未来有约会

Silverlight制作逐帧动画 v2 - part2

Silverlight制作逐帧动画 v2 - part2 在这里完善了一下算法,加入了fps的机制进去。 private string[] ...

1976
来自专栏跟着阿笨一起玩NET

从sql server 中读取二进制图片

561
来自专栏王磊的博客

Net连接mysql的公共Helper类MySqlHelper.cs带MySql.Data.dll下载

MySqlHelper.cs代码如下: using System; using System.Collections.Generic; using System...

4869
来自专栏跟着阿笨一起玩NET

treeview 绑定文件夹和文件

541
来自专栏技术之路

sqlserver 的事务和c#的事务

sql的事务 1 sql 2 create database model 3 go 4 use model 5 go 6 create table ...

2019
来自专栏菩提树下的杨过

基于sliverlight + wcf的web 文字版IM 示例

演示地址: http://task.24city.com/default.html 预览界面: ? 一、布局 采用Grid布局,5行2列 第一行:为登录/注册信...

3286
来自专栏跟着阿笨一起玩NET

使用延迟的FileSystemWatcher来避免重复触发事件

  程序里需要监视某个目录下的文件变化情况: 一旦目录中出现新文件或者旧的文件被覆盖,程序需要读取文件内容并进行处理;但在实际处理中发现当一个文件产生变化时,C...

1232
来自专栏互联网开发者交流社区

STC-单片机控制系统

1213
来自专栏木宛城主

曾今的代码系列——自己的分页控件+存储过程实现分页

项目里面的测试代码,仅供参考 LoginByAjax <title>Ajax登陆</title> <script src="Scripts/c...

1975
来自专栏自由而无用的灵魂的碎碎念

小项目分享---混色器

编写代码的同志们一般懂美术的就少了,偶也是,什么色轮、三维加色等等。虽然看过一些书籍(如内田广由纪的《配色基础原理》),不过还是一知半解的。

1103

扫码关注云+社区