MMD_2b_NearestNeighborLearning

Large scale machine learning ways

  • k-nearest neighbor(instance based learning)
  • support vector machine
  • decision tree

main question: how to efficiently train (build model and find model parameters)?

Instance Based Learning

概述

具体方法

  • 1NN
  • KNN
  • KernalRegression

发现NN

通常,有两种发现问题:

  1. 选择距离最近的K个
  2. 设定距离的阈值,发现小于该阈值的NN点

当数据量大到一定程度时,不可能分别比较每个点与query点得距离,这样的话所用的时间是线性的,不适合解决大规模的问题。 这个时候,使用LSH(local sensitive hashing),可以缩减问题的规模,使得所用的时间是constant的。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能LeadAI

图像学习-验证码识别

这是去年博主心血来潮实现的一个小模型,现在把它总结一下。由于楼主比较懒,网上许多方法都需要切割图片,但是楼主思索了一下感觉让模型有多个输出就可以了呀,没必要一定...

4144
来自专栏程序生活

TensorFlow实现Attention机制原理介绍论文阅读代码实现

4868
来自专栏机器之心

资源 | 对比ResNet: 超深层网络DiracNet的PyTorch实现

3024
来自专栏大数据挖掘DT机器学习

用深度学习keras的cnn做图像识别分类,准确率达97%

Keras是一个简约,高度模块化的神经网络库。 可以很容易和快速实现原型(通过总模块化,极简主义,和可扩展性) 同时支持卷积网络(vision)和复发性的网络...

3156
来自专栏AIUAI

Keras - GPU ID 和显存占用设定

40316
来自专栏人工智能LeadAI

keras学习笔记-黑白照片自动着色的神经网络-Beta版

Alpha版本不能很好地给未经训练的图像着色。接下来,我们将在Beta版本中做到这一点——将上面的将神经网络泛化。 以下是使用Beta版本对测试图像着色的结果。...

3326
来自专栏CreateAMind

预测编码 笔记

The main intuition behind our model is to learn the representations that encode ...

581
来自专栏林欣哲

一小时培训之神经网络入门

系列培训目录 ➡神经网络(Neural Networks)⬅ 卷积神经网络(Convolutional Neural Networks) 循环神经网络(Recu...

4117
来自专栏专知

在Python中使用SpaCy进行文本分类

2583
来自专栏AI研习社

详解自动识别验证码,LSTM大显身手

这是去年博主心血来潮实现的一个小模型,现在把它总结一下。由于楼主比较懒,网上许多方法都需要切割图片,但是楼主思索了一下感觉让模型有多个输出就可以了呀,没必要一定...

3148

扫码关注云+社区