腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

人工智能LeadAI

专栏作者

461

文章

627349

阅读量

104

订阅数

超干货 | 2019秋招CV算法面经

编程算法 http 机器学习 java 其他

简书地址：https://www.jianshu.com/u/0ba41518b919

2018-12-05

1.3K0

NLP系列学习:CRF条件随机场(1)

编程算法 NLP 服务机器学习

大家好,今天让我们来看看条件随机场,条件随机场是一项大内容,在中文分词里广泛应用,因为我们在之前的文章里将概率图模型和基本的形式语言知识有所了解,当我们现在再去学习条件随机场会容易比较多(在动笔写这篇文章前我也翻阅了很多的博客,发现很多博主上来就讲一大堆核心公式,而之前的铺垫知识都很少提,我觉得这不太好,会让很多人一开始就懵)。

2018-07-30

2830

进行数据挖掘的 8 个最佳开源工具

数据挖掘开源数据库机器学习编程算法

数据挖掘，又称为资料探勘、数据采矿。它是数据库知识发现（英语：Knowledge-Discovery in Databases，简称：KDD）中的一个步骤，是一个挖掘和分析大量数据并从中提取信息的过程。其中一些应用包括市场细分 - 如识别客户从特定品牌购买特定产品的特征，欺诈检测 - 识别可能导致在线欺诈的交易模式等。在本文中，我们整理了进行数据挖掘的 8 个最佳开源工具。

2018-07-26

1.2K0

机器学习必须熟悉的算法之word2vector（二）

机器学习编程算法

在上一篇文章中，我们简述了skip gram版word2vector的基本原理，留下一个问题待解决，那就是网络非常大，这将导致如下几个困难：1、在上面训练梯度下降会比较慢；2、需要数量巨大的数据来喂到网络中；3、非常容易过拟合。这一节就是专门介绍实际训练中的技巧的。原文在这里：http://mccormickml.com/2017/01/11/word2vec-tutorial-part-2-negative-sampling/ 当然，我不会生硬地翻译这篇文章，而是按照自己的理解，尽可能用自己的逻辑将它写出

2018-03-30

8680

VGG和GoogLeNet inception

01 介绍 googlenet和vggnet这两个模型是在AlexNet后人工神经网络方面研究的又一里程碑，也是许多论文和博客中用来和提出的新方法进行对比的baseline。理解这两个网络并且明白它们的优劣对走在机器学习之路上的小伙伴们来说是非常重要的。这两类模型结构有一个共同特点是Go deeper，但是在具体实现上却有很大差异。 02 VGG vgg[1]继承了lenet以及alexnet的一些框架，尤其是跟alexnet框架非常像，vgg也是5个group的卷积、2层fc图像特征、一层fc分类特征

2018-03-12

1.2K0

机器学习必须熟悉的算法之word2vector

机器学习编程算法

word2vector已经成为NLP领域的基石算法。作为一名AI 从业者，如果不能主动去熟悉该算法，应该感到脸红。本文是一篇翻译的文章，原文链接是：http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/ 如果你的英语很好，强烈建议直接阅读原文。这篇文章写的非常好，简明扼要，语言流畅。是我认为入门word2vector的最好文章，没有之一。当然，我也不是生硬的翻译，而是理解之后按照自己的逻辑再写出来，希望能更加清晰一些。

2018-03-12

3.5K0

《机器学习基石》课程学习总结（二）

01 寻找函数g的pocket算法前文提到，PLA算法有效的前提是D要是线性可分的，D中的数据可以看做由f产生而来。这样的假设过于理想化，现实中，D里面总会掺杂一些噪声数据（noise data），这些数据并不是从理想的f产生而来。这些噪声数据会带来哪些影响？有了噪声数据，D可能就不是线性可分了，PLA算法也就不再有效，而且，即使D还是线性可分的，噪声数据也会对最后选择的g产生干扰，影响g与f的相似度。怎么解决噪声数据带来的干扰？答案是对PLA算法进行改进，不求对D中每一个数据都有g(X)=y=f

2018-03-09

9940

《机器学习基石》课程学习总结（一）

《机器学习基石》课程非常棒，作为总结，本文重点是梳理课程中的知识脉络，同时尽可能说白话，让没有机器学习背景的朋友也能看懂。这个课程好在哪里？ 1、最大的好课程内容组织非常科学，就像一个故事，有着清晰的主线。课程共16讲，基本是按照四个问题的顺序来展开的，即： When：机器学习能解决哪些问题（1-4课） Why：为什么机器学习能解决这些问题（5-8课） How：怎样用机器学习来解决这些问题（9-12课） How better：怎样更好地用机器学习来解决这些问题（13-16课）这条主线就像旅行者手中的

2018-03-09

9270

《机器学习基石》课程学习总结（三）

前面两篇文章要点回顾：第一篇：机器学习的主要任务是用算法A，利用数据集D从假设集H中挑出一个函数g，使得E_in(g)最小。第二篇：可以证明，当假设集H的d_vc是有限值，数据集D中样本数量N足够大时，找到的函数g的E_in和E_out很大概率上是近似相等的，因此，E_in很小时可以认为E_out也会很小。也就是说，机器确实从数据中学习到了“知识”。这篇文章是对第8课内容的总结，比较短，但是很重要。 1、如果数据中有noise 在前面两篇文章中，讨论机器学习时默认有一个前提是成立的，那就是数据集

2018-03-09

7600

目标检测研究综述+LocNet

编程算法图像识别机器学习神经网络深度学习

01 localization accuracy 更准确的bounding box，提高IOU 02 目标检测的发展 1、传统的目标检测（滑动窗口的框架） (1).滑动窗口 (2).提取特征（SIF

2018-03-09

1.2K0

R-CNN 物体检测第一弹

机器学习神经网络深度学习人工智能

今天，重读了 R-CNN 的 TPAMI 版本，感觉受益颇多。该版相比之前的会议版，在检测流程和实现细节上表述得更为清晰。此外，因为是改投 TPAMI 的关系，因此文中补充了很多额外的实验和分析，尤其是检测系统为什么最后设计成这样的缘由。接下来，我就简要记录一下这篇文章的主要思想和作者对检测的思考，也加入我个人的理解。缘起为了推动计算机视觉领域的研究进展，斯坦福大学的 Li Feifei 组根据 wordnet 的思想，建立了一个包罗了近乎海量图片的数据库ImageNet 。在那个 SVM 还异常火热的

2018-03-09

8390

R-CNN 物体检测第二弹（Fast R-CNN）

神经网络机器学习人工智能深度学习编程算法

今天，重看了 R-CNN 的后续改进 Fast R-CNN（Arxiv版）-本文中提到的paper，若未特别指明，说的就是此版本。这里提一把辛酸泪。15年8月份到11月份，当时我参加了实验室和外面合作的一个项目。主要的工作就是在对方提供的航拍图像中，准确快速地检测出车辆等微小目标。大师兄作为该项目的实际负责人，他提出采用Fast R-CNN来进行检测，这也是我第一次听说R-CNN目标检测。在该项目中，我是负责coding的主代码手（就是拼接github上的Fast R-CNN代码），也参与目标boundi

2018-03-09

9820

可解释性与deep learning的发展

机器学习人工智能深度学习神经网络编程算法

大家好，我叫张拳石，UCLA博士后。目前在朱松纯老师的实验室，带领一个团队，做explainable AI方向。本文的题目有些大，这篇短文中，我只简单谈谈个人对deep learning发展状况的感受，和我最近的explanatory graph for CNNs和interpretable CNN两个研究课题。希望大家批评指正。当deep learning刚刚在CV圈子里面兴起的时候，我并没有第一时间给予足够的关注，直到几个月后，变革的巨浪拍下，旧方向消亡的速度和新技术诞生的节奏都大大超过我的预期。相信

2018-03-09

1K0

BAT机器学习面试1000题系列（第1~75题）

今17年，近期和团队整理BAT机器学习面试1000题系列，侧重机器学习、深度学习。我们将通过这个系列索引绝大部分机器学习和深度学习的笔试面试题、知识点，它将更是一个足够庞大的机器学习和深度学习面试库/知识库，通俗成体系且循序渐进。此外，有四点得强调下： 1、虽然本系列主要是机器学习、深度学习相关的考题，其他类型的题不多，但不代表应聘机器学习或深度学习的岗位时，公司或面试官就只问这两项，虽说是做数据或AI相关，但基本的语言（比如Python）、编码coding能力（对于开发，编码coding能力怎么强调都不

2018-03-09

2.2K0

BAT机器学习面试1000题系列（第76~149题）

76、看你是搞视觉的，熟悉哪些CV框架，顺带聊聊CV最近五年的发展史如何？深度学习 DL应用难原英文：adeshpande3.github.io 作者：Adit Deshpande，UCLA

2018-03-09

1.5K0

BAT机器学习面试1000题系列（第150~279题）

机器学习深度学习

长文~可先收藏再看哟~ 150、在感知机中（Perceptron）的任务顺序是什么？深度学习 DL基础易 1 随机初始化感知机的权重 2 去到数据集的下一批（batch） 3 如果预测值和输出不一致，则调整权重 4 对一个输入样本，计算输出值　　A. 1, 2, 3, 4 　　B. 4, 3, 2, 1 　　C. 3, 1, 2, 4 　　D. 1, 4, 3, 2 　　答案：（D） 151、假设你需要调整参数来最小化代价函数（cost function），会使用下列哪项技术？深度学习 DL基础易

2018-03-09

11K0

使用Python+Tensorflow的CNN技术快速识别验证码

python tensorflow 机器学习图像识别卷积神经网络

近年来，机器学习变得愈加火热，中国选手柯洁与AlphaGo的人机大战更是引起热议。目前，在图像识别和视觉分析研究中，卷积神经网络（CNN）技术的使用越来越多。Tensorflow 是由 Google 团队开发的神经网络模块，短短几年间，就已经有很多次版本的更新。最近我也在自学Tensorflow，想通过卷积神经网络快速识别整块验证码（不分割字符）。期间也碰到许多问题，诸如软件安装，Tensorflow版本差异等。一开始学习tensorflow是盲目的，不知如何下手，网上的资料都比较单一，为了回报社会，让大

2018-03-09

1.6K0

CNN 之物体检测篇

机器学习存储 https http 神经网络

RCNN Rich feature hierarchies for accurate object detection and semantic segmentation（https://arxiv.

2018-03-09

7890

Tensorflow on Spark爬坑指南

tensorflow spark 机器学习深度学习

由于机器学习和深度学习不断被炒热，Tensorflow作为Google家(Jeff Dean大神)推出的开源深度学习框架，也获得了很多关注。Tensorflow的灵活性很强，允许用户使用多台机器的多个设备(如不同的CPU和GPU)。但是由于Tensorflow 分布式的方式需要用户在客户端显示指定集群信息，另外需要手动拉起ps， worker等task. 对资源管理和使用上有诸多不便。因此，Yahoo开源了基于Spark的Tensorflow，使用executor执行worker和ps task. 项目地址

2018-03-09

1.5K0

第一章 | 使用python机器学习

python 机器学习

python经常作为机器学习的首选，有一个统计，50%以上的机器学习开发者使用python。在学习机器学习之前需要熟悉以下几个python模块： numpy Python没有提供数组，列表（List）可以完成数组，但不是真正的数组，当数据量增大时，它的速度很慢。所以Numpy扩展包提供了数组支持，同时很多高级扩展包依赖它。是以矩阵为基础的数学计算模块，纯数学。 SciPy SciPy是数学，科学和工程的开源软件。它包括用于统计，优化，集成，线性代数，傅里叶变换，信号和图像处理，ODE解算器等的模块。Sci

2018-03-09

8520

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态