首页
学习
活动
专区
工具
TVP
发布

月色的自留地

专栏作者
113
文章
208702
阅读量
65
订阅数
梯度下降法基本推导--机器学习最基本的起点
仍然是一篇入门文,用以补充以前文章中都有意略过的部分。 之前的系列中,我们期望对数学并没有特别喜好的程序员,也可以从事人工智能应用的开发。但走到比较深入之后,基本的数学知识,还是没办法躲过的。
俺踏月色而来
2019-06-22
8830
TensorFlow从1到2(十二)生成对抗网络GAN和图片自动生成
上一篇中介绍的VAE自动编码器具备了一定程度的创造特征,能够“无中生有”的由一组随机数向量生成手写字符的图片。 这个“创造能力”我们在模型中分为编码器和解码器两个部分。其能力来源实际上是大量样本经过学习编码后,在数字层面对编码结果进行微调,再解码生成图片的过程。所生成的图片,是对原样本图的某种变形模仿。
俺踏月色而来
2019-05-15
1.1K0
TensorFlow从1到2(十)带注意力机制的神经网络机器翻译
机器翻译和语音识别是最早开展的两项人工智能研究。今天也取得了最显著的商业成果。 早先的机器翻译实际脱胎于电子词典,能力更擅长于词或者短语的翻译。那时候的翻译通常会将一句话打断为一系列的片段,随后通过复杂的程序逻辑对每一个片段进行翻译,最终组合在一起。所得到的翻译结果应当说似是而非,最大的问题是可读性和连贯性非常差。 实际从机器学习的观点来讲,这种翻译方式,也不符合人类在做语言翻译时所做的动作。其实以神经网络为代表的机器学习,更多的都是在“模仿”人类的行为习惯。 一名职业翻译通常是这样做:首先完整听懂要翻译的语句,将语义充分理解,随后把理解到的内容,用目标语言复述出来。 而现在的机器翻译,也正是这样做的,谷歌的seq2seq是这一模式的开创者。 如果用计算机科学的语言来说,这一过程很像一个编解码过程。原始的语句进入编码器,得到一组用于代表原始语句“内涵”的数组。这些数组中的数字就是原始语句所代表的含义,只是这个含义人类无法读懂,是需要由神经网络模型去理解的。随后解码过程,将“有含义的数字”解码为对应的目标语言。从而完成整个翻译过程。这样的得到的翻译结果,非常流畅,具有更好的可读性。
俺踏月色而来
2019-05-14
6940
TensorFlow从1到2(九)迁移学习
迁移学习是这两年比较火的一个话题,主要原因是在当前的机器学习中,样本数据的获取是成本最高的一块。而迁移学习可以有效的把原有的学习经验(对于模型就是模型本身及其训练好的权重值)带入到新的领域,从而不需要过多的样本数据,也能达到大批量数据所达成的效果,进一步节省了学习的计算量和时间。
俺踏月色而来
2019-05-10
1.8K0
TensorFlow从1到2(六)结构化数据预处理和心脏病预测
前面所展示的一些示例已经很让人兴奋。但从总体看,数据类型还是比较单一的,比如图片,比如文本。 这个单一并非指数据的类型单一,而是指数据组成的每一部分,在模型中对于结果预测的影响基本是一致的。 更通俗一点说,比如在手写数字识别的案例中,图片坐标(10,10)的点、(14,14)的点、(20,20)的点,对于最终的识别结果的影响,基本是同一个维度。 再比如在影评中,第10个单词、第20个单词、第30个单词,对于最终结果的影响,也在同一个维度。 是的,这里指的是数据在维度上的不同。在某些问题中,数据集中的不同数据,对于结果的影响维度完全不同。这是数据所代表的属性意义不同所决定的。这种情况在《从锅炉工到AI专家(2)》一文中我们做了简单描述,并讲述了使用规范化数据的方式在保持数据内涵的同时降低数据取值范围差异对于最终结果的负面影响。 随着机器学习应用范围的拓展,不同行业的不同问题,让此类情况出现的越加频繁。特别是在与大数据相连接的商业智能范畴,数据的来源、类型、维度,区别都很大。 在此我们使用心脏病预测的案例,对结构化数据的预处理做一个分享。
俺踏月色而来
2019-05-07
1K0
OpenProject基础使用介绍
        所有的活动都可以看做一个项目来管理。在企业中更是这样。   所以项目管理平台,对于任何一个高科技企业来讲都是必不可少的。   OpenProject(以下简称OP)就是一个不错的项目管理平台,软件开源,文档齐备。对于大多中小型公司来讲,免费版也已经足以满足工作要求。最新版本的OP还对手机小屏幕的浏览进行了优化,完全可以做到使用手机对项目进行管理。
俺踏月色而来
2018-08-31
8.7K0
三种方式给apt设置代理
有很多第三方工具可以用,比如proxychains,非常好用,不过今天这不是正题。因为有可能没有代理,上网你都做不到,更别提下载软件了。想一想方法还是告诉你,免得你万一必须用:sudo apt install proxychains
俺踏月色而来
2018-08-02
1.2K0
就算会用python画颗心,可你依然还是只单身狗
:) 标题是开玩笑的,千万别认真。 随着AI的飞速发展,有志于此行的码农也是急剧的增加,带来的就是大家对算法、数学的兴趣也格外升高。 本文的来历是这样,今天某老同事在朋友圈发了一张屏拍,求公式。 看了一下还是难度不大,上半部分基本是两个半圆,下半部分是两个旋转了的反余弦函数。 不过我的数学也比较渣,看到这个步骤后面也就倒腾不清了,不过到这种程度在互联网上搜一搜找到答案还是不难的,很快就找到了正确的公式(以y=0为界限,肯定是需要两组解): $$ y = \sqrt{1-(\lef
俺踏月色而来
2018-06-21
6220
《连连看》算法c语言演示(自动连连看)
(图片是游戏的示意图,来自互联网,与本文程序无关) 看题目就知道是写给初学者的,没需要的就别看了,自己都觉得怪无聊的。 很多游戏的耐玩性都来自精巧的算法,特别是人工智能的水平。比如前几天看了著名的Alpha GO的算法,用了复杂的人工智能网络。而最简单的,可能就是连连看了,所以很多老师留作业,直接就是实现连连看。 连连看游戏的规则非常简单: 两个图片相同。 两个图片之间,沿着相邻的格子画线,中间不能有障碍物。 画线中间最多允许2个转折。 所以算法主要是这样几部分: 用数据结构描述图板。很简单,一个2
俺踏月色而来
2018-06-21
2.8K0
从锅炉工到AI专家(9)
无监督学习 前面已经说过了无监督学习的概念。无监督学习在实际的工作中应用还是比较多见的。 从典型的应用上说,监督学习比较多用在“分类”上,利用给定的数据,做出一个决策,这个决策在有限的给定可能性中选择其中一种。各类识别、自动驾驶等都属于这一类。 无监督学习则是“聚类”,算法自行寻找输入数据集的规律,并把它们按照规律分别组合,同样特征的放到一个类群。像自然语言理解、推荐算法、数据画像等,都属于这类(实际实现中还是比较多用半监督学习,但最早概念的导入还是属于无监督学习)。 无监督学习的确是没有人工的标注,
俺踏月色而来
2018-06-20
5780
从锅炉工到AI专家(10)
RNN循环神经网络(Recurrent Neural Network) 如同word2vec中提到的,很多数据的原型,前后之间是存在关联性的。关联性的打破必然造成关键指征的丢失,从而在后续的训练和预测流程中降低准确率。 除了提过的自然语言处理(NLP)领域,自动驾驶前一时间点的雷达扫描数据跟后一时间点的扫描数据、音乐旋律的时间性、股票前一天跟后一天的数据,都属于这类的典型案例。 因此在传统的神经网络中,每一个节点,如果把上一次的运算结果记录下来,在下一次数据处理的时候,跟上一次的运算结果结合在一起混合运
俺踏月色而来
2018-06-20
6640
从锅炉工到AI专家(11)(END)
语音识别 TensorFlow 1.x中提供了一个语音识别的例子speech_commands,用于识别常用的命令词汇,实现对设备的语音控制。speech_commands是一个很成熟的语音识别原型,有很高的正确率,除了提供python的完整源码,还提供了c/c++的示例程序,方便你移植到嵌入设备及移动设备中去。 官方提供了关于这个示例的语音识别教程。不过实际就是一个使用说明,没有对代码和原理做过多解释。 这个程序相对前面的例子复杂了很多,整体结构、代码、算法都可以当做范本,我觉得我已经没有资格象前面的
俺踏月色而来
2018-06-20
6450
K60平台智能车开发工作随手记
(图片仅为示例,并不一定固定为这种造型) 第十二届全国大学生智能汽车竞赛有一个分项是光电四轮车的竞速(任务A),Seven她们组采购到的配件使用了freescale Crotex-M4内核的CPU,TSL1401 CCD摄像头进行道路识别,从网上搜索了一下,应当是K60平台的的一个变种方案。 这个方案基本平台使用IAR系统开发编译、调试及烧录。IAR其实是一个很昂贵的系统,还好这次真的是纯粹的教学需求,经由《计算机软件保护条例》第十七条的豁免说明,这次用一下破解版。 原厂提供的DEMO程序没有考察所
俺踏月色而来
2018-06-20
9510
苹果手机上下载的文件在哪里?
(图文无关) 昨天在微信收到一个大文件,73M,突然意识到,微信升级,终于冲过了30M的文件传输限制。接下来的问题,这是一个开发工程文件,要在电脑开发环境使用,怎么把这个文件传输到电脑? 正常的方式是在电脑登陆电脑版微信,然后手机上转发到“文件传输助手”,电脑上就可以收到,然后重新下载。------不过这里有两个小障碍,如果这时候没有外网怎么办?如果网速很慢怎么办?如果是规范的文件,比如视频,比如图片,还可以用苹果的airdrop技术快速的传出来,对了,IOS11的airdrop已经有了中文名,叫“隔
俺踏月色而来
2018-06-20
2.2K0
从锅炉工到AI专家(1)
序言 标题来自一个很著名的梗,起因是知乎上一个问题:《锅炉设计转行 AI,可行吗?》,后来就延展出了很多类似的问句,什么“快递转行AI可行吗?”、“xxx转行AI在线等挺急的”诸如此类。 其实知乎原文是个很严肃的问题,很多回答都详尽、切题的给出了可行的方案。AI的门槛没有很多人想象的那么高,关键在于你是满足于只是看几个概念就惊呼“人工智能将颠覆xxxx行业,xxxx人将失去工作”、“人工智能将会毁灭人类”,还是你真的打算沉下心来学一些人工智能的知识,学习用另外一种方法和视角了解这个世界。 所以本文其实也
俺踏月色而来
2018-06-20
7860
从锅炉工到AI专家(2)
大数据 上一节说到,大多的AI问题,会有很多个变量,这里深入的解释一下这个问题。 比如说某个网站要做用户行为分析,从而指导网站建设的改进。通常而言如果没有行为分析,并不需要采集用户太多的数据。 比如用户注册,最少只需要用户名、用户密码就够了。随后比如为了当用户过生日的时候,自动给用户发送一封贺卡(潜台词,我们可能需要给用户推送广告),我们再增加两项生日日期和邮箱地址。再下来国家规定网站注册必须实名制,我们可能又增加了用户姓名和身份证号码,可能还需要增加用户手机号码,用于同移动通信部门打通,验证用户实名制
俺踏月色而来
2018-06-20
4510
从锅炉工到AI专家(4)
手写数字识别问题 图像识别是深度学习众多主流应用之一,手写数字识别则是图像识别范畴简化版的入门学习经典案例。在TensorFlow的官方文档中,把手写数字识别“MNIST”案例称为机器学习项目的“Hello World”。从这个案例开始,我们的连载才开始有了一些“人工智能”的感觉。 问题的描述是这样: 有一批手写数字的图片,对应数字0-9。通过机器学习的算法,将这些图片对应到文本字符0-9。用通俗的话来说,就是计算机认出了图片上面手写的数字。 从问题描述可见这个机器学习项目的“Hello World”
俺踏月色而来
2018-06-20
6470
从锅炉工到AI专家(5)
图像识别基本原理 从上一篇开始,我们终于进入到了TensorFlow机器学习的世界。采用第一个分类算法进行手写数字识别得到了一个91%左右的识别率结果,进展可喜,但成绩尚不能令人满意。 结果不满意的原因,当然还是算法太简单了。尽管我们都已经接受了“所有问题都可以用数学公式来描述”这个观点,但直接把一幅图片展开的784个数字作为方程式参数进行一个线性运算+非线性分类器就叫做“人工智能”怎么都感觉那么不靠谱...至于能得到91%不高的识别率,从这个意义上说,似乎都令人有点不太相信。这个不相信不是指91%太低了
俺踏月色而来
2018-06-20
6912
从锅炉工到AI专家(6)
欠拟合和过拟合 几乎所有的复杂方程都存在结果跟预期差异的情况,越复杂的方程,这种情况就越严重。这里面通常都是算法造成的,当然也存在数据集的个体差异问题。 所以”欠拟合“和”过拟合“是机器学习过程中重
俺踏月色而来
2018-06-20
4810
从锅炉工到AI专家(7)
说说计划 不知不觉写到了第七篇,理一下思路: 学会基本的概念,了解什么是什么不是,当前的位置在哪,要去哪。这是第一篇希望做到的。同时第一篇和第二篇的开始部分,非常谨慎的考虑了非IT专业的读者。希望借此沟通技术人员和产品人员,甚至管理和销售人员。我信服“上下同欲者胜”,所以也非常害怕因为大家对概念完全不同的理解而影响到团队的合作。 从最简单的部分入手,由概念到代码,完成技术破冰。这是第二、三篇希望做到的。 逐步迭代,从简单概念到复杂概念,从简单算法到复杂算法,接触到机器学习现实最常用的技术。这是四、五、六篇希
俺踏月色而来
2018-06-20
5690
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档