首页
学习
活动
专区
工具
TVP
发布

鸿的学习笔记

专栏作者
330
文章
279501
阅读量
49
订阅数
2022 年值得关注的 7 大人工智能趋势
正如谷歌的CEO Sundar Pichai所言:AI will transform how we lead our lives and revamp many industries, including healthcare, education, and manufacturing.
哒呵呵
2022-03-11
4710
使用 SQL 也能玩转机器学习
最近看到一篇文章:https://rudderstack.com/blog/churn-prediction-with-bigqueryml,主要是讲使用 BigQueryML 进行流失预测。首先解释下 BigQueryML 是什么,简而言之,就是使用 SQL 也可以完成机器学习模型的构建。
哒呵呵
2021-11-02
6700
机器学习平台的演进史
机器学习平台的最大的驱动力应该是面向数据科学家的基于 Python 的开源技术生态系统的蓬勃发展,比如 scikit-learn、XGBoost 和 Tensorflow/PyTorch 等等。也是因为有了这些算法库的存在,让大部分人都可以使用算法去完成自己的想法,而不需要知道艰深的数学知识,也不需要知道算法的具体实现。
哒呵呵
2021-09-29
2.3K0
浅谈机器学习工程化
今天继续聊下机器学习工程化的问题。机器学习基本上已经成为大多数数据团队的标配,关于机器学习算法的内容,网上有很多,随便找找就可以了,有了TensorFlow、scikit-learn 这些 Python 工具后,甚至只要知道算法就行,至于实现也不需要关心了。但是在实际生产环境当中如何让机器学习产生其真正的价值还是一件比较复杂的事,就我接触和实践中看来有两个很重要的问题:
哒呵呵
2021-06-17
1.5K0
MLOps 的学习清单
先缅怀下袁隆平老先生。在我们这代人眼里,袁隆平老先生可能就是一个活着的传奇,所以在22号突然听到他离世的消息时,莫名的伤感,又一位人民英雄离我们远去了。
哒呵呵
2021-06-17
1.8K0
吴恩达谈 MLOps:调优数据比调优模型更重要
3月25日,吴恩达开了一个直播讲 A Chat with Andrew on MLOps: From Model-centric to Data-centric AI ,看完后深受启发,便随手写下一些笔记。
哒呵呵
2021-04-23
9970
2020年那些关于元数据的文章
2020 年是元数据管理兴起的一年。在 Datakin 你可以看到元数据管理的发展历史。在前人努力的基础上,Datakin 和其它的开源数据血缘以及架构软件,比如 Airflow,Amundsen,Datahub,dbt,Egeria,Great Expectations,Iceberg,Marquez,Pandas,Parquet,Prefect,Spark 和 Superset 宣布开放血缘(Open Lineage)倡议。
哒呵呵
2020-12-29
1.4K0
写在 Spark3.0 发布之后的一篇随笔
Spark3.0 从2019年开始就说要准备发布了,然后就一直期待这个版本,毕竟对于 Spark 而言,这是一个大版本的跨越,从 2.4 直接到了 3.0,而之前发布都是 Spark2.0 到 Spark2.4 这种小版本的更新。按照 Databricks 博客的说法,这是一次“the culmination of tremendous contributions from the open-source community”(是开源社区有史以来贡献力度最大的一次)。事实上也是如此,最近发布的 Spark3.0 新特性没有让人失望。
哒呵呵
2020-06-23
1.3K0
写在 Python 3.9 即将出世的前夕
今天读 PyCoder's Weekly( PyCoder's Weekly 会收集和整理一周内关于 Python 的最新文章和讨论,并发送给订阅者的邮箱)时候,发现 Python3.9 最新的版本3.9.0a5已经可以用了,有些感慨 Python3.8 还没用起来,Python3.9 就要来了,遂写下此文简单聊下 Python 这门语言。
哒呵呵
2020-05-12
5200
Rolling and Unrolling RNNs
当输入序列被馈送到这样的网络中时,向后的箭头在稍后的步骤将关于早先输入值的信息反馈回系统。我没有在上篇文章中描述的一件事是如何训练这样的网络。所以在这篇文章中,我想介绍一种训练RNN的方法,称为展开(unrolling)。
哒呵呵
2018-08-06
1.1K0
深度神经网络的实践效果分析
由于深度神经网络(DNN)作为计算机视觉领域的突出技术的出现,ImageNet分类在推进最新技术方面发挥了重要作用。 虽然准确度在稳定增加,但获胜模型的资源利用率没有得到适当考虑。 在这项工作中,我们提出了实际应用中的重要指标的全面分析:精度,内存占用,参数,操作计数,推理(inference)时间和功耗。 关键的结果是:(1)完全连接的层对于较小批量的图像是无效的; (2)准确性和推理时间呈双曲关系; (3)能量约束是最大可实现精度和模型复杂度的上限; (4)操作次数是推理时间的可靠估计。 我们相信,我们的分析提供了一组令人信服的信息,有助于设计和设计有效的DNN。
哒呵呵
2018-08-06
3590
神经网络结构(中)
革命在2015年12月到来,与Inceptionv3大约在同一时间。 ResNet有一个简单的想法:反馈两个连续的卷积层的输出,并且也绕过输入到下一层!
哒呵呵
2018-08-06
3210
神经网络结构(上)
深度神经网络和深度学习是很强大和流行的算法。他们的成功很大程度上在于神经网络架构的精心设计。所以我想重温过去几年深度学习的神经网络设计的历史。
哒呵呵
2018-08-06
4570
计算机基础小整理
一、CPU 在平时写的程序可以视为数据和指令的组合体,所有的程序都是copy了一份到内存中才能运行,内存地址是指在内存中保存命令和数据的场所,通过地址来标记和指定。地址是由一系列整数值构成。 程序员编写的程序会先转换成C系列语言,再编译转换成机器语言的exe文件,运行时再在内存中生成副本,由CPU解释并执行程序。 计算机现在的主流都是冯·诺伊曼结构,当然还有λ架构,神经网络架构等 CPU的组成: 寄存器:暂存指令,数据等处理对象 控制器:把内存上的指令读进寄存器,根据指令结果控制计算机 运算器:运算从内存读进去的数据 时钟:CPU开始计时的信号 内存是指计算机的主存储器,通过控制芯片等与CPU相连,负责存储指令和数据,每字节(一字节=8位)都有一个地址编号。 机器语言指令分为: 数据转送 运算 跳转 call/return 二、二进制小结 所有数据在计算机内部都是转成了二进制数据,计算机才不会管它是数值,文字还是图片。 二进制转十进制 int('11',2) Out[16]: 3 十进制转二进制 bin(10) Out[17]: '0b1010' 移位运算,先拿十进制,我们熟悉的做一个比方,例如:30 30 左移一位:300,扩大了十倍 右移一位:3,缩小了十倍 这就是移位的核心,移动几位,变大和减少的数值就是你所使用进制的基数,只不过二进制你要考虑到负数 具体看看: bin(39) Out[18]: '0b100111' bin(0b100111 >>1) Out[20]: '0b10011' 0b100111 >>1 Out[19]: 19 在二进制中表示负数,是用最高位作为符号位,0表示正数,1表示负数。 但是计算机在做减法运算时,实际上是加法运算,通过位溢出来处理,也就是取反加1 逻辑右移:移位后,在最高位补0 算术右移:移位后,在最高为补上原来的符号数 三、浮点数 先来看: sum = 0 for i in range(100): sum += 0.1 sum Out[28]: 9.99999999999998 是不是很奇怪? 这就牵扯到二进制表示小数了 例如二进制1011.0011怎么表示成十进制,就是小数点后面的位权改成1/2的倍数,结果就是11.1875 浮点数就是使用符号,尾数,基数和指数来表示小数 其实说到这里,大家应该明白为啥浮点数会出错了吧。 各个语言都有自己的机制去解决这个问题 四、内存概论 数据类型:存储在内存的大小和和该区域的数据类型 内存实际上一个内存IC,IC引脚的开关表示着0和1,通过地址去确定这些IC。 磁盘缓存:将磁盘一部分数据读进内存 虚拟内存:把磁盘的一部分作为内存使用。把实际内存的内容和磁盘上的虚拟内存的内容进行部分置换,同时运行程序。 有两种方式:分页和分段 windows采取的是分页式,在不考虑程序的构造的情况,把运行的程序按照一定大小的页进行分割,以页为单位在内存和磁盘中置换。 五、压缩数据 文件就是字节数据的集合 RLE算法: 使用字符*重复次数进行压缩。 哈夫曼算法: 多次出现的数据用小于8位的,不常用的数据用多于8位的表示 哈夫曼树解决分隔符问题: 按出现的频率排序,以两个最小的数拉出一条线枝干,左边是0,右边是1,以此类推
哒呵呵
2018-08-06
3960
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档