首页
学习
活动
专区
工具
TVP
发布

机器学习爱好者社区

专栏作者
84
文章
85373
阅读量
14
订阅数
结构最清晰的Yolov3 head和loss实现完全解析
本文从head和loss出发,对mmdetection复现的Yolo v3 进行解析,文章梳理了整个训练的流程并head和loss的部分进行了大篇幅的讲解。
lujohn3li
2021-06-10
7250
周末重温——TensorFlow之参数初始化
CNN中最重要的就是参数了,包括W和b。训练CNN的最终目的就是得到最好的参数,使得目标函数取得最小值。参数的初始化也同样重要,因此微调受到很多人的重视。tf提供的所有初始化方法都定义在tensorflow/python/ops/init_ops.py。
lujohn3li
2021-06-10
9940
Google AI提出MLP-Mixer:只需MLP就在ImageNet达到SOTA!
近日,Google AI又发布了一篇与ViT一样的重磅级论文:MLP-Mixer: An all-MLP Architecture for Vision。这篇论文提出的Mixer模型仅包含最简单的MLP结构就能在ImageNet上达到SOTA。那么MLP其实是两层FC层,这不禁让人感叹:
lujohn3li
2021-06-10
6410
腾讯优图提出ISTR:基于transformer的端到端实例分割!性能SOTA,代码已开源!
近日,厦门大学和腾讯优图联合发布了一种基于transformer的端到端的实例分割方法ISTR:
lujohn3li
2021-05-11
1.2K0
【留言送书】跟我一起从源码学习Transformer!
近几年NLP领域有了突飞猛进的发展,预训练模型功不可没。当前利用预训练模型(pretrain models)在下游任务中进行fine-tune,已经成为了大部分NLP任务的固定范式。Transformer摒弃了RNN的序列结构,完全采用attention和全连接,严格来说不属于预训练模型。但它却是当前几乎所有pretrain models的基本结构,为pretrain models打下了坚实的基础,并逐步发展出了transformer-XL,reformer等优化架构。本文结合论文和源码,对transformer基本结构,进行详细分析。
lujohn3li
2021-01-12
4830
CNN:我不是你想的那样
每当我们训练完一个CNN模型进行推理时候,一旦出现人类无法解释的现象就立刻指责CNN垃圾,说这都学不会?其实你可能冤枉它了,而本文试图为它进行辩护。
lujohn3li
2020-11-30
5700
语义分割之Dice Loss深度分析
Dice Loss 来自文章VNet(V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation),旨在应对语义分割中正负样本强烈不平衡的场景。本文通过理论推导和实验验证的方式对dice loss进行解析,帮助大家去更好的理解和使用。
lujohn3li
2020-08-25
2.5K0
迁移学习 Transfer Learning
在上次的动画简介中, 我们大概了解了一些迁移学习的原理和为什么要使用迁移学习. 如果用一句话来概括迁移学习, 那务必就是:“为了偷懒, 在训练好了的模型上接着训练其他内容, 充分使用原模型的理解力”.有时候也是为了避免再次花费特别长的时间重复训练大型模型.
lujohn3li
2020-04-01
4300
最小二乘法小结
最小二乘法是用来做函数拟合或者求函数极值的方法。在机器学习,尤其是回归模型中,经常可以看到最小二乘法的身影,这里就对我对最小二乘法的认知做一个小结。
lujohn3li
2020-03-31
7100
2020人工智能全球女性榜发布,致敬这些杰出的女科学家
2020年3月8日,在这个一年一度的妇女节,北京智源人工智能研究院、清华大学 - 中国工程院知识智能联合研究中心、清华大学人工智能研究院,共同发布代表全球人工智能学科最有影响力、最具活力的女性学者榜单——Women in AI 2020。在我们统计的2000位人工智能最具影响力AI学者中,有179位是女性学者,比例为9%。
lujohn3li
2020-03-12
6700
【原创】大结局!scikit-learn 支持向量机算法库使用小结-3.9
scikit-learn中SVM的算法库分为两类,一类是分类的算法库,包括SVC, NuSVC,和LinearSVC 3个类。另一类是回归算法库,包括SVR, NuSVR,和LinearSVR 3个类。相关的类都包裹在sklearn.svm模块之中。
lujohn3li
2020-03-11
4970
【干货】支持向量机原理(四)SMO算法原理
上面这个优化式子比较复杂,里面有m个变量组成的向量需要在目标函数极小化的时候求出。直接优化时很难的。SMO算法则采用了一种启发式的方法。它每次只优化两个变量,将其他的变量都视为常数。由于.假如将 固定,那么之间的关系也确定了。这样SMO算法将一个复杂的优化算法转化为一个比较简单的两变量优化问题。
lujohn3li
2020-03-09
9490
【原创】支持向量机原理(一) 线性支持向量机
支持向量机(Support Vecor Machine,以下简称SVM)虽然诞生只有短短的二十多年,但是自一诞生便由于它良好的分类性能席卷了机器学习领域,并牢牢压制了神经网络领域好多年。如果不考虑集成学习的算法,不考虑特定的训练数据集,在分类算法中的表现SVM说是排第一估计是没有什么异议的。
lujohn3li
2020-03-05
8990
【原创】机器学习从零开始系列连载(6)—— Additive Tree 模型
Additive tree models (ATMs)是指基础模型是树形结构的一类融合模型,可做分类、回归,很多经典的模型可以被看做ATM模型,比如Random forest 、Adaboost with trees、GBDT等。
lujohn3li
2020-03-04
8940
【Python】Python到底能干啥?
但是慢慢静下心来思考,我发现Python主要有三个方面的应用,今天就让我们一起来讨论一下吧:
lujohn3li
2020-03-04
5970
机器学习原来这么有趣!【第一章】
你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!
lujohn3li
2020-03-04
4230
机器学习从零开始系列连载(1)——基本概念
2.5.3 Gradient Boosting Decision Tree
lujohn3li
2020-03-03
2740
【热点】AI的25种可能,就是人类的25种未来
内容来源:本文摘编湛庐文化出品书籍《AI的25种可能》书评文章,本书作者约翰.布罗克曼(John Brockman) 。
lujohn3li
2020-03-03
4260
思考了很久才写下了这篇:深度神经网络
深度学习是基于多层神经网络的一种对数据进行自动表征学习的框架,能使人逐步摆脱传统的人工特征提取过程,它的基础之一是distributed representation,读论文时注意以下概念区分:
lujohn3li
2020-03-03
3930
【集成电路】零基础让普通MCU跑人工智能!法国AI创企开发无监督学习软件系统
2月27日消息,电气和电子工程师协会(IEEE)在其官网分享了一家名为Cartesiam的法国B2B软件开发公司的研发成果,该公司创立于2016年,主要面向人工智能(AI)研发嵌入式系统,让普通的Arm微控制器都能运行无监督学习AI。
lujohn3li
2020-03-03
5150
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档