图片来自 Pixabay, 作者:seth0s
打算每周整理下这周看过觉得不错的文章,主要是机器学习、深度学习、Python编程方向的,包括但不局限于论文、综述、有趣的项目以及工具教程推荐,目前这个系列的名字还没想好,就先这样命名吧
这周时间是 6 月 24 日到 6 月 29 日看到的一些文章,总共是 13 篇文章,涉及的领域是:
部分文章是有完整看完的,部分是觉得不错,可以收藏看看的。
这周看到几篇不同方向的综述、论文介绍文章:
多标签图像分类是指每张图片不只有一个标签,以前比较常见的图像分类,其实都属于单标签,比如鸟类识别,每张图片仅有一个标签就是类别,而多标签,就不仅仅有类别,可能还有鸟的羽毛颜色、鸟嘴是短还是长、尾巴颜色等等,另一种多标签图分类的情况则是一张图片包含多个类别,比如下面这张图片就包含了电脑、手机、眼睛、鼠标、水杯等等几个类别。
事实上,现实生活中的图片中往往包含多个类别的物体,这也更加符合人的认知习惯,文章主要从以下几个方面进行介绍:
目标检测是计算机视觉里面最热门的一个大方向了,这篇文章先介绍了常用的主流的目标检测算法:
最后推荐了一些知乎、公众号以及博客。
感觉这篇文章是非常适合入门,想了解目标检测的同学看看和学习,毕竟目前最常用的主流的目标检测算法都有介绍。
3. Cascade R-CNN升级!目标检测制霸COCO,实例分割超越Mask R-CNN
一篇新的论文“Cascade R-CNN: High Quality Object Detection and Instance Segmentation”,来自目标检测算法 Cascade R-CNN 作者,他对 Cascade R-CNN 算法进行扩展应用于实例分割。
Cascade R-CNN 是在 2017 年末提出的一个目标检测算法,并且被 CVPR 2018 录用,曾经长时间占据 COCO 检测数据集精度榜首。
这篇新的论文已经开源代码了,其论文和代码地址如下
论文地址:
https://arxiv.org/abs/1906.09756v1
代码地址:
https://github.com/zhaoweicai/cascade-rcnn(Caffe版)
代码地址:
https://github.com/zhaoweicai/Detectron-Cascade-RCNN(Detectron版)
attention,也就是注意力机制,也是最近几年深度学习出现比较多的一个技术,不仅在图像方面有应用,在 NLP 方面也有应用,这篇就详细介绍了在 NLP 方面的注意力机制。
这篇文章主要是介绍 NLP 方向利用到 Embedding 的论文,包括在 Word2vec基础、衍生及应用、Graph Embedding 方向的 10 篇论文。
当然,图像方面也会用到 Embedding 的技术,比如人脸识别、图像搜索方面。
6. 如何区分并记住常见的几种 Normalization 算法
从 BatchNormalization 算法开始,后续逐渐有了更多的归一化算法,这篇文章主要介绍了四种:
这些归一化算法的主要区别在于操作的 feature map 维度不同。
文章结合了 Pytorch 代码,介绍它们具体的操作,最后给出一个非常形象的类比:
这摞书总共有 N 本,每本有 C 页,每页有 H 行,每行 W 个字符。 计算均值时 BN 相当于把这些书按页码一一对应地加起来(例如:第1本书第36页,加第2本书第36页……),再除以每个页码下的字符总数:N×H×W,因此可以把 BN 看成求“平均书”的操作(注意这个“平均书”每页只有一个字) LN 相当于把每一本书的所有字加起来,再除以这本书的字符总数:C×H×W,即求整本书的“平均字” IN 相当于把一页书中所有字加起来,再除以该页的总字数:H×W,即求每页书的“平均字” GN 相当于把一本 C 页的书平均分成 G 份,每份成为有 C/G 页的小册子,对这个 C/G 页的小册子,求每个小册子的“平均字”
MobieNet 的第一次提出是谷歌在 2017 提出来的,其目标就是设计一个可以在移动设备上使用的神经网络,也就是速度需要足够快,也就是计算量要小,而 MobieNet 的做法,其实就是将 VGG中的标准卷积层换成深度可分离卷积,更详细的可以阅读这篇文章。
V1 到 V3 版本的 MobieNet 论文分别如下
其中 V3 版本是 2019 年 3月提出的,并且用到了神经网络结构搜索(NAS)技术,当然我其实没有了解这方面的内容,不过,最近也看到 medium 上有一篇文章介绍这个技术,感兴趣的可以查看下,不过需要访问外国网站:
深度学习的未来:神经架构搜索(NAS)
AlphaGo 里面就采用了强化学习的方法,不过目前这个方向其实还不是很成熟,据我了解的主要应用方向应该是在机器人、游戏这几个方面,想了解和学习强化学习的,可以看看这篇文章。
这篇文章根据 Python 学习者的阶段分别推荐了不同的资源:
其中高级玩家推荐的就包括机器学习和深度学习方面的教程, 比如吴恩达老师的 deeplearning.ai 课程,fast.ai 课程等,最后还有一些用于练习 Python 的资源,包括介绍在 Kaggle 上的数据集,一些面试题目等。
这篇文章,建议如果是初学者,先在初学者的资料里面找一份好好学习,入门之后,而进阶者部分的资源
字符串是 Python 非常常用的数据类型了,这篇文章介绍了以下几个方面的字符串处理方法:
拼接、拆分、判断首尾字母、删除,这些都是非常常见的操作,建议阅读并手动练习一下,收藏。
11. Python批量下载无版权图片
这篇介绍如何下载 pixabay 网站上的图片,因为这是国外的网站,浏览时候加载图片速度会非常慢,因此作者干脆写了一个爬虫来爬取图片到本地,随时进行浏览,感兴趣的可以查看,并且作者也分享了代码。
这篇主要推荐一些对新手友好,可以即食即用的 Github 项目,包括:
13. 编程神器 Mac 实用配置
这篇文章记录 MacBook 整个配置过程,供新入手MacBook和觉得MacBook比较难用的同学参考,主要分为以下几个方面介绍: