前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一周AI最火论文 | 一种基于YOLOv3的算法,可以对车辆、驾驶员进行检测和分类

一周AI最火论文 | 一种基于YOLOv3的算法,可以对车辆、驾驶员进行检测和分类

作者头像
大数据文摘
发布2020-04-16 17:12:22
6380
发布2020-04-16 17:12:22
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘专栏作品

作者:Christopher Dossman

编译:Olivia、Junefish、Andy

呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。

每周更新,做AI科研,每周从这一篇开始就够啦!

本周关键词:TransformerYOLOv3

本周最火学术研究

更小更快的Transformer模型

在本文中,卡塔尔计算机研究所的研究人员提出了几种层修剪策略,这些策略不需要训练新模型,可以直接应用于预先训练的模型。研究结果表明,最佳修剪策略可将模型大小减少40%,将推理时间减少50%,同时在BERT,XLNet和RoBERTa等知名体系结构中保持98.2%的原始精度。

精简的BERT模型和RoBERTa模型在GLUE性能,微调时间和推理时间方面分别达到了与DistilBERT和DistilRoBERTa相当的结果。但是,与DistilBERT和DistilRoBERTa不同,前者所提出的方法不需要进行既浪费时间又占用大量内存的重新训练,此外,该方法还可以在精度和模型尺寸之间进行权衡。

获取代码:

https://github.com/hsajjad/transformers

阅读更多:

https://arxiv.org/abs/2004.03844v1

基于机器学习的智能医疗监控框架

一组IEEE研究人员最近提出了一种用于智能健康监控的新框架。该算法采用了压缩感知法,以及基于最新机器学习的降噪器与交替方向乘子法的组合。

作为监视方案的一部分,这种有效的智能健康监控框架还利用经过训练的二进制卷积神经网络分类器作为跌落动作分类器。与传统方法相比,结果表明该方法有着显著的网络参数影响与性能提升。

阅读更多:

https://arxiv.org/abs/2004.03360v1

改进智能交通系统中的YOLOv3对象分类

研究人员提出了一种基于YOLOv3的算法,该算法旨在实现对高速公路上的车辆,驾驶员和其他人员的检测和分类,从而达到区分驾驶员和乘客的目的,并形成车辆与驾驶员之间的一一对应关系。

该模型和对照实验是在自建交通驾驶员面部数据库上进行的。该算法的有效性通过广泛的实验与各种复杂的公路条件得到了验证。与其他先进的车辆和驾驶员检测技术相比,该模型具有良好的性能,并且对于路障,不同的姿态和极端的光照具有鲁棒性。

阅读更多:

https://arxiv.org/abs/2004.03948v1

用于视频识别的有效扩展架构

从2D图像架构到时空的拓展很大程度上推动了用于视频识别的神经网络的发展。本文介绍了一个有效的视频网络族X3D,它沿空间、时间、宽度和深度等多个网络轴逐步扩展了一个微小的2D图像分类架构。在实现与先前工作相似性能的同时,X3D使用的乘法加法和参数减少了4.8倍和5.5倍,使其跻身当前最优。

值得细品的是,研究发现具有细通道尺寸和高时空分辨率的网络可以有效地用于视频识别。研究人员希望,高效的X3D能成为视频识别发展的有效推动力。

Github传送门:

https://github.com/facebookresearch/SlowFast

原文:

https://arxiv.org/abs/2004.04730v1

用于机器学习和数据探索的拓扑数据分析工具包

本文提供了一个Python库giotto-tda,该库通过一个scikit-learn兼容的API和最新的C++实现集成了高性能的拓扑数据分析(TDA)和机器学习(ML)。giotto-tda旨在提供一种在大规模ML任务中使用TDA的形式,使研究领域和数据科学界都能受益。

该库具备广泛的预处理技术使其具有处理各类数据的能力,而直观的绘图API为其重点关注的数据探索及可解释性助力不少。

研究人员已经根据scikit-learn的代码和文档标准编写了giotto-tda,未来他们将对现有的C++代码进行性能优化,并会加入新型TDA算法(比如持久性Steenrod图)的首次实现。

Github传送门:

https://github.com/giotto-ai/giotto-tda

原文:

https://arxiv.org/abs/2004.02551v1

其他爆款论文

机器学习中的偏差及影响:

https://arxiv.org/abs/2004.00686v1

一种深度学习框架,为消防员提供实时信息来提高消防能力:

https://arxiv.org/abs/1910.03617v2

一种多人绝对3D姿态估计算法:

https://arxiv.org/abs/2004.03989v1

使用机器学习检测并分离咳嗽和其他疾病:

https://arxiv.org/abs/2004.01495v1

ML和DL进行船只行为和异常检测中的挑战:

https://arxiv.org/abs/2004.03722v1

AI大事件

一个小队的48小时COVID-19 Hackathon诠释了小而充满激情的团队力量、考虑周全的领导才能以及技术能为人类带来的最好的东西:

https://www.zdnet.com/article/brilliant-one-teams-48-hour-covid-19-hackathon/

免费的Python书来一打:

https://www.programmer-books.com/tag/free-python-books/

Google Cloud推出新的AI聊天机器人以获取COVID-19信息:

https://www.techrepublic.com/article/google-cloud-launches-new-ai-chatbot-for-covid-19-information/

专栏作者介绍

Christopher Dossman是Wonder Technologies的首席数据科学家,在北京生活5年。他是深度学习系统部署方面的专家,在开发新的AI产品方面拥有丰富的经验。除了卓越的工程经验,他还教授了1000名学生了解深度学习基础。

LinkedIn:

https://www.linkedin.com/in/christopherdossman/

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档