原文 https://engineering.linkedin.com/blog/2019/alternative-text-descriptions
摘要:本篇从理论到实践分享了基于PoseNet算法的人体姿势相似度识别项目。首先介绍了项目背景,因为部门搞活动需要大家去模仿夸张搞笑的表情和姿势来提升活动的可玩性,所以需要利用CV算法对图片进行相似度打分;然后详细讲解了人体姿势相似度识别算法,主要包括基于PoseNet算法来识别姿势和计算姿势相似度两个流程;最后基于已有的开源项目进行二次开发实现了人体姿势相似度识别项目。对于以前从未接触过CV项目的我来说既是挑战也是契机。因为之前主要做NLP相关的项目,而实际业务场景中经常会有NLP和CV交叉相关的项目,所以就需要对CV也有一定的了解。通过这个项目相当于慢慢入了CV的门,最终的目标是不变的,将更多更好的机器学习算法落地到实际业务产生更多的价值。
机器之心报道 编辑:陈 近日,来自谷歌的研究者更新了用于实时姿态检测的项目,该项目包含 3 种 SOTA 模型,其中 MoveNet 模型可检测人体 17 个关键点、并以 50+ fps 在电脑和手机端运行;BlazePose 可检测人体 33 个关键点;PoseNet 可以检测人体多个姿态,每个姿态包含 17 个关键点。 不久之前谷歌研究院推出了最新的姿态检测模型 MoveNet,并在 TensorFlow.js 中推出了新的姿态检测 API,该模型可以非常快速、准确地检测人体的 17 个关键节点。这一
选自TensorFlow Blog 机器之心编译 参与:王淑婷、路 TensorFlow 近日发布 TensorFlow.js 版本 PoseNet,该版本 PoseNet 只要电脑或手机配备了适当的网络摄像头,就可以直接在网页浏览器中进行体验。该模型源代码已开放,Javascript 开发者只需几行代码就可以修补和使用该技术。 通过与谷歌创意实验室合作,TensorFlow 近日发布了 TensorFlow.js 版的 PoseNet。这是一款机器学习模型,可以在浏览器中实时估计人体姿态。 模型 Demo
新发现、新理论的研究论文发表数量呈指数型增长,并且论文被引用量(H-index)通常被学术界衡量论文的影响力贡献程度。然而,随着学术界的竞争越来越激烈,部分期刊中出现了一种“强制引用”的情况,也是就论文作者需要引用该期刊的相关文章,以提高期刊的影响因子。这些行为是对任何科学家和技术人员所要求的最高诚信的冒犯,并且如果任其发展,可能会破坏公众的信任并阻碍科学技术的未来发展。该竞赛是该系列竞赛中的第一场竞赛,探讨了网络搜索和数据挖掘技术在多大程度上可以用来区分多余的引文和真实的引用识别。赛题详解可参考:https://biendata.com/competition/wsdm2020/
由 LeCun 和 Bengio 等人联合发起的深度学习顶会 ICLR,今年你投稿了吗?
与谷歌创意实验室合作,我很高兴地宣布发布TensorFlow.js版本的PoseNet,这是一种机器学习模型,允许在浏览器中进行实时人体姿势估计。您可以访问https://storage.googleapis.com/tfjs-models/demos/posenet/camera.html 尝试一下在线演示。
作者 | Eileen Mao和Tanjin Prity,谷歌工程实习生,2019年夏季发布。
使用精度和召回率评估目标检测模型可以为模型在不同置信度下的表现提供有价值的见解。类似地,F1分数在确定平衡给定模型的精度和查全率值的最佳置信度时特别有用;但是,该值跨越了从0到1的置信值域。单个值评估指标可以从一个给定模型的F1分数集导出,这可能是一个很好的模型性能指标。
目前有好几位粉丝,跟我反馈说考到了NMS。今天开始,我们好好把NMS这个点给lu过去。今天说的是针对传统NMS存在的问题而提出的优化。后面还会分享针对不同任务,推出的NMS,欢迎各位持续关注!
在与谷歌创意实验室的合作,我很高兴地宣布的发行TensorFlow.js版本PoseNet 机器学习模型,它允许在浏览器中实时估计人类姿态。在这里试试现场演示(链接在文末)。
物体检测(Object Detection)的任务是找出图像或视频中的感兴趣目标,同时实现输出检测目标的位置和类别,是机器视觉领域的核心问题之一,学术界已有将近二十年的研究历史。随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,以及Mask R-CNN、RefineDet、RFBNet等(图 1,完整论文列表参见[1])。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向移动端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
机器学习在应用程序中的广泛使用,引起了人们对潜在安全威胁的关注。对抗性攻击( adversarial attacks)是一种常见且难以察觉的威胁手段,它通过操纵目标机器学习模型,可能会“悄悄”破坏许多数据样本。
肉眼可以相对容易地将猫的图片与迷惑人的版本连接起来,但这对于现成的计算机视觉API并非总是如此。在CVPR会议上,来自UnifyID的研究人员证明,猫科动物的风格化照片欺骗到Watson的物体识别工具概率超过97.5%。
LinkedIn 的技术栈由数千个不同的微服务以及它们之间相关联的复杂依赖项组成。当由于服务行为不当而导致生产中断时,找到造成中断的确切服务既具有挑战性又耗时。尽管每个服务在分布式基础架构中配置了多个警报,但在中断期间找到问题的真正根本原因就像大海捞针,即使使用了所有正确的仪器。这是因为客户端请求的关键路径中的每个服务都可能有多个活动警报。缺乏从这些不连贯的警报中获取有意义信息的适当机制通常会导致错误升级,从而导致问题解决时间增加。最重要的是,想象一下在半夜被 NOC 工程师吵醒,他们认为站点中断是由您的服务引起的,结果却意识到这是一次虚假升级,并非由您的服务引起。
知识图谱能够提供重要的关系信息,在各种任务中得到了广泛的应用。然而,在KGs中可能存在大量的噪声和冲突,特别是在人工监督较少的自动构造的KGs中。为了解决这一问题,我们提出了一个新的置信度感知(confidence-aware)知识表示学习框架(CKRL),该框架在识别KGs中可能存在的噪声的同时进行有置信度的知识表示学习。具体地说,我们在传统的基于翻译的知识表示学习方法中引入了三元组置信度。为了使三次置信度更加灵活和通用,我们只利用KGs中的内部结构信息,提出了同时考虑局部三次和全局路径信息的三次置信度。在知识图噪声检测、知识图补全和三重分类等方面对模型进行了评价。实验结果表明,我们的置信度感知模型在所有任务上都取得了显著和一致的改进,这证实了我们的CKRL模型在噪声检测和知识表示学习方面的能力。
选自free Code Camp 作者:Mariya Yao 机器之心编译 参与:蒋思源、刘晓坤 本文通过吉娃娃与松饼的图像对比了流行的六大计算机视觉API,作者希望能借助这些识别情况帮助读者了解各
所以本文针对目标检测中的NMS作进一步研究,基本的NMS方法,利用得分高的边框抑制得分低且重叠程度高的边框。NMS方法虽然简单有效,但在更高的目标检测需求下,也存在如下缺点:
今天,讲一个数据分析或机器学习里非常重要的概念,置信度和置信区间。为什么说置信度和置信区间非常重要?举个例子。
论文地址:https://arxiv.org/abs/2007.14350.pdf
在前面的秘籍一中,我们主要关注了模型加速之轻量化网络,对目标检测模型的实时性难点进行了攻克。但是要想获得较好的检测性能,检测算法的细节处理也极为重要。
题目:Sparse Adversarial Attack to Object Detection
1 背景概要 随着企业实施其数字化转型愿景,由于数据消费增加而导致的技术复杂性仍然是需要解决的最大挑战之一,目前我们已经知道如何管理大量的数据,而现在的目标是管理其复杂性。如果将人工智能和机器人过程自动化(RPA)结合起来,将会推动客户参与的创新方法,扩大员工能力和探索新的商业模式方面发挥至关重要的作用。 2 理解RPA与认知技术的融合 软件机器人在具有明确规则和重复度高的流程方面做得非常出色,如果在提高准确性的同时,模拟人类行为,那么RPA将会变得更加智能,以后也可以完成认知智能和预测能力
我们每天都会听到关于有能力涉及旅游、社交、法律、支持、销售等领域的新型机器人推出的新闻。根据我最后一次查阅的数据,单单Facebook Messenger就拥有超过11000个机器人,然而到我写这篇文章的时候,估计又已经增加了几千台。第一代的机器人由于它们只能根据对话中的关键字来分析有限的一些问题,因此显得十分的愚笨。但是随着像Wit.ai, API.ai, Luis.ai, Amazon Lex, IBM Watson等机器学习服务和NLP自然语言处理(Natural Language Processing)的商品化,促进了像donotpay 和 chatShopper这样的智能机器人的发展 。
**损失函数对不同的框进行不同的处理,最佳框与所有其他框之间的区分机制是 YOLO 损失的核心。**使用单独的对象置信度损失 objectness 来处理分数确实比将类概率 confidence 视为分数表现得更好,在SSD目标检测中考虑类概率作为置信度分数其效果要明显差于带置信度的Yolo模型。
过去两个月,例子君每天总结和梳理小例子,关于Python基础、常用内置库、正则表达式、装饰器、生成器、迭代器、绘图工具,Python多线程等。它们很简单,也就几行代码,各位读者反映也很不错哒,养成了每天看小例子的习惯。
去年 5 月,动动鼠标就能让图片变「活」得研究 DragGAN 吸引了 AI 圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。
随着激光雷达在机器人,无人车的领域的推广应用,三维点云的相关处理技术作为高精地图、高精定位、环境检测等方向的核心模块越来越受到重视。现有的在点云中定位物体的单阶段检测器通常将物体定位和类别分类视为分开的任务,因此定位精度和分类置信度可能无法很好地对齐。《SFFAI97期三维点云检测专题》我们邀请到了来自香港中文大学的郑武同学,分享他提出的新型检测方法,解决此问题。
在使用sklearn训练完分类模型后,下一步就是要验证一下模型的预测结果,对于分类模型,sklearn中通常提供了predict_proba、predict、decision_function三种方法来展示模型对于输入样本的评判结果。
如今,知识图谱对许多企业来说至关重要——它们提供了结构化数据和事实知识,以这些数据和知识驱动了许多产品,使它们更加智能化甚至“神奇”。
负责提供周围目标的精确3D边界框的3D目标检测是自动驾驶中必不可少的环境感知任务。最近,依靠激光雷达的精确深度测量,基于激光雷达的检测器取得了优异的性能。然而,LIDAR系统的一些固有缺陷,例如高成本和对不利天气条件的敏感性,不可避免地限制了这些方法的应用。相比之下,摄像机传感器更经济,在雨雪天气下更耐用,并且可以满足严格的车辆法规。
IBM Expands Data Discovery and Q&A Power of Watson Analytics Half a Million Professionals Access IBM Watson Analytics in Less Than a Year IBM Watson Analytics provides on ramp to Cognitive Business; Leads shift to self-service analysis with mix of natural
随着基于人工智能与机器学习的应用如雨后春笋般不断涌现,我们也看到有很多提供类似功能的 API 悄悄登上了舞台。 API 是用于构建软件应用的程序、协议以及工具的组合;本文是对2015 中这个列表的修正与完善,移除了部分被废弃的 API ;我们也添加了最近由 IBM、Google、Microsoft 这些大厂发布的 API 。所有的 API 可以根据应用场景进行分组: 人脸与图片识别。 文本分析,自然语言处理以及情感分析。 语言翻译。 预测以及其他的机器学习算法。 在具体的每个分组内,我们根据首字母顺序排序;
以下是使用Flair 重现这些数字的方法。您还可以在我们的论文中找到详细的评估和讨论:
论文地址:https://arxiv.org/pdf/1912.02252.pdf
【导读】人脸识别技术已经有了非常广泛的应用,国内大规模监控系统背后运用的技术就是人脸识别。
澜舟科技算法实习生,北京交通大学自然语言处理实验室二年级硕士生,目前正在进行文本生成方向的研究。
人工智能正在成为新一代技术变革的基础技术,但从头开始为自己的应用和业务开发人工智能程序既成本高昂,且往往很难达到自己想要的性能表现,但好在我们有大量现成可用的 API 可以使用。开发者可以通过这些 API 将其它公司提供的智能识别、媒体监测和定向广告等人工智能服务集成到自己的产品中。机器之心在 2015 年底就曾经编译过一篇介绍当前优质人工智能和机器学习 API 的文章《技术 | 50 个常用的人工智能和机器学习 API》,列举了 50 个较为常用的涉及到机器学习、推理预测、文本分析及归类、人脸识别、语言翻译等多个方面的 API。一年多过去了,好用的 API 也出现了一些新旧更迭,现在是时候对这篇文章进行更新了。
作者:Dishashree Gupta 翻译:闵黎 卢苗苗 校对:丁楠雅 本文长度为6500字,建议阅读20分钟 本文是Analytics Vidhya所举办的在线统计学测试的原题,有志于成为数据科学家或者数据分析师的同仁可以以这41个问题测试自己的统计学水平。 介绍 统计学是数据科学和任何数据分析的基础。良好的统计学知识可以帮助数据分析师做出正确的商业决策。一方面,描述性统计帮助我们通过数据的集中趋势和方差了解数据及其属性。另一方面,推断性统计帮助我们从给定的数据样本中推断总体的属性。了解描述性和
在上一篇文章88. 三维重建23-立体匹配19,端到端立体匹配深度学习网络之怎样估计立体匹配结果的置信度?中,我介绍了在立体匹配网络中引入置信度的好处,以及几篇典型的方法。我们看到了传统算法中的多种置信度的计算判据,也看到了深度学习时代我们学习置信度图的典型方案,另外我们还看到基于置信度如何优化得到更好的视差图的方案,以及把置信度的预测,与视差的生成,整合到同一个网络流程中,以循环神经网络的形式迭代式的得到最佳结果。
以上是传入图片字节数据调用接口的方式,也可以通过URL调用,只需将GeneralBasic换为重载函数GeneralBasicUrl:
主动学习是指对需要标记的数据进行优先排序的过程,这样可以确定哪些数据对训练监督模型产生最大的影响。
来源:DeepHub IMBA本文约2400字,建议阅读9分钟主动学习是解决标注数据问题的一个方向,并且是一个非常好的方向。 主动学习是指对需要标记的数据进行优先排序的过程,这样可以确定哪些数据对训练监督模型产生最大的影响。 主动学习是一种学习算法可以交互式查询用户(teacher 或 oracle),用真实标签标注新数据点的策略。主动学习的过程也被称为优化实验设计。 主动学习的动机在于认识到并非所有标有标签的样本都同等重要。 主动学习通过为专家的标记工作进行优先级排序可以大大减少训练模型所需的标记数据量。
随着先进的目标检测器和基于运动的关联算法的成功,除了简单的移动平均模型之外,视觉外观与基于运动的匹配的有效集成仍然相对不足。
每对基因基序的得分可以用不同的参数来进行。因此,我们提供多个数据库(motif-rankings),根据以下几种可能性:
GitHub上,大型开源项目需要解决的问题多得吓人。为了更容易地发现最紧迫的问题,GitHub最近引入了“好问题优先”的功能,将贡献者与可能符合他们兴趣的问题进行匹配。最初的版本于2019年5月发布,可以根据项目维护者对问题应用的标签提出建议。上个月发布了更新版本,该版本包含一个人工智能算法。GitHub指出,这是GitHub.com上推出的第一款支持深度学习的产品。
上一篇介绍了协同过滤,其重点就是在人-物品矩阵上,其中心思想是去对人或者物品进行聚类,从而找到相似人或者相似物品,用群体的智慧为个人进行推荐,但是,这种近邻模型也存在好多问题:
深度卷积神经网络最近在一系列图像识别基准测试中取得了最先进的性能,包括ImageNet大规模视觉识别挑战(ILSVRC-2012)。在定位子任务中获胜的模型是一个网络,它预测一个边界框和图像中每个目标类别的置信度得分。这样的模型捕获目标周围的整个图像上下文,但是如果不天真地复制每个实例的输出数量,就不能处理图像中相同目标的多个实例。在这项工作中,我们提出了一个显著性激发的神经网络模型用于检测,它预测了一组与类无关的边界框,以及每个框的一个得分,对应于它包含任何感兴趣的目标的可能性。模型自然地为每个类处理可变数量的实例,并允许在网络的最高级别进行跨类泛化。我们能够在VOC2007和ILSVRC2012上获得具有竞争力的识别性能,同时只使用每张图像中预测的前几个位置和少量的神经网络评估。
论文地址:http://arxiv.org/pdf/2007.12147v1.pdf
领取专属 10元无门槛券
手把手带您无忧上云