首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

工作想法从哪里

提出论点 研究想法,兼顾摘果子和啃骨头。...两年前,曾看过刘知远老师一篇文章《研究想法从哪里来》,直到现在印象依然很深刻,文中分析了摘低垂果实容易,但也容易撞车,啃骨头难,但也可能是个不错选择。...初入团队,寻找自己立足点,需要一个工作想法。每年末,抓耳挠腮做规划,想要憋出一个工作想法。很多同学,包括我自己,陆陆续续零零散散想到很多点,然后自己不断否掉。...有底是因为就像腾讯围绕人,做了互联网+人,有了微信,阿里围绕电商,做了互联网+电商,有了淘宝,字节围绕信息流,有了抖音、西瓜视频。安全当然离不开人,离不开攻击者,相信这一点就够了。...引用 研究想法从哪里来 杜跃进:数据安全治理基本思路 来都来了。

8.2K40

快慢结合效果:FAIR何恺明等人提出视频识别SlowFast网络

如果并非所有的时空方向都拥有相同可能性,那么我们就没有理由像基于时空卷积视频识别方法 [44, 3] 那样,对称地看待空间和时间。相反,我们需要「分解」该架构,分开处理空间结构和时间事件。...需要使用快速刷新帧(高时间分辨率)来有效建模可能快速变化运动。 基于这种直觉,本研究展示了一种用于视频识别的双路径 SlowFast 模型(见图 1)。...研究者希望这些关系能够启发更多用于视频识别的计算机视觉模型。 论文:SlowFast Networks for Video Recognition ?...论文链接:https://arxiv.org/pdf/1812.03982.pdf 摘要:本文提出了用于视频识别的 SlowFast 网络。...我们可以减少 Fast 路径通道容量,使其变得非常轻,但依然可以学习有用时间信息用于视频识别

1.1K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    准确检测DeepFake视频,阿里新算法从多个人物识别被篡改的人脸

    来源:公众号 机器之心 授权 近日,阿里安全图灵实验室和中科院计算所合作提出一种只需要视频级别标注新型 DeepFake 视频检测方法,该方法更加关注现实中广泛存在部分攻击(篡改)视频问题,能够从视频中准确识别出被篡改的人脸...例如,今年 2 月份在德里议会选举前一天,一个被 DeepFake 篡改过政客讲话视频在 WhatsApp 上流传,对选举造成了极大影响 [1];而在某成人视频网站上,某女星脸被「安」在了成人视频女主角脸上...不同于之前工作,阿里安全图灵实验室和中科院计算所合作完成一项研究更加关注现实中广泛存在问题:部分攻击(篡改)视频,即视频中只有部分人脸被篡改了。...图 2:S-MIL 算法框架图 为了更好地检测部分篡改 DeepFake 视频,阿里研究人员提出了一种只需要视频级别标注新型 DeepFake 视频检测方法。...回顾 DeepFake 视频定义:只要视频中有一张人脸被篡改,那么该视频就被定义为 DeepFake 视频。这和多实例学习是吻合

    1.5K30

    多模态人物识别技术及其在爱奇艺视频场景中应用 | 公开课笔记

    嘉宾 | 爱奇艺 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) 在本期 CSDN 技术公开课Plus:《多模态人物识别技术及其在视频场景中应用》中,爱奇艺科学家路香菊博士将为大家介绍了多模态人物识别技术及在视频场景中应用...组织创办“爱奇艺多模态视频人物识别赛”,开放全球首个影视视频人物数库iQIYI-VID,创建百万人物库及四万卡通角色库,相关技术应用到爱奇艺APP“扫一扫”及AI雷达等产品中。...除此之外,在视频中,还需要识别服饰、发型、声纹和指纹、虹膜等生物特征。所以,现在基于视频场景中的人物识别已经成为一个综合需求识别。 ? 第二,如何识别虚拟人物?...二是爱奇艺员工数据库,是我们内部员工数据库,里面包含了大量的人脸、姿态、表情等变化;三是爱奇艺在多模态人物识别竞赛中发布数据集,里面主要是针对明星视频数据进行身份识别。...数据整理后进行模型训练,训练过程中有一类数据需要特别关注,如下图所示,模型很难识别差异很小不同人物与差异很大同一人物,这种现象在实际视频中是很常见一种情况,如何解决这一难点?

    2.9K20

    【学术分享】刘知远:研究想法从哪里

    那么什么才是想法呢?我理解这个”“字,至少有两个层面的意义。 学科发展角度“ 学术研究本质是对未知领域探索,是对开放问题答案追寻。...深度学习之所以拥有如此显赫影响力,就在于它对于人工智能自然语言处理、语音识别、计算机视觉等各重要方向都产生了革命性影响,彻底改变了对无结构信号(语音、图像、文本)语义表示技术路线。...研究想法从哪里来 想法还是不好,并不是非黑即白二分问题,而是像光谱一样呈连续分布,因时而异,因人而宜。...那么,研究想法从哪里来呢?我总结,首先要有区分研究想法与不好能力,这需要深入全面了解所在研究方向历史与现状,具体就是对学科文献全面掌握。...“ 我当时回答如下: 我感觉,产业界开始集团化搞问题,说明其中主要开放性难题已经被解决得差不多了,如语言识别、人脸识别等,在过去20年里面都陆续被广泛商业应用。

    8.5K20

    在线识别图片来源原理 选择在线识别图片来源程序

    如今已是数字化时代,彩色图片越来越多图片进入到日常生活中。有很多时候,大家可能会并不清楚一张图片来源,这就需要用到一些在线识别图片来源程序。那么在线识别图片来源程序是如何工作?...在众多识别程序中,如何去选择识别程序呢?项目就来为大家简单介绍一下。 image.png 一、在线识别图片来源原理 首先,在线识别图片程序或程序主要是依托大数据来进行处理。...二、选择在线识别图片来源程序指南 一款图片识别程序关键就是要看数据库是否庞大。只有巨大数据库才会有大量识别材料,只有庞大识别材料才会让用户查找图片来源过程更加可靠、准确。...除了巨大数据库,还要选择有强大企业支撑识别程序。一般情况下,大家无法直接地看到图片识别程序代码,就需要大家去找到大型企业支持识别程序。这些程序往往算法更加缜密,更加精准。...以上就是为大家带来关于在线识别图片来源原理,以及一些识别图片来源程序选择方法。优质图片识别程序并不少,只要精挑细选一下就可以找到程序。

    18.8K40

    视频车牌特征识别

    大家,又见面了,我是你们朋友全栈君。...这里,没有直接采用之前方案,是因为在设计时候,发现直接采用颜色等直接特征提取然后进行二值化处理方法,如果视频中出现颜色类似的区域,则很有可能错误定位,例如在公交车中车牌区域范围和前窗以及部分背景比较相似...这里,定位算法,我们使用是HOG特征提取和Adaboost算法进行定位。...步骤二:训练识别 之前给你方案是使用SVM进行训练识别,后来考虑了一下,这里稍微变了下,采用BP神经网络进行训练识别,因为采用SVM只针对2分类识别,所以效果不佳,所以采用BP神经网络进行训练识别...运行 得到如下结果: 步骤三:整体车牌识别 通过上面的分析,我们所这里整个算法流程如下所示: 最后仿真结果如下所示: 发布者:全栈程序员栈长,转载请注明出处

    1.4K20

    视频行为识别「建议收藏」

    大家,又见面了,我是你们朋友全栈君。 1. 概述 使用DL方法解决视频中行为识别/动作识别的问题解决思路有三个分支:分别是two-stream(双流)方法,C3D方法以及CNN-LSTM方法。...由于ResNet在图像识别领域中出色表现,引起了视频识别研究者关注,作者最先将其在时域上进行了扩展,并延续了Fusion网络特色,一定要找到时域空域像素级对应关系。...算法介绍 作者认识到”CNN+多图像识别+平均预测”方法所获取信息是不完整,在某些需要细粒度区分场景中很容易混淆类别,学习视频时间演进全局描述才是准确视频分类重中之重,作者提出了一个新CNN...算法介绍 为了同时考虑空间时间维度特征,从2D到3D利用图像识别技术处理视频识别问题,是一个常见联想,所以基本思路都是从2DCNN中成熟网络结构向时域上拓展,如AlexNet,GoogLeNet...从图像识别算法演进过程来看,视频识别卷积核也会是ResNet。作者在本文做了一个非常琐屑但很有意义对比,即看不同输入帧数、输入帧间隔、层数、分辨率、第一层卷积核感受野大小对准确率有什么影响。

    1.5K10

    买域名哪里?域名供应商选择标准是什么?

    对于想要在网络上建设网站用户而言,首先需要为网站购买一个合法域名,不过很多人对于购买域名并没有实际经验,因此往往不知道在哪里才能买到需要域名。那么买域名哪里?域名供应商选择标准是什么?...买域名哪里好呢 域名是外部用户访问用户网站地址,只有准确地址才能够让别人进入自己网站,并且域名和网址并不是相等关系,域名需要经过解析才能够获得网址。...域名选择标准 很多人在网络上查找后会发现,提供域名域名供应商在网络上是非常多,那么买域名哪里?域名供应商如何来选择呢?...其实有心用户会发现,网络上域名供应商虽然多,但不少域名供应商都只是代理性质,所提供域名种类相对比较少,因此在选择域名供应商时应当尽量挑选那些一级域名商,这样可以选择域名种类会更加丰富。...买域名哪里?如何挑选域名供应商?

    16.3K10

    微服务优势在哪里,为什么别人都在说微服务

    我六月底参加深圳一个线下技术活动,某在线编程 CEO 谈到他们公司发版,说:“我说话这会儿,我们可能就有新版本在发布。”,这句话令我印象深刻。...传统单体应用,所有的功能模块都写在一起,有的模块是 CPU 运算密集型,有的模块则是对内存需求更大,这些模块代码写在一起,部署时候,我们只能选择 CPU 运算更强,内存更大机器,如果采用了了微服务架构...可以灵活采用最新技术 传统单体应用一个非常大弊端就是技术栈升级非常麻烦,这也是为什么你经常会见到用 10 年前技术栈做项目,现在还需要继续开发维护。...服务拆分 个人觉得,这是最大挑战,我了解到一些公司做微服务,但是服务拆分乱七八糟。这样到后期越搞越乱,越搞越麻烦,你可能会觉得微服务真坑爹,后悔当初信了说微服务鬼话。...这个段子形象说明了分布式系统带来挑战。

    10.5K00

    清华教授刘知远:AI领域研究想法从哪里来?

    那么什么才是想法呢?我理解这个”“字,至少有两个层面的意义。 学科发展角度“ 学术研究本质是对未知领域探索,是对开放问题答案追寻。...深度学习之所以拥有如此显赫影响力,就在于它对于人工智能自然语言处理、语音识别、计算机视觉等各重要方向都产生了革命性影响,彻底改变了对无结构信号(语音、图像、文本)语义表示技术路线。...研究想法从哪里来 想法还是不好,并不是非黑即白二分问题,而是像光谱一样呈连续分布,因时而异,因人而宜。...那么,研究想法从哪里来呢?我总结,首先要有区分研究想法与不好能力,这需要深入全面了解所在研究方向历史与现状,具体就是对学科文献全面掌握。...“ 我当时回答如下: 我感觉,产业界开始集团化搞问题,说明其中主要开放性难题已经被解决得差不多了,如语言识别、人脸识别等,在过去20年里面都陆续被广泛商业应用。

    6.4K11

    今日 Paper | 神经网络结构搜索;视觉目标;人物识别视频3D人体姿态估计等

    目录 基于进化算法和权值共享神经网络结构搜索 检测视频中关注视觉目标 包含状态信息弱监督学习方法进行人物识别 基于解剖学感知视频3D人体姿态估计 RandLA-Net:一种新型大规模点云语义分割框架...为进一步证明该方法实用性,这篇论文将预测注意力图应用于两个社交注视行为识别任务,并表明所得分类器明显优于现有方法。 ? ?...包含状态信息弱监督学习方法进行人物识别 论文名称:Weakly supervised discriminative feature learning with state information for...在获取人工标注训练数据代价太高现实下,使用非监督学习来识别每个行人不同视觉特征具有很重要意义。...该方法在数据集Semantic3D和SemanticKITTI等大场景点云分割数据集上都取得了非常效果,从而验证了该方法优良性,此外通过实验发现,采用本文提出网络框架,计算效率也是非常高,明显优于其它模型

    1.1K10

    哪里有服务应用性能监控 监控告警途径有哪些?

    否则在各种同类软件不断刷新的当今,一个无法给用户提供较好体验软件自然会被淘汰。哪里有服务应用性能监控呢?...哪里有服务应用性能监控 对于哪里有服务应用性能监控这个问题,现在应用市场已经出了很多类似软件。...一些大软件制造商或者云服务器商家出产应用性能监控,一般可信度和质量是比较高,它们拥有的研发平台是高科技技术团队,对系统研发和细节设置肯定是一般小厂家所不能比。...上面已经解决了哪里应用性能监控问题,性能监控在对应用进行实时分析和追踪过程当中,如果发现了问题,它报警渠道都有哪些呢?...以上就是哪里有服务应用性能监控相关内容,随便在搜索引擎上搜索一下就会有很多品牌正规监控软件出现,用户们按需选择就可以了。

    8.1K30

    基于深度学习视频内容识别

    今天给您讲讲视频大数据和视频内容识别(部分内容来自复旦大学-计算机科学技术学院薛向阳、姜育刚,谢谢参考阅读)。 视频大数据 ? 作为目前最火热词汇之一,大数据在各个领域都已有了较为成熟应用。...因此,视频大数据处理好坏成了客户关注焦点,视频大数据处理技术也成了厂家能力体现。...针对“智慧城市”建设中大量视频数据快速检索、统计分析需求,海康威视,佳都科技等视频领域领军企业已有了成熟视频大数据解决方案,目前已应用多个“智慧城市”建设中。...我们还是来说说视频内容知识,先来说说现在这领域视频数据集构建。 ?...大规模动作识别比赛数据 THUMOSChallenge 101类别;分别与ICCV2013、ECCV2014、CVPR2015合办 ?

    3.2K80

    分享一个介绍语言模型视频

    嗨,不知道大家是怎么度过这个四年才能遇见一次2月29号?我朋友圈里好多人选择了吃一顿~ 昨天给大家分享了【预训练语言模型前世今生】系列第一集:萌芽时代,第二集应该在下周就会和大家见面。...语言模型在如今NLP领域真的太重要了,后面分享很多最新成果都会和语言模型有关。 为了给大家更多关于语言模型不一样视角,今天我们分享一个很棒介绍语言模型视频作为补充。...视频原标题是《Putting Words into Computers》,主讲人是台大李宏毅老师,很多朋友可能听过他机器学习系列课程。...相比于文章,视频课往往更加直观,再加上李老师深入浅出、生动形象介绍,相信能给大家带来收获。 视频比较长,我们把重要时间节点列在下面,方便大家观看。

    47620

    揭开视频识别(动作识别神秘面纱(附代码和demo)!

    视频识别和检测也是最有落地场景前景,像人脸识别、动作检测、异常检测、行人重识别、行人计数等都是很有落地前景应用方向。...每个跟踪ID对应目标行人各自累计骨骼特征点结果,组成该人物时序关键点序列。当累计到预定帧数或跟踪丢失后,使用行为识别模型判断时序关键点序列动作类型。...通过行人检测框坐标在输入视频对应帧中截取每个行人。通过在帧级别的行人图像通过图像分类方式实现。当图片所属类别为对应行为时,即认为在一定时间段内该人物处于该行为状态中。...通过行人检测框下边界中点在相邻帧位于用户所选区域内外位置,来识别是否闯入所选区域。 基于视频分类行为识别 视频分类识别可以应用在异常动作识别、打架识别等场景上。...由于监控场景背景复杂,人密集程度、光线、拍摄角度等都会对识别造成影响,本方案采用基于视频分类方式判断视频中是否存在打架行为。针对摄像头距离人较远情况,通过增大输入图像分辨率优化。

    2K40

    刷爆朋友圈 deepfakes 视频人物换脸是怎样炼成

    最近,一个名叫deepfakes技术火了,这是一个可以给视频人物换脸技术。 这张图片源自雷神三预告片索尔大战浩克片段,将索尔脸替换为了Trump,这个表情实在是.........当然,最令人害怕是,这个技术火原因不是恶搞,竟然是有人把明星脸换到了某些不可描述小电影主角上:)而且推出了一个桌面应用,使得使用门槛进一步下降。...我们训练及生成时候都做了一个截取,把最中间160*160区域认定为脸部,将其压缩为64*64。 最终在生成时候,我们生成也是64*64数据。...但是科技进步还是会给我们带来一些担忧。在换脸技术上,如果人人能够使用,那就可以低成本制作各种假视频。 我们都知道视频在当前社交媒体下极快传播速度,“朋友圈”流通各种小视频非常火爆。...如果利用这个技术低门槛地制作低成本假视频,这可能会带来巨大社会信任危机。你怎么看?

    2K50

    HumanNeRF:从单目视频中实现移动人物自由视点渲染

    其方法可以在任何一帧暂停视频,并从任意新摄像头时代视点渲染对象,甚至可以为特定帧和身体姿势绘制完整360度相机路径。...本文展示了与先前工作相比显著性能改进,以及在具有挑战性不受控制捕捉场景中移动人类单目视频自由视点渲染令人信服例子。...这个问题对于在本文中所讨论用单个相机拍摄“现场”视频(单目视频)来说尤其困难。以前神经渲染方法通常假设多视图输入、仔细实验室捕捉,或者由于非刚体运动而在人类身上表现不佳。...本文介绍了一种称为HumanNeRF方法,该方法将移动的人单个视频作为输入,在每帧、现成分割(通过一些手动清理)和自动3D姿势估计之后,优化人体标准体积T姿势,以及通过后向扭曲将估计标准体积映射到每个视频运动场...在测试时,可以在视频任何一帧暂停,并根据该帧中姿势,从任何视点渲染生成体积表示。

    53410

    干货 | Siri 语音识别的小心机:你在哪里,就能更准确地识别那附近地址

    然而,人们目前主要是在通用语音识别方面取得了性能提升,但准确地识别有具体名字实体(例如,小型本地商户)仍然是一个性能瓶颈。...我们决定通过将用户地理位置信息融合到语音识别系统中来提高 Siri 识别本地 POI 名称能力。...POI 识别性能。...这有助于我们更好地估计用户想要单词序列。通过将用户地理位置信息融合到Siri自动语音识别系统中,我们已经能够显著地提高本地 POI 识别和理解准确率。...在部署基于地理位置语言模型后,我们自动语音识别系统输出将具有特殊标记,例如:在通过类语言模型框架识别的地理实体周围会有「\CS-POI」标记。

    1.9K20

    解决Typescript文件被识别视频问题

    概念引入TypeScript 是微软开发一个开源编程语言,通过在JavaScript基础上添加静态类型定义构建而成Transport Stream 即传输流,是一种常见视频封装格式,基于MPEG...-2封装格式(所以也叫MPEG-TS)TypeScript和Transport Stream文件扩展名均为ts问题现象在Windows操作系统上.ts被默认标记为Transport Stream,对于普通用户来讲这完全没有问题...,但对于TypeScript开发者来说简直就是个灾难了:用文件浏览器打开一个.ts文件较多项目时,系统需要把所有文件扫描一遍,并尝试识别视频封面,这个过程几乎就是逐帧动画,严重影响工作效率。...ts][HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\Kindmap]".ts"="document"恢复视频模式那有人可能要说了...这里有最专业开发者&客户,能与产品人员亲密接触,专有的问题&需求反馈渠道,有一群志同道合兄弟姐妹。来加入属于我们开发者社群吧  。

    2.3K301
    领券