首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何用Transformer分清12位女排运动员?这个「时空路」框架刷群体行为识别SOTA

群体行为识别(Group Activity Recognition)不同于寻常的关于个体动作的行为识别(Action Recognition),需要通过分析视频中所有参与群体活动的个体之间的关系,进一步结合场景信息...以下面排球比赛视频为例,算法需要分析场上12位运动员的动作、交互以及场景内容,综合判断得到场上在进行左侧击球(left-spike)群体行为。 ‍...被忽略的互补建模顺序 由于群体行为识别的多粒度特性以及明确的粒度含义(个体-群体),GCN、transformer以及CNN的attention模块都经常被用作对群体进行建模的工具。...图4 全监督提供12位运动员的精细标注 为了进一步减少标注成本,也为了检验模型的鲁棒性,文章提出有限数据设定(limited data),验证模型在有限标注数据(如50%)下的表现;同时,文章也在弱监督设定...重点从事深度学习与计算机视觉、模式识别与机器学习等人工智能前沿研究。

2K40

如何用Transformer分清12位女排运动员?这个「时空路」框架刷群体行为识别SOTA

群体行为识别(Group Activity Recognition)不同于寻常的关于个体动作的行为识别(Action Recognition),需要通过分析视频中所有参与群体活动的个体之间的关系,进一步结合场景信息...以下面排球比赛视频为例,算法需要分析场上12位运动员的动作、交互以及场景内容,综合判断得到场上在进行左侧击球(left-spike)群体行为。 ‍...被忽略的互补建模顺序 由于群体行为识别的多粒度特性以及明确的粒度含义(个体-群体),GCN、transformer以及CNN的attention模块都经常被用作对群体进行建模的工具。...图4 全监督提供12位运动员的精细标注 为了进一步减少标注成本,也为了检验模型的鲁棒性,文章提出有限数据设定(limited data),验证模型在有限标注数据(如50%)下的表现;同时,文章也在弱监督设定...重点从事深度学习与计算机视觉、模式识别与机器学习等人工智能前沿研究。

1.9K40
您找到你想要的搜索结果了吗?
是的
没有找到

查找论文文献的小技巧

而这个过程说到底就两句话: 去哪里找 在哪里下 本文以工科论文为背景撰写, 以查找 "模式识别" 这一关键词为例. 去哪里找 1....当你切换到英文的维基百科, 文献更是扑面而来: 维基百科上的描述需要人工维护, 因此中英文模式下看到的内容是不一样的, 同样搜索 "模式识别", 英文下的参考文献达到22条, 而中文下只有4条....可能对于大部分人, 硬啃英文维基是比较有难度的, 这时候可以挑着来找. 比如我要找模式识别的应用, 直接点击导航的 Uses 关键词, 就不用通篇硬啃了....百度学术有个优点是查找中英两种关键词比较方便, 比如查找 "模式识别" ,直接点击上方的按钮就可以查到英文文献, 不需要自己翻译关键词....如果在校一般来说, 大部分学校都会购买常用的文献数据库, 知网一般都会, 连上学校的教育网即可下载. 如果不在学校, 可以了解一下学校有没有专用的V**, 可以在外网访问文献资源.

2K10

年薪50万的人的生活方式

房子也装修十几年了,一直想再装修下,但是真的哪里来精力做这个呢?所以很多时候不是钱的问题就是精力问题! 衣服我真的很随便呢,基本网购,大衣一千左右,其他衣服200-500。...另一方面我每天到家八点了,周末都在接送娃读书中度过,哪里有可能逛街呢?真心逛街一年一只手就够了。 孩子教育比较花钱,我一年花十万左右两个娃,当然还没到最花钱的时候。...因为孩子看大量英文书。可贵了,薄薄一本,20元+。是中文书的几倍价格。 都是老婆管,她挑书买书,家里海量供应,中文书早几年还,现在基本上图书馆借,校图书馆,市图书馆,就是英文原版书只能靠自己。...还不包括各种考托福,辅导英文写作,申校的顾问费用……这得是我年收入稳定超过百万才可能考虑的事。 2、旅行 6-8万 个别年份也有往10万走,这是老婆坚持的。...现在最要买衣服的是孩子,每年618,11,老婆都是给娃大采购。日常在淘宝一家户外童装店外贸货,T 恤裤子都是30,50一件。好一点的就去迪卡侬给孩子11也会备一些优衣库+GAP。

6.8K00

中文情感词典的构建与使用_文本情感识别

首先,国外英文的情感分析已经取得了很好的效果,得益于英文单词自身分析的便捷性与英文大量的数据集 WordNet。但由于中文的多变性,语义的多重性与数据集的缺乏,使得国内的情感分析暂落后于国外。...其已经开源,链接为:synonyms 如: import synonyms print("人脸: %s" % (synonyms.nearby("人脸"))) print("识别: %s" % (synonyms.nearby...("识别"))) 3.领域情感词典的构建 构建特定领域的情感词典需要利用PMI互信息计算与左右熵来发现所需要的新词。...为两个词一起出现的概率 p(x)为词x出现的概率 p(y)为词y出现的概率 ---- 具体例子:4G, 上网卡,4G上网卡;如果4G的词频是2,上网卡的词频是10,4G上网卡的词频是1,那么记单单词的总数有N个,单词的总数有...我们这里的左右熵定义为(以左熵为例): 这里我们还是举一个具体的例子来理解它 假设4G上网卡左右有这么几种搭配 [4G上网卡, 有4G上网卡,有4G上网卡, 丢4G上网卡] 那么4G上网卡的左熵为

1.8K30

测试从0到1OCR初探培训(九)

,比如中、英文等) Mac下的环境配置: 安装tesseract brew install tesseract 查看本地存在的语言库(按照上述命令安装后的语言包里默认有eng英文包) tesseract...从上图的识别结果可以看出,没能识别出期待断言的文字,即“已加入我常”。 如何提高识别率?...tesseract 我常弹窗_small.png 我常弹窗_small -l chi_sim 识别结果如下: ?...如果想得到识别出来的内容在待识别图片上的坐标的话,可以加hocr参数(html文件) tesseract 我常弹窗_small.png 我常弹窗_small -l chi_sim hocr 得到的识别结果如下...可应用到实际业务中 8、选择合适的字体库来识别 如果想识别的内容是英文的话,用英文识别效果更佳 可应用到实际业务中 总结: 在识别APP内图片里的文字时,可先自动采用尺度化,然后根据实际情形结合二值化

2.3K20

【自然语言处理】双语数据预处理

可以采用正则表达式或者自动机进行自动识别,并给予特殊名字进行泛化。...例如: 数字类型 $number 如:123 日期类型 $date 如:1993 年 12 月 3 日 时间类型 $time 如:3:10 网址等类型 $literal 如:http://www.niutrans.com...2.英文分词 相对于中文分词处理来说,英文分词主要处理三个问题: 将所有大写字母改为小写字母; 将英文句尾结束符与句尾最后一个单词用空格分开; 同样将数字、日期、时间、网址等不可枚举的类型进行识别,然后分别采用特殊名字进行泛化处理...英文:I bought 10 books on April 14. 预处理结果: 中文:$date 我 了 $number 本 书 。...; 4) 注意区分英文的句尾符号“.”和“Mr.

1.1K20

全球首个机器人公民索菲亚亮相201712知商节 引爆全场知识产权新高潮

近日,一场精彩绝伦的全球知商盛会——201712知商节国际知商高峰论坛在广州隆重举行。来自政界、商界、产业界、学术界的大咖齐聚一堂,面对面探讨知识产权未来发展。...△机器人索菲亚亮相201712知商节 发表中英文致辞:非常荣幸参与汇桔网12知商节 论坛上,机器人索菲亚发表中英文致辞。...她表示非常荣幸参加由汇桔网主办的12知商节,特别感谢人类长期以来对机器人成长的关注。...她的“大脑”采用人工智能和谷歌语音识别技术,能识别人类面部、理解语言以及记住与人类的互动,甚至还会开玩笑。...机器人索菲亚在12知商节上的精彩亮相,让我们看到人工智能领域的知识产权成果。在建设创新型国家的进程中,知识产权的创造、运用、保护、管理能力至关重要,是经济社会发展的新动力源。

2.4K90

1万元的iPhone X太贵买不起?至少中国富人穷人都买得起

排除连iPhone 8和iPhone X都不区分的“恶意差评”,我们来看看iPhone X最被差评的地方在哪里:全面屏、无线充电、面部识别摄像头光学防抖在安卓阵营都已有先行玩家,iPhone X不过是跟随...因为唱衰苹果的分析师没有站在用户角度思考问题,消费者的不是创新,的是体验,摄像头不是苹果先做的,但做得更好。 同样,iPhone X的体验提升是十分显著的。...许多人看到它用了夏普、小米和三星已采纳的全面屏,却没留意到它干掉了HOME键,HOME键由iPhone引入手机行业再自己干掉,这个变化非常大;许多人认为FACE-ID是步虹膜识别或者人脸识别的后尘,然而却忽略了...FACE-ID有红外活体识别而不只是图像识别技术,通过红外传感器、点阵投影等多个传感器组合的“深度摄像头”带来快速、精准和安全的识别,以及Animoji等创新应用。...在iPhone X推出的当天,天猫宣布iPhone 新品将在其平台首发,天猫与花呗联合推出了12个月分期服务,用户还有机会抢到免息券和获得10GB流量赠送。

3.2K70

OPPO R15来了,网友:刚买了R11s,就出R15,你觉得我还会吗?

配备了后置摄像头,而前置摄像头依旧采用了到 2000万像素。...你觉得我还会吗?是的,你猜对了! 网友:老子刚的R11S没两天,你跟我说要出R15?????网友:我的R7用到R15都出来都没换过手机。...所有的钱都用来给明星代言费,试问你的手机研究经费能高到哪里?质量?这种机子我们业内叫它“一次性手机”。 网友:有些人能别觉得自己最清醒吗?...网友:你们都说你们的oppo这不好那不好,可是我的oppo r7s还好好的呀,我15年12月份的,用到现在了,摔了好几次了,屏都没有碎,就是钢化膜碎过两三次,手机也就偶尔卡过几次,还是因为我操作的原因卡的...大家还是参考下值不值得 好了 才几个月研制的新机 也不会有太大突破。所以还是会有很多追星族,义无反顾的的。才刚r11s,反正买不起!

10.5K70

【技术种草】工作了17年,2021年11是我见过有史以来“撸腾讯云羊毛”最狠的一次!

1、可以放自己的资料,走到哪里都不怕丢文件,一键上传,多爽,速度还快; 2、可以部署一个自己唯一的博客网站; (1)有自己的独立域名; (2)想发什么就发什么,无拘无束(当然了,一定要合法哦); (3)...如果你想了,那么请继续往下看,经过我对比的三大云服务厂商的11优惠政策,带你拿下最爽的服务器!!!!! 为什么今年要撸腾讯云的羊毛呢?...小窍门:针对老用户,这个地方我有一个小招,还是从我朋友那里学来的,上一个11,他在腾讯云领了价值万元的卷,然后节省了1万多。厉害吧。...spread_hash_key=62ff2cb05c7850ac840ec53a39ad789b 5、无论是企业还是个人,服务器都享受加码礼; 加码礼1: 即送千元券 活动任意一台轻量服务器,或者云服务器...,就送千元代金券,无需任何额外操作。

49.4K30

以物识人 | 基于数据推断用户的属性

日常生活中,我们会经常“揣测”他人,比如根据外表来判断一个陌生人的职业,根据面部表情或身体姿势判断对方的情绪状态,听口音来分辨对方来自哪里(南方or北方)等等。e.g....对用户的画像或者识别,是产品运营活动的基础。 比如2016年京东在11做的图书活动,就很好地利用“图书”这个品类来筛选高质量用户来为金融业务拉新,下图是当时笔者在朋友圈的发文。 ?...杯子,粉色的,男生的概率比女生要低很多吧; 个性化的头像、昵称、行为路径、文字使用习惯、关注的话题或明星等,这些也能反映用户的性别。 怎么判断用户的职业?...有小孩的家庭通常会购买母婴用品(e.g.奶粉、尿不湿)、少儿读物、K12教辅、儿童保险等商品。当然还有其他小孩子的消费场景,比如吃、穿、玩、学,不同年龄段的孩子对应的消费行为也是有迹可循的。...实际业务应用中,通常会针对性的对目标用户的一个或多个维度推断,某些场景下,涉及的数据广度和深度则要大的多,比如刻画用户的消费能力,除了看消费金额外,还可以看购买品类的层级(比如同一品类中的都是贵的)、

3.4K20

讯飞翻译笔s11,学生们的新福利

首先,AI、语音识别、大数据、交互技术等相关技术的成熟应用,为教育硬件的智能化升级奠定了基础。...拿K12阶段的中小学生英语学习来说,单词记不住、发音不标准、学习效率低等问题,几乎是他们这个年龄段学生英语学习的共同难题。...比如,同样是学习英语,学生在查单词的时候更看重效率、在学口语的时候更看重发音,在英文阅读的时候则更看重整句朗读的输出能力。...比如,很多用户硬件,就是希望获得免费丰富的内容资源。...从技术层面来看,讯飞翻译笔的扫描、识别、翻译等功能,涉及OCR识别、机器翻译等人工智能技术,而在人工智能技术领域深耕20多年的科大讯飞,在这些技术上已经达到了世界领先水平。

4.1K40

巧破字符编码和文件处理的初探

对应的几个名词: 字符编码:人和计算机交流的一种媒介(人能够识别的和机器能够欧识别的一种媒介) ASCII码:是字母、数字和英文符号和计算机0和1标识符的对应关系 了解部分:编码表的进化历程 1.ASCII...码:是字母、数字和英文字母和机器计算机0、1之间的对应关系。...首先,unicode编码存储汉字使用2个字节,存储英文字母也是2个字节;utf-8编码存储汉字使用3-6个字节,存储英文字母使用1个字节。...所以,utf-8码是unicode码的一种体现形式,从根本上说他的实质就是一张unicode表,但是由于utf-8的变长存储数据的优点。...print(line) 7 # line = f.readline() 8 # print(line) 9 10 # 按行一次性全部读出 11 # lines = f.readlines() 12

35410

网购评论是真是假?文本挖掘告诉你

刚刚过去的11、12网络购物节中,无数网友在各个电商网站的促销大旗下开启了买买买模式。不过,当你在网上选购商品时,同类的商品成千上万,哪些因素会影响你选购某件商品呢?...然而各位一定也有所耳闻,的不如卖的精,刷单的、刷评论的始终横行网上,没准你看到的评论就是卖家自己刷出来的。...下次还来,赶快上新款哦!” “有史以来最满意的鞋,妈妈看了说是真皮的,卖家态度又很好,发货超快,诚信卖家,特别满意的一次购物!”...我们特意选取了具有刷单倾向的商品,可以看出,其中许多评论日期连续、会员名相似、买家等级较低;经过人眼识别,刷单评论占比约30%。...我们意在使用这些数据去构建刷单评论识别模型,然后可以用这里得出来的规则去识别其它鞋类商品的刷单评论。

5.2K90

AI大牛沈向洋就职清华演讲全录:人类对AI如何做决定一无所知

导读:2019 年 11 月 14 日凌晨,在微软服务 23 年的微软全球执行副总裁沈向洋博士宣布离开微软;2020 年 3 月 5 日,清华大学在线上举行了活动“沈向洋聘教授聘任仪式暨春风讲堂第四讲...会后,沈向洋发表了主题为 “如何设计和构建负责任的 AI” 的全英文演讲,本文对重点内容进行了整理。 作者:沈向洋,整理:冬梅、陈思 来源:AI前线(ID:ai-front) ?...2005 年,沈向洋曾以聘教师的身份在清华任教,并于 2015 年参与了清华、华盛顿大学、微软共同成立的全球创新学院(GIX)。...由于演讲为全英文,InfoQ 整理了重点内容供广大开发者参考。 01 沈向洋:如何设计和构建负责任的 AI ? 话题 1:AI 的可解释性 之前,我们谈论的 AI 都是出现在科幻小说或电影里。...需要了解偏见来自哪里,就需要知道数据的来源。在微软、IBM 和 Face ++ 制定的面部识别算法中,黑人女性比白人的面部识别准确率要低。 ? ?

1K10

网购评论是真是假?文本挖掘告诉你

摘自:毕马威大数据挖掘 微信号:kpmgbigdata 刚刚过去的11、12网络购物节中,无数网友在各个电商网站的促销大旗下开启了买买买模式。...然而各位一定也有所耳闻,的不如卖的精,刷单的、刷评论的始终横行网上,没准你看到的评论就是卖家自己刷出来的。...下次还来,赶快上新款哦!” “有史以来最满意的鞋,妈妈看了说是真皮的,卖家态度又很好,发货超快,诚信卖家,特别满意的一次购物!” ?...我们特意选取了具有刷单倾向的商品,可以看出,其中许多评论日期连续、会员名相似、买家等级较低;经过人眼识别,刷单评论占比约30%。...我们意在使用这些数据去构建刷单评论识别模型,然后可以用这里得出来的规则去识别其它鞋类商品的刷单评论。

5K70

肥皂与手纸:神奇的电商大数据分析

11.11光棍节已经过去,12.12促销又要到来,回望双十一的疯狂与激情,哪些人在小米、哪些人在华为,哪些人在林志玲,哪些人在杜蕾斯,都将是有趣的话题。...虽然市面上有不少大数据之类的书籍,但是真正专业电商技术解密和实践案例分享的书籍还真是独此一家,我马上去几本送给我的程序猿朋友们。...怎么这么多人肥皂和手纸?是啊,这就是趋势变化,一方面说明京东商城百货化成绩不俗,购物篮丰富度大大提升,另一方面也说明年轻网民们的生活必需品消费也呈现出电商化的趋势。 ?...2013年十一期间,新用户主要集中在电脑办公,手机数码品类,用户数占比分别为16%、13%;2014年十一期间,新用户主要集中在服饰内衣、鞋靴箱包等品类,用户数占比21%、12%。...按道理讲朝阳区北京夜生活最丰富的地区了,曾经的天上人间,灯红酒绿的三里屯都在这里,双十一朝阳区的青年们都跑哪里去了。

28.8K100

当直播电商用上 AI 实时翻译,歪果仁也能听懂李佳琦

关键词: 11,跨境直播,AI 实时翻译 距离「 11 」还有半个月,然而各大电商平台早已经开始摩拳擦掌,纷纷将预售时间提前,抢占先机。...「 11」的购物潮流也已触及全球 200 多个国家和地区 不过,在「 11」全球化的同时,也面临着新的挑战。...AI 实时翻译:消除跨境直播的语言鸿沟 为了帮助中国跨境商家更好地触达全球消费者,让歪果仁也听懂「噢尬」、「我的妈呀」、「所有女生,买它!」...一位中国电动车卖家用中文直播,屏幕显示实时翻译后的英文 (图片来源:观察者网) 在此次直播中,中国的电动摩托车店家用中文对产品进行介绍,而屏幕上,却会实时显示英语、俄语、西班牙语等的实时翻译(通过不同服务器选择...给实时翻译带来挑战 为解决「听不清、听不懂」的问题,阿里在业界通用方案的基础上,进行了以下升级: 自研了更智能的语音模型,可在嘈杂的环境中「听清」直播内容; 在 AI 翻译任务过程中创新性集成了视觉信息的识别结果

5.6K41
领券