CCF 大数据与计算智能大赛:挑战 11 题,成为顶尖数据科学家

2016年10月18日, 世界人工智能大会技术分论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容:美团技术学院院长刘江担任主持人,微软亚洲研究院常务副院长芮勇、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、联想集团副总裁黄莹、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。

【新智元导读】2016 CCF大数据与计算智能大赛9月24日启幕,发布了 11 道高质量创新赛题,涉及智能电网、搜索广告、O2O营销、舆情分析、监控识别、计算广告、无人驾驶、市场预测、LBS营销、气候预测等多个热门方向,将为图像处理、自然语言处理、用户画像、推荐系统等领域提供大量来自真实场景的问题与数据。想挑战?登陆指定平台参赛 http://www.wid.org.cn。

2016年第四届大赛以“大数据与计算智能”为主题,以“数据驱动,智见未来”为口号,成功吸引了数百位权威专家与行业大咖莅临现场,预计将有数千支专业队伍参与。为了更好地支持参赛者进行大数据技术研究,解决参赛者计算资源缺乏等问题,本次竞赛的专业大赛平台将联合各企业与科研机构,为优秀参赛者提供专业的云计算平台支撑。

本次大赛的11道高质量大数据与人工智能创新赛题,涉及智能电网、搜索广告、O2O营销、舆情分析、监控识别、计算广告、无人驾驶、市场预测、LBS营销、气候预测等多个热门方向,将为图像处理、自然语言处理、用户画像、推荐系统等领域提供大量来自真实场景的问题与数据,促进相关领域的技术创新。

第一题:用电异常行为分析

出题方:国家电网

题目:用电异常行为分析

提供的数据:国家电网供电区域的某一个区域的用户日电量信息;经过业务研判以后的异常的用电信息;经过判定后,核实为异常的用户信息。

参赛者可以根据这三个数据,发现窃电用户的行为特征,形成窃电用户的画像,准确的识别窃电用户,提高窃电的监测效率,降低窃电损失。

第二题:客户画像

出题方:国家电网

题目:客户画像

提供的数据:国家电网公司供电区域内某一个区域的,客服中心95598用户来电工单的数据;经过业务研判以后准确的停电信息数据,用户的同化信息数据;还有一个就是经过脱敏以后的用户清单。

第三题:通过搜索行为分析性别、年龄和学历

出题方:搜狗公司

题目:通过搜索行为,分析用户的性别、年龄和学历

提供的数据:一个10万用户量级查询的行为,是通过调研问卷等各种方式在线下得到的真实的性别、年龄、学历。一半数据作为训练题,另外一半作为测试题。

第四题:精准营销

出题方:蚂蚁金服

题目:分析用户在线上线下的行为,预测推给用户的优惠券是不是能够在一定的时间段内进行核销。

提供的数据:一定比例的在口碑网上的用户优惠券的核销历史用户,还有通过用户在口碑网在线下的商店的消费记录,还加入一些淘宝的数据。最后一块是LBS,如果大家去某一家店做消费的话,这个LBS的信息是会被记录的。

第五题:依据用户轨迹进行用户营销

出题方:中国联通研究院

题目:在每位用户维护了3千多个标签之后,联通发现这3千多个用户标签相对来说静态,当加入用户的时间信息和位置信息之后,我们期待着把多个标签能够下不同的由于地域和时间的变化之后来变动,另外解决多个渠道里面,实体线下渠道的营销活动的支持问题。

提供的数据:3万个用户的上网的详单记录,也就是3个月记录上网的行为记录和通话的话单记录。同时有1万个商户的一些位置数据和它的活动的行为数据。在这个原始数据的基础上,也给大家提供了中间的过程数据,也就是这3万个用户标签结果

第六题:人脸识别

出题方:合肥寰景信息

题目:特征人的属性锁定,人群的精细化分析在特定场景的应用。

提供的数据:通过提供一批相关的已经标注过的数据,请大家来对人的属性标注算法来做一些研究和探讨,能寻找一些比较快速的标注这些数据的方法和算法,从而在实际的应用场景里面能够解决一些特殊的问题。

第七题:基于视角的领域情感分析

出题方:国双技术

题目:基于视角的领域情感分析

提供的数据:行业专家从10万篇的文本当中精心挑选出来13000多条数据,其中8千条可用做模型的训练,5千条用做评测。

第八题:自动驾驶场景中的交通标志识别

出题方:驭势科技

题目:自动驾驶场景中的交通标志识别

提供的数据:一个是来自于欧洲的公开数据集,另外12000张图片,每张图片有1到10我交通标志作为这次的训练数据。

第九题:广告虚假流量检测

出题方:AdMaster

题目:广告虚假流量检测,用技术识别出来到底是机器人还是人的行为

提供的数据:近亿级的数据,是一个很庞大的数据

第十题:青藏高原湖泊面积测绘

出题方: 百卓网络

题目:通过研究青藏高原湖泊面积多种影响因素,构建青藏高原湖泊面积的原形,通过温度变化趋势,地形的起伏,海拔,以及青藏高原面积和分布数据,分析各种因素对湖泊面积的影响,并对2015年的湖泊面积进行预测

提供的数据:公开可以获得的数据,一些遥感影响数据,海拔,另外一个数据来源是采用众包采集处理之后的数据。

第十题:全国农产品价格的预测分析

出题方: 普开数据

题目:预测今年农产品产量,预测下一年销售以及农产品价格涨幅

提供的数据:云南省 5 年各个农产品的数据

启动仪式后,全球数千支参赛队伍将就企业单项奖、CCF综合奖展开从初赛、复赛到决赛为期3个多月的激烈比拼,冲击总计75万元的高额奖金池。奖金和奖牌将于2016年12月31日的颁奖晚宴揭晓。

2016CCF大数据与计算智能大赛邀您登陆大赛指定平台 DF(DataFountain, http://www.wid.org.cn),迎接大数据竞赛带来的挑战,不见不散!

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2016-09-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

吴喜之:数据分析和数据挖掘是最大的求职法宝

本文是中国人民大学教授吴喜之在“2015中国数据分析师行业峰会(CDA•Summit)”上的演讲全文,演讲的主题是“如何成为一名数据科学家”。

11530
来自专栏PPV课数据科学社区

【涨姿势】绝不装逼的大数据科普(二)

言归正传,今天带来浅显易懂的大数据科普(二),会围绕一些大数据的关键概念重点普及一下,如果您已经很懂了也不要跑,本文可作为您的最佳厕所读物。 数据(data)这...

28860
来自专栏数据科学与人工智能

【数据科学】什么是数据科学家与数据科学

仅仅在几年前,数据科学家还不是一个正式确定的职业,然而一眨眼的工夫,这个职业就已经被誉为“今后十年IT行业最重要的人才”了。 一、数据科学家的起源 “数据科学”...

29560
来自专栏大数据文摘

在大数据的世界中蓬勃发展

15850
来自专栏AzMark

或对,或错?

公号许久没更文了,这段时间以来,自己在面临着一些抉择。未曾想过,毕业后一个月考虑的事情比大学四年加起来的还要多。也许是大学过得太安逸了,欠的债全部攒到毕业后来还...

12720
来自专栏大数据文摘

城市计算:让我们憧憬明天的北京

16560
来自专栏全栈数据化营销

数据分析视角:咪蒙凭什么写出那么火的文章

       写这篇文章最主要的,是想说明数据和数据分析在工作和生活中的实用性和重要性,顺便说一说我认识的咪蒙。       很早很早之前就听过关于咪蒙的各种...

44080
来自专栏大数据文摘

2016年10个重要的可视化发展

15830
来自专栏顶级程序员

哪些人工智能电影演得最逼真?

在 1982 年的电影《银翼杀手》的开幕镜头中,一个调查员不断向询问一名为 Leon 的机器人,旨在激发他的情绪反应。在电影中,同情心是区分人类与人工智能(A...

37360
来自专栏奇点大数据

AI虽好,转行仍需谨慎

最近不少同学在问我现在AI工程师工资这么高,想转行来学AI,让我给点意见或者建议。我在这里就集中说一下自己的看法。

24150

扫码关注云+社区

领取腾讯云代金券