前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CCF 大数据与计算智能大赛:挑战 11 题,成为顶尖数据科学家

CCF 大数据与计算智能大赛:挑战 11 题,成为顶尖数据科学家

作者头像
新智元
发布2018-03-23 17:12:24
9940
发布2018-03-23 17:12:24
举报
文章被收录于专栏:新智元新智元

2016年10月18日, 世界人工智能大会技术分论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容:美团技术学院院长刘江担任主持人,微软亚洲研究院常务副院长芮勇、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、联想集团副总裁黄莹、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。

【新智元导读】2016 CCF大数据与计算智能大赛9月24日启幕,发布了 11 道高质量创新赛题,涉及智能电网、搜索广告、O2O营销、舆情分析、监控识别、计算广告、无人驾驶、市场预测、LBS营销、气候预测等多个热门方向,将为图像处理、自然语言处理、用户画像、推荐系统等领域提供大量来自真实场景的问题与数据。想挑战?登陆指定平台参赛 http://www.wid.org.cn。

2016年第四届大赛以“大数据与计算智能”为主题,以“数据驱动,智见未来”为口号,成功吸引了数百位权威专家与行业大咖莅临现场,预计将有数千支专业队伍参与。为了更好地支持参赛者进行大数据技术研究,解决参赛者计算资源缺乏等问题,本次竞赛的专业大赛平台将联合各企业与科研机构,为优秀参赛者提供专业的云计算平台支撑。

本次大赛的11道高质量大数据与人工智能创新赛题,涉及智能电网、搜索广告、O2O营销、舆情分析、监控识别、计算广告、无人驾驶、市场预测、LBS营销、气候预测等多个热门方向,将为图像处理、自然语言处理、用户画像、推荐系统等领域提供大量来自真实场景的问题与数据,促进相关领域的技术创新。

第一题:用电异常行为分析

出题方:国家电网

题目:用电异常行为分析

提供的数据:国家电网供电区域的某一个区域的用户日电量信息;经过业务研判以后的异常的用电信息;经过判定后,核实为异常的用户信息。

参赛者可以根据这三个数据,发现窃电用户的行为特征,形成窃电用户的画像,准确的识别窃电用户,提高窃电的监测效率,降低窃电损失。

第二题:客户画像

出题方:国家电网

题目:客户画像

提供的数据:国家电网公司供电区域内某一个区域的,客服中心95598用户来电工单的数据;经过业务研判以后准确的停电信息数据,用户的同化信息数据;还有一个就是经过脱敏以后的用户清单。

第三题:通过搜索行为分析性别、年龄和学历

出题方:搜狗公司

题目:通过搜索行为,分析用户的性别、年龄和学历

提供的数据:一个10万用户量级查询的行为,是通过调研问卷等各种方式在线下得到的真实的性别、年龄、学历。一半数据作为训练题,另外一半作为测试题。

第四题:精准营销

出题方:蚂蚁金服

题目:分析用户在线上线下的行为,预测推给用户的优惠券是不是能够在一定的时间段内进行核销。

提供的数据:一定比例的在口碑网上的用户优惠券的核销历史用户,还有通过用户在口碑网在线下的商店的消费记录,还加入一些淘宝的数据。最后一块是LBS,如果大家去某一家店做消费的话,这个LBS的信息是会被记录的。

第五题:依据用户轨迹进行用户营销

出题方:中国联通研究院

题目:在每位用户维护了3千多个标签之后,联通发现这3千多个用户标签相对来说静态,当加入用户的时间信息和位置信息之后,我们期待着把多个标签能够下不同的由于地域和时间的变化之后来变动,另外解决多个渠道里面,实体线下渠道的营销活动的支持问题。

提供的数据:3万个用户的上网的详单记录,也就是3个月记录上网的行为记录和通话的话单记录。同时有1万个商户的一些位置数据和它的活动的行为数据。在这个原始数据的基础上,也给大家提供了中间的过程数据,也就是这3万个用户标签结果

第六题:人脸识别

出题方:合肥寰景信息

题目:特征人的属性锁定,人群的精细化分析在特定场景的应用。

提供的数据:通过提供一批相关的已经标注过的数据,请大家来对人的属性标注算法来做一些研究和探讨,能寻找一些比较快速的标注这些数据的方法和算法,从而在实际的应用场景里面能够解决一些特殊的问题。

第七题:基于视角的领域情感分析

出题方:国双技术

题目:基于视角的领域情感分析

提供的数据:行业专家从10万篇的文本当中精心挑选出来13000多条数据,其中8千条可用做模型的训练,5千条用做评测。

第八题:自动驾驶场景中的交通标志识别

出题方:驭势科技

题目:自动驾驶场景中的交通标志识别

提供的数据:一个是来自于欧洲的公开数据集,另外12000张图片,每张图片有1到10我交通标志作为这次的训练数据。

第九题:广告虚假流量检测

出题方:AdMaster

题目:广告虚假流量检测,用技术识别出来到底是机器人还是人的行为

提供的数据:近亿级的数据,是一个很庞大的数据

第十题:青藏高原湖泊面积测绘

出题方: 百卓网络

题目:通过研究青藏高原湖泊面积多种影响因素,构建青藏高原湖泊面积的原形,通过温度变化趋势,地形的起伏,海拔,以及青藏高原面积和分布数据,分析各种因素对湖泊面积的影响,并对2015年的湖泊面积进行预测

提供的数据:公开可以获得的数据,一些遥感影响数据,海拔,另外一个数据来源是采用众包采集处理之后的数据。

第十题:全国农产品价格的预测分析

出题方: 普开数据

题目:预测今年农产品产量,预测下一年销售以及农产品价格涨幅

提供的数据:云南省 5 年各个农产品的数据

启动仪式后,全球数千支参赛队伍将就企业单项奖、CCF综合奖展开从初赛、复赛到决赛为期3个多月的激烈比拼,冲击总计75万元的高额奖金池。奖金和奖牌将于2016年12月31日的颁奖晚宴揭晓。

2016CCF大数据与计算智能大赛邀您登陆大赛指定平台 DF(DataFountain, http://www.wid.org.cn),迎接大数据竞赛带来的挑战,不见不散!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-09-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档