大赛简介
2016 CCF大数据与计算智能大赛(BigData & Computing Intelligence Contest,简称“BDCI”),是由中国计算机学会主办的大数据及人工智能领域算法挑战及应用创新大型赛事。
大赛面向大数据重点行业和应用领域征集需求,以大数据前沿技术、行业应用问题为导向,以大数据促进行业发展及产业升级为目标。大赛至今已成功举办三届,每一届都受到社会各界的广泛关注,得到百度、阿里、联通、亚马逊等国内外知名企业的大力支持与参与,吸引了来自国内外知名高校和研究机构逾6000支队伍参赛。
大赛提供了大数据问题众筹、数据众包、人才众创的新模式以及开放式创新创业平台,为社会输出了大量高质量的大数据人才,极大的推动了大数据技术及产业生态发展。
2016年,大赛将进一步通过创新实现平台化、常态化和专业化。相信在庞大专家群体、广大参赛队伍和社会各界的共同努力下,大赛将发掘更多的创新成果、涌现更多的优秀人才、形成更高的品牌价值,最终为促进我国大数据产业的长足发展做出更大的贡献。一个大数据与计算智能引领社会发展的时代令人期待
大赛官网:
赛题微信链接:
http://mp.weixin.qq.com/s?__biz=MzI5ODQxMTk5MQ==&
mid=2247483748&idx=2&sn=5d3013434672cfc99667b25cc739252
7&chksm=eca773dcdbd0faca59e2897c7ac014ad59f657cc
026be21f30f3c30ff5c2c4e22e10ce094544&mpshare=
1&scene=1&srcid=0926bLGUgRQMrNrtYgjGEGVs#rd
赛程设置
9月24日,大赛启动仪式
9月25日-9月30日,大赛预报名,赛题预览
10月1日-11月14日,大赛正式报名,初赛作品提交及评审
11月15日-12月19日,进入复赛阶段,复赛作品提交及评审
12月30日:企业单项奖角逐
12月31日:CCF综合大奖角逐 & 颁奖晚宴
奖项设置
企业单项奖
奖金池60万元
企业单项奖共11组,每组分为一等奖,二等奖,三等奖,个数不定。
CCF综合奖
奖金池10万
CCF大赛特等奖1名:3万元CCF单项奖3名:1万元/名优秀指导老师奖
青岛万国云商特别奖
奖金池50万
赛题介绍
01
赛题名称:基于视角的领域情感分析
企业名称:国双
赛题类型:算法挑战
赛题背景:同一段文本,从不同的视角分析,其情感判断可能不同,如"途观配置比桑塔纳好很多"中,从“途观”的视角进行情感判断为正面,从“桑塔纳”的视角进行情感判断则为负面。本赛题希望对于一段文本,输入为视角词,输出为文本基于视角的情感类别,包括正面、负面、中性。
技术方向:情感倾向性判断,自然语言理解
02
赛题名称:客户用电异常行为分析
企业名称:国网信通产业集团
赛题类型:算法挑战
赛题背景:国家电网通过对用户及所属变压器进行异常监测,并通过现场检修人员根据异常情况对用户进行抽检,并反馈检查结果,如发现为窃电用户,将反馈窃电用户信息。
本赛题希望通过提供相关数据与检查人员检查结果,由参赛者建立窃电检测模型,识别用户窃电行为。
技术方向:用户异常行为检测,分类,机器学习
03
赛题名称:客户画像
企业名称:国网信通产业集团
赛题类型:算法挑战
赛题背景:本赛题由国家电网公司提供国家电网公司采集的关于用户电费计量数据、95598呼叫行为数据、停电事件信息、电费电量、满意度评价的相关数据。
本赛题希望参赛者利用大数据分析算法与技术,以及文本分析技术,从客户用电行为、呼叫行为、受理诉求文本内容中发现电力敏感客户特征,形成包括电费敏感标签、停电敏感标签在内的电力敏感客户标签体系,帮助系统更快速、准确地识别电力敏感客户
技术方向:用户行为预测,分类,机器学习
04
赛题名称:Human or Robots?
企业名称:AdMaster
赛题类型:算法挑战
赛题背景:仅2016上半年,AdMaster反作弊解决方案认定平均每天能有高达 28% 的虚假流量,即由机器人模拟和黑IP等手段导致的非人恶意流量。本赛题希望通过用户行为日志,自动检测出这些虚假流量。
技术方向:异常流量检测,计算广告,分类,机器学习
05
赛题名称:监控场景下的行人精细化识别
企业名称:寰景信息-安徽大学联合实验室
赛题类型:算法挑战
赛题背景:行人属性精细化识别是智能监控技术的重要组成部分。本赛题提供监控场景下多张带有标注信息的行人图像,要求参赛者在定位(上身、下身、鞋子、帽子、包等)的基础上研究行人精细化识别算法,自动识别出行人图像中行人的属性特征。标注的行人属性包括性别、体态、衣着、帽子、包等,并提供图像中行人头部、上身、下身、脚部、包等位置的标注。
技术方向:图像识别
06
赛题名称:生活大实惠,O2O优惠券使用预测
企业名称:蚂蚁金服
赛题类型:算法挑战
赛题背景:以优惠券盘活老用户或吸引新客户进店消费是O2O的一种重要营销方式。然而随机投放的优惠券经常形同鸡肋,甚至对用户造成无意义的干扰。对商家而言,滥发的优惠券会降低品牌声誉,同时难以估算营销成本。
个性化投放是提高优惠券核销率的重要技术,它可以让具有一定偏好的消费者得到真正的实惠,也可以赋予商家更强的营销能力。本次大赛为参赛选手提供了O2O场景相关的丰富数据,希望参赛选手通过分析建模,精准预测用户是否会在规定时间内使用相应优惠券。
技术方向:推荐系统,用户画像,用户行为预测,机器学习
07
赛题名称:自动驾驶场景中的交通标志识别
企业名称:驭势科技
赛题类型:算法挑战
赛题背景:交通标志的检测是无人驾驶技术中一项非常有挑战的任务,精确的检测对后续识别、辅助定位导航起着决定性的作用。交通标志的种类众多,大小、角度不依,本身就很难做到精确检测,并且在真实的行车环境中,受到天气、光照等因素的影响,使得交通标志的检测更加困难。我们将提供大量真实场景下的图片数据用于训练和测试,希望参赛者开发出来的算法能够实际应用在自动驾驶中。
技术方向:图像识别
08
赛题名称:大数据精准营销中搜狗用户画像挖掘
企业名称:搜狗
赛题类型:算法挑战
赛题背景:大数据精准营销中需要分析人群画像。在搜狗搜索每天都有大量的搜索行为,如何通过搜索行为得出搜索用户的画像,对于了解用户和精准营销都很关键。本赛题将在初赛时给出2万用户的百万级搜索词,以及经过调查得到的真实性别、年龄段、学历,作为训练集,要求对另外2万人群的搜索关键词进行分析,给出其性别、年龄段、学历等用户属性信息。复赛时训练集与测试集规模均将扩展至10万用户。
技术方向:用户画像,机器学习
09
赛题名称:农产品价格预测分析
企业名称:普开数据
赛题类型:算法挑战
赛题背景:预测是大数据的精华所在。本赛题希望通过大量的历史数据分析,预测农产品未来的价格走势,为决策者提供更有力的数据支持。本题目初赛基于全国各农场品交易市场的价格数据,复赛加上天气等多源数据,希望能够吸引对该课题有研究、感兴趣的参赛者,在全国范围内发现和培养相关技术人才。
技术方向:市场预测,数据挖掘
10
赛题名称:基于多源数据的青藏高原湖泊面积变化预测
企业名称:百卓网络&中科院计算机网络中心
赛题类型:算法挑战
赛题背景:本赛题提供最近5年的降水数据、温度数据、DEM数据、openstreetmap数据以及青藏高原湖泊数据,希望参赛者通过温度、降水、海拔高度、地形起伏度、人为因素等数据,预测青藏高原湖泊面积变化。
技术方向:地理预测,多源数据整合,机器学习
11
赛题名称:依据用户轨迹的商户精准营销
企业名称:中国联通研究院
赛题类型:算法挑战
赛题背景:精准营销是互联网营销和广告营销的新方向,特别是在用户身处特定的地点、商户,如何根据用户画像进行商户和用户的匹配,并将相应的优惠和广告信息通过不同渠道进行推送,成为了很多互联网和非互联网企业的新发展方向。本题目以其中一个营销场景为例,提供用户位置信息、商户分类与位置信息等数据,希望参赛者能完成用户画像的刻画并进行商户匹配。
技术方向:用户画像,精准营销, LBS,机器学习