作为数据挖掘研究领域最具影响力的国际顶级赛事,素有“数据世界杯“之誉的KDD Cup日前正式公布了KDD Cup 2019三项重大赛事,包括Auto-ML Track、Regular ML Track及Humanity RL Track三场比赛,其中开赛22年以来首次引入的AutoML Competition挑战赛受到不少学术及工业界专业人士的关注。
AutoML(Automated/Automatic Machine Learning,自动机器学习)旨在研究在没有专业知识的情况下、使用的低门槛甚至零门槛的机器学习算法,在AI人才紧缺的情况下,AutoML可以降低AI落地过程中对科学家的依赖,是2014年以来机器学习领域最炙手可热的研究对象之一。2018年1月,谷歌高调推出自动机器学习产品Cloud AutoML,再次将这项技术推向更多人的视野中,目前AutoML已成为国内外科技巨头关注的焦点。
由于日益受到学术界、工业界的广泛关注,NeurIPS、IJCAI等学术顶会从去年开始将AutoML视为重点。
本次KDD Cup选择将其纳入比赛内容,并为此打破历来数据挖掘方向赛事的传统,也是基于对AutoML技术发展趋势和落地价值的认可。对此,KDD Cup主席Taposh Dutta-Roy表示,AutoML是今年KDD关注的重点,也是一项AI落地的关键技术。
据了解,本次KDD Cup AutoML挑战赛由第四范式主办,微软、AutoML领域最权威的学术组织ChaLearn协办,并为此次比赛设置了“史上”难度最高的比赛项目——基于时序关系型数据的AutoML。
时序关系型数据在在线广告、推荐系统、金融市场分析、医疗等应用场景中非常常见,人们往往需要利用这样的数据去构建机器学习模型,并应用机器学习模型提升对应业务的效果。
赛事主要负责人、第四范式资深算法科学家涂威威表示这是AutoML比赛历史上首次考虑时序关系型多表数据,会重点考察AutoML在实际应用场景中的能力,应对关系型、时序等多表类型数据的挑战,探索AutoML解决实际问题的价值。竞赛已于4月1日正式拉开帷幕,挑战赛分Feedback(反馈)、Check(校验)、AutoML(盲测)3个阶段,最终根据AUC排名选出冠军团队,并在7月20日公布比赛结果。
值得一提的是,KDD Cup比赛向来由具备深厚学术积累和行业实践的顶级企业或高校承办,竞争极为激烈,历届承办方包括微软、阿里等巨头公司和卡耐基·梅隆大学等知名高校。
大数据文摘据大赛的主办资质等问题采访了本次的主办方之一——第四范式资深算法科学家、也是本次AutoML主委会成员涂威威,他表示KDD Cup每年赛事需要大家提案,组委会会根据赛事挑战性、实际应用性、赛程规划等多维度标准来筛选赛事方案。
第四范式作为首届KDD CUP AutoML大赛的主办方,将会肩负起赛事提案、数据提供、平台搭建、赛事报名招募、竞赛以及评选等全部流程重任。
“具体审核流程并不清楚,我们在KDD Cup赛事提案获得了组委会及主席的认可和信任,KDD Cup的Chair也充分表明了对AutoML应用价值的肯定。”
AI技术的发展,兴起于比赛,成功于行业,此前ImageNet赛事推动了一大批CV公司的成长,并且极大地促进了行业爆发。AutoML的产业发展延续了这个路径,此次首登“数据世界杯”的比赛舞台,KDD平台将有望吸引更多“全球最聪明的大脑”参与到AutoML进程中,AutoML或将落地于更广泛的行业和场景,迎来新的发展高峰。
对于这次新增赛题AutoML,涂威威也表示,反映了整个大行业的AI自动化趋势。因为AI人才紧缺始终是AI落地的核心痛点,自动化工具就是试图解决这样的痛点,正在成为改变目前AI科学家瓶颈以及行业应用门槛的关键技术,近年来AutoML已成为国内外科技巨头关注的焦点。
“AutoML是机器学习国际研究的前沿,需要更多的研究者参与到基础算法研究和实际落地中来,我们深知需要整个学术界和工业界一起来推动技术的进步,因此我们做了很多实际的推动,KDD Cup最终选择重点关注AutoML比赛,并引用我们的比赛作为AutoML大赛的示例与首秀,也从侧面证明了我们这几年推动的正向效果。”
最后,对于本次“史上最难比赛项目”,第四范式也为参赛者提供了一些小tip:
首先,欢迎更多对AutoML关注和有兴趣的同学参加比赛,甚至加入我们一起推动AutoML的发展,共同探索AutoML无限可能。
需要提醒参赛者提交AutoML方案是需要注意的几个关键点:
如何自动生成有效的时序信息?
如何将多个相关表信息有效整合?
如何解决数据分布随时序缓慢变化的问题?
如何自动捕获有意义的表间联系?
如何自动高效地选择合适的机器学习模型和超参数?
如何让方案更通用,即如何使其适用于未知的任务?
如何保持计算和内存成本可接受?
希望所有参赛者能在本次挑战赛中,充分展示自己的能力和风采,取得更好的成绩。当然,AutoML技术的发展还有很多更具挑战性的难题在前面等着我们,在今后比赛中我们会继续与大家一起挑战更高难度的问题,让AutoML真正大幅降低了机器学习的应用门槛,赋能非机器学习背景的人可以轻松使用。
目前,KDD2019官网已经放出了大赛的三个赛题,其中,AutoML比赛详情页面已经发布。SIGKDD-2019将于2019年8月4日至8日在美国阿拉斯加州安克雷奇举行。比赛预计将持续2-4个月,获胜者将在2019年7月中旬被通知,并在KDD会议开幕式上接受颁奖,最终在会议期间在KDD杯研讨会上展示他们的解决方案。
-
数据挖掘
+关注
关注
1文章
406浏览量
24185 -
机器学习
+关注
关注
66文章
8344浏览量
132288 -
ai技术
+关注
关注
1文章
1250浏览量
24187
原文标题:“数据世界杯”KDD Cup 2019赛题正式公布,首次挑战AutoML产业落地最大难题
文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论