您的位置:首页 > 国内新闻

中国队伍包揽前三 PAKDD 2019 AutoML挑战赛圆满落幕

时间:2019-08-11
?

最近,亚太地区数据挖掘领域的顶级国际会议第23届亚太知识发现与数据挖掘(PAKDD)在澳门成功举办。南京大学人工智能研究所院长周志华在会上致开幕词。第四范式的首席科学家杨强教授,普渡大学副教授詹妮弗纳维尔,罗格斯大学生命教授熊辉,罗维拉维吉尔等大学教授何塞普多明戈 - 费雷尔等知名科学家,分享了知识挖掘领域的最新思想和技术进步。此外,会议的另一个重点是由第四范式,ChaLearn,微软和亚马逊共同组织的“PAKDD 2019 AutoML挑战”挑战。比赛的最终结果公布,颁奖仪式举行。来自微软亚洲研究院的DeepBlueAI ML Intelligence,北京航空航天大学的ML Intelligence和清华大学的Meta_Learners。来自中国的三支队伍在本次比赛中名列前三,充分展示了AutoML国内研究的实力。

据悉,此次AutoML比赛吸引了来自世界各地的127支队伍,提交了超过550个比赛项目,最终有31支队伍进入决赛进行决赛。游戏分为三个阶段:反馈阶段,测试阶段和AutoML阶段。根据AutoML阶段的AUC结果评估最终得分。排名前三位的排名在反馈阶段和AutoML阶段都是一致的。

本次比赛的标题是终身机器学习AutoML,旨在解决数据分布不断变化的动态环境中自动化机器学习带来的问题。在设计可以独立实现终身机器学习的设备时,有必要考虑许多挑战,例如计算效率,多种特征类型,概念漂移(概念漂移)和终生机器学习设置。

以本次大赛的DeepBlueAI方案为例,包括AutoML框架的自动特征工程,自动特征选择,自动模型调整,自动模型融合等,以及数据类别不平衡,概念漂移,时间空间等方面已经进行了。有针对性的处理和优化,以及有针对性的问题漂移问题,以及使用各种策略来有效控制运行时间和运行内存,以确保解决方案可以在指定时间内完成并限制内存整个过程,以及最终在挑战中脱颖而出。

除DeepBlueAI外,ML Intelligence还提供此竞赛的另一种方法。我们都知道,AutoML系统实现了从每批数据输入到每批数据输出的端到端自动化,无需人工参与。核心是自动算法,包括自动配置,自动调整,自动特征推导和自动过滤。在此竞赛计划中,ML Intelligence可以适应特征或样本的概念漂移,以适应长期学习和在线学习场景,并提出基于传统分布的基于模型的方法。分布的概念漂移检测方法不同,可以在不使用人类经验的情况下实现漂移特性的自动检测来做一些分布指标。实际操作是训练特别简单的GBDT模型以区分两个时间窗的样本并通过特征重要性排序对分布偏移进行排序。然后,为了适应场景,高阶导数特征和原始重要特征被区别对待。

此外,Meta_Learners团队设计了一个基于Gradient Boosting Tree和Concept Migration Adaptive的自动机器学习(AutoML)系统。基于传统的AutoML框架,结合本次竞赛的特点,有针对性地进行设计。首先,在特征工程方面,采用频率编码来实现类别特征的高基数和长尾分布特征。设计了自动特征工程模块,可以提取不同数据集的特征,提高模型的预测效果。多种功能组合;在概念迁移自适应方面,采用自适应流协同编码技术来提高数据集表示的一致性,从而提高预测性能。在超参数调整中,团队设计了一种分层自动调整策略,该策略结合了先验知识和自动搜索,以确保整个系统的效率和稳健性。

对于挑战的结果和计划的效果,竞赛负责人涂维伟和第四范式的高级范例表示,虽然比赛期间涵盖了农历新年假期和学生的最后假期,整个团队的提交超过去年的NeuroPS的AutoML比赛,每个人都非常有竞争力。与此同时,由于NeuroPS 2018的冠军队也宣布了他们的计划,我们也看到本次会议的前三大影响远远超过了NeuroIPS 2018冠军解决方案。与NeuroIPS AutoML解决方案相比,整体解决方案,时序特征处理中的前三个,非平衡数据处理和概念漂移处理有很多创新和进步。在未来,我希望每个人都积极参与未来的AutoML竞赛,共同推动AutoML技术在AI行业的应用和应用。

近年来,AutoML的学术研究和应用已逐步从前沿研究进入行业的主流发展阶段。越来越多的研究机构和企业开始开展AutoML研究工作,以外国ChaLearn,谷歌和国内第四范式为代表。 AutoML先驱们不遗余力地推动行业发展和应用。 PAKDD 2019 AutoML Challenge是今年AutoML的第一个挑战。接下来是KDD CUP 2019 AutoML和NeuroIPS 2019 AutoDL两年一度的AutoML年度竞赛。 KDD CUP是第一个AutoML挑战赛,它不仅创造了赛事。 22年历史的先例证明了AutoML在学术研究和行业应用中的兴起。

令人欣慰的是,AutoML一直处于国内发展的领先水平。在具有第四范式的国内AI企业的积极和动态努力下,一方面,技术研究成果迅速应用于实际生产和应用,另一方面,海外。顶级学术组织的组合,在世界各地的顶级会议上组织AutoML竞赛,并大力推动行业的发展,已成为AutoML技术背后最强大的支持者。 PAKDD 2019年AutoML比赛的前三名被中国队接管,展示了中国在AutoML领域的示范力量。

  • 友情链接:
  • 楚汉新闻门户网 版权所有© www.edu-china.net 技术支持:楚汉新闻门户网| 网站地图