首届中文NL2SQL挑战赛暨追一科技2020校招提前批
结构化的数据库,一直是企业最具价值的宝藏。
多年来,人们紧随技术潮流,不断探寻更好的技术方案与工具,挖掘企业数据价值。现在,新一代的数据库打开方式曙光在即。NLP与数据库的交互,正在碰撞出全新的火花,这就是NL2SQL,一个充满无限潜力的AI任务,等你来战!
【首届中文NL2SQL挑战赛正式启动】
6月3日,首届中文NL2SQL挑战赛正式上线启动。大赛由国内领先的智能语义公司追一科技主办,将发布全球首个中文数据集,向海内外高校学生、研究机构、企业开发者开放,共同推进NLP在数据库交互上的创新研究与普惠应用。
【奖项设置】
奖金池16.5万
一等奖8万(1支队伍)
二等奖5万(1支队伍)
三等奖2万(1支队伍)
优胜奖获价值7500元的数码产品(2支队伍)
获奖者均可获得校招offer直通卡,免简历筛选和笔试,直接进入技术面试。
【比赛日程】
初赛:本地训练和预测,6月24日-8月6日
复赛:线上训练和预测,8月19日-9月9日
决赛:线下答辩和颁奖,9月-10月(具体时间、地点待定)
【报名方式】
1) 截止报名及组队变更时间:2019年8月5日12:00(UTC+8);
2) 选手可单人成队或1-3人组队参赛,每位选手只能加入一支队伍;
3) 报名方式:登录比赛官网,完成个人信息注册,即可报名参赛;
4) 选手需确保报名信息准确有效,组委会有权取消不符合条件队伍的参赛资格及奖励。
【参赛地址】
https://tianchi.aliyun.com/markets/tianchi/zhuiyi
https://tianchi.aliyun.com/markets/tianchi/zhuiyi
https://tianchi.aliyun.com/markets/tianchi/zhuiyi
【评委介绍】
众多人工智能学术大咖将担任本次大赛评委,包括新加坡南洋理工大学副教授、博士生导师毛可智,南京大学教授、博士生导师俞扬,东南大学教授漆桂林等。
毛可智:新加坡南洋理工大学副教授,谢菲尔德大学博士。在机器学习、文本分析、自然语言处理和信息融合方面拥有20多年经验,发表了大约100篇科学论文。
俞扬:俞扬博士,南京大学教授,中组部万人计划青年拔尖人才计划。主要研究领域为机器学习、强化学习。获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。发表论文40余篇,获得4项国际论文奖励和2项国际算法竞赛冠军,入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘"青年成就奖”,受邀在IJCAI’18作关于强化学习的"青年亮点"报告。
漆桂林:东南大学教授、博士生导师,东南大学认知智能研究所所长,英国贝尔法斯特女皇大学博士,发表高水平学术论文 150 余篇。
【比赛规则】
本届NL2SQL比赛目标是利用NLP解决传统数据库交互问题,打通人与结构化数据间的壁垒,更有效地利用结构化数据,实现人机交互体验升级。涉及到结构化数据、文本等多个不同领域的多分类问题。追一科技将提供预处理好的数据集,并建立一个数据交换库,以实现数据驱动型学习。参赛者最终提交NL2SQL模型方案,在多个全新的测试数据集上盲测,按盲测的效果进行最终排名。
初赛(6月24日-8月6日,UTC+8)
1) 报名成功后,参赛队伍通过天池平台下载数据,本地调试算法,在线提交结果。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。
2) 比赛提供标准训练数据集及验证数据集(含标注),供参赛选手训练并校验算法模型;提供标准测试数据集(无标注),供参赛选手提交评测结果参与排名。
3) 初赛阶段: 7月1日10:00-8月6日10:00。系统每天进行1次评测和排名,评测开始时间为当天12:00,按照评测指标从高到低进行排序,定时更新排行榜;排行榜将选择参赛队伍在本阶段的历史最优成绩进行排名展示。
4) 初赛截止后(8月6日10:00AM最后一次评测),组委会将进行排名前20名参赛队伍的入围操作和通知。同时要求TOP20团队提交代码审核,组委会将审核选手提交的代码,并终止靠人工标注而没有算法贡献的队伍参赛,晋级空缺名额后补。
复赛(8月12日-9月9日,UTC+8 )
1) 复赛数据不可下载,选手需使用PAI-DSW平台完成数据处理、建模、算法调试、产出结果等所有环节。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。
2) 复赛阶段:8月12日12:00-9月9日10:00。系统每天进行1次评测和排名,评测开始时间为当天10:00,按照评测指标从高到低进行排序,定时更新排行榜;
3) 复赛截止后(9月9日10:00AM最后一次评测),TOP20团队需提交代码和资格材料审核。经审核符合要求的排名前5名参赛队伍将受邀参加决赛。
决赛(时间待定)
1) 决赛将以现场答辩会的形式进行,晋级决赛团队需提前准备答辩材料,包括答辩PPT、参赛总结、算法核心代码、现场演示demo。
【主办方简介】
追一科技是一家主攻深度学习和自然语言处理的科技公司,致力于以业界最领先的AI解决方案、产品和服务,为客户和用户创造价值,共创未来人类美好生活。希望通过本次NL2SQL赛题,打通人与结构化数据间的壁垒,更有效地利用结构化数据,实现人机交互体验升级。
追一科技成立于2016年,是国内领先的智能+企业服务公司,主攻深度学习和自然语言处理,通过将AI交互能力与企业服务场景深度结合,为企业提供整体智能化解决方案,帮助企业降本提效、升级用户体验、挖掘更多营销价值。2019年4月2日,追一科技完成C轮4100万美元融资,由招商局旗下中白产业投资基金领投,创新工场、晨兴资本、高榕资本和GGV等跟投。追一科技被李开复先生评价为全国乃至全世界最好的NLP公司之一。
【参赛地址】
https://tianchi.aliyun.com/markets/tianchi/zhuiyi
https://tianchi.aliyun.com/markets/tianchi/zhuiyi
https://tianchi.aliyun.com/markets/tianchi/zhuiyi