交汇点讯 让人们说说话,就可以自由查询内容丰富的数据库——目前国际上人工智能领域新兴的研究方向NL2SQL,致力于将自然语言自动转换成机器语言。这种转换,可在金融、零售、物流、交通等诸多领域应用,降低数据库的使用门槛,使数据发挥更大的价值。10月12日,首届中文NL2SQL挑战赛决赛在南京大学举行。国防科技大学、浙江大学等5支团队的聪明脑袋们,从多个国家地区的1400多支队伍中冲出重围,比拼将自然语言“翻译”成机器语言的准确度。
查询数据库中的大量数据,需要使用像SQL这样的机器能够理解的语言,来进行人机交互。在电商平台购物、房地产网站搜索心仪楼盘等等场景,都存在各种各样的数据库访问,但SQL以往需要专业人员编写,专业门槛的限制导致大量有价值数据沉睡。
在自然语言与机器语言之间,如何更好更快地架设沟通“桥梁”?NL2SQL将自然语言自动转成机器语言,相当于自动生成一座座“桥梁”,既减轻程序员的工作量,又让人们能更加随心地使用数据库,并且具有良好的体验。
这场比赛,吸引海内外1457支队伍参赛。参赛者既有来自北京大学、清华大学、南京大学、卡内基梅隆大学、新加坡国立大学等知名高校的研究人员,也有来自中国移动、中兴通讯等企业的技术人员。
大赛评委、南京大学人工智能学院教授俞扬告诉交汇点记者,NL2SQL具有很大的工业、商业价值,有广阔的应用领域,但相对于人工智能其他研究领域,NL2SQL研究者较少,大赛有助于激发更多专业人员对这一领域的关注。
大赛上,主办方、智能语义企业深圳追一科技有限公司,发布全球首个大规模中文NL2SQL数据集。该公司CTO刘云峰博士介绍,在人工智能中,自然语言处理是最难的领域之一。其中,中文的自然语言处理难上加难,因为中文十分简练,一个意思可能有多种表达,相差一个字也可能语义大逆转。数据集相当于一把尺子,让相关研究团队用来对比测量各自的算法模型,成为进一步开展研究的基础。在人工智能领域,每出现一个数据集,都极大地促进了技术进步。
交汇点记者 徐冠英
视频制作实习生 王安琪