深圳商报2018年12月25日讯 记者昨日从阿里云获悉,在此前结束的MS MARCO文本阅读理解挑战赛中,阿里AI创造了阅读理解能力测试的新纪录。目前,阿里AI可以在毫秒内,读完4300万字的《大英百科全书》,并且可以完成初中语文阅读理解试题。
MS MARCO挑战赛是AI阅读理解领域的权威比赛,它包含100多万个问题和300多万篇文档,相当于参赛机构提供的AI模型,需要阅读完维基百科中的所有文章。测试结果显示,阿里AI模型在英文阅读理解比赛中,得分超过了微软等研究机构,排名第一,接近人类理解水平。
传统AI阅读需要某一领域的专业人士准备好问答数据,AI回答也仅限于该领域,例如金融领域的人工智能无法回答物流领域的问题,但阿里AI正在往人类思维模式接近。阿里巴巴的突破在于提出“深度级联机器阅读模型”,它可以模仿人类阅读理解的过程,先对文档进行快速浏览,并定位到可能回答问题的段落,然后针对相应段落进行精读,并根据“自己的理解”回答问题。
阿里AI可以像人类一样在阅读并理解后,快速应对天马行空的问题。比如,4300万字的《大英百科全书》,阿里AI可以在毫秒内阅读完,并根据自己的理解快速回答涉及书中不同领域的不同问题。例如亚洲有多少个国家?美国第五任总统是谁?恐龙是什么时候消失的?机器人可以分别迅速给出答案。
据了解,目前阿里巴巴的人工智能,已经可以阅读并较好理解小说、诗歌、法律条文以及学术文献这类相对复杂的内容,并且可以完成初中语文阅读理解试题。此外,阿里AI阅读理解技术也已经率先大规模应用于淘宝、天猫以及东南亚第一电商Lazada,提供了包含中文、英语以及印尼语等多种语言的智能客服服务。阿里客服机器人“阿里小蜜”,在今年双11全天承担全平台98%客服咨询量,相当于10万人工客服一天的工作量。
“阿里AI在阅读理解上拥有天然的场景优势,海量商业在线咨询为机器提供了丰富学习文档,这是机器变得更加智能的前提。”阿里巴巴达摩院自然语言首席科学家司罗表示,“随着阅读理解能力进一步提高,人工智能未来将成为人们的私人老师和私人助理,帮人们阅尽天下知识并提供决策参考。”(陈姝)