最新一项研究表明:人工智能可以帮助科研工作者撰写科学论文

更新时间:2019-05-07 22:12:23点击:531 科研管理新闻

包括本文在内,科学家的工作是阅读充满专业术语的期刊论文,并清楚知道用何种语言让没有相关科学背景的读者理解这些内容。现在,麻省理工学院和其他地方的科学家团队开发了一种神经网络——一种人工智能(AI)的形式,它可以做很多相同的事情,至少在有限的范围内:它可以阅读科学论文,并在一两句话中给出简单的英文摘要。即使在这种有限的范围内,这样的神经网络也可以帮助编辑、作者和科学家阅读大量的论文,以初步了解它们的内容。同时,该团队开发的系统也可以在语言处理之外的其他领域应用,包括机器翻译和语音识别。这项工作是一个不相关的项目的结果,该项目涉及到开发新的基于神经网络的人工智能,旨在解决某些棘手的物理问题。然而,研究人员很快意识到,同样的方法也可以用于解决其他困难的计算问题,包括自然语言处理,其效果可能会超过现有的神经网络系统。“这些年,我们一直在AI上做了各种各样的工作,“Soljačić说。“我们用AI来帮助我们做研究,基本上是为了更好地做物理。随着我们对AI越来越熟悉,我们注意到,每隔一段时间,就有一个机会为AI领域添加一些东西,因为我们从物理中学到了一些东西——某种数学结构或物理中的某种定律。我们注意到,嘿,如果我们使用它,它实际上可以帮助这个或那个特定的AI算法。”他说,这种方法可能适用于各种特定的任务,但不是所有的任务。“我们不能说这对所有的AI都有用,但在某些情况下,我们可以利用物理学的洞见来改进给定的AI算法。”一般来说,神经网络是模仿人类学习某些新事物的一种尝试:计算机检查许多不同的例子,“学习”关键的底层模式。这类系统广泛用于模式识别,例如学习识别照片中描述的对象。但神经网络通常很难将长串数据中的信息关联起来,比如解释一篇研究论文所需要的信息。研究人员说,人们已经使用了各种技巧来提高它的这种能力,包括被称为长短时记忆(LSTM)和门控递归单元(GRU)的技术,但这些仍然远远不能满足真正自然语言处理时的需要。该团队提出了一个替代系统,它不像大多数传统的神经网络那样基于矩阵的乘法,而是基于多维空间中旋转的向量,其中最关键的是他们所谓的旋转记忆单元(RUM)。事实上,该系统用多维空间中的向量表示文本中的每个单词——指向特定方向的特定长度的直线。随后的每个单词都将这个向量向某个方向摆动,表示在一个理论空间中,这样就可以有数千个维度。在这个过程的最后,最终的向量或向量集被翻译回它对应的字符串。“RUM能帮助神经网络很好地做两件事,”Nakov说。“这能帮助神经网络更好地记忆,也能让它们更准确地回忆信息。”发现RUM后,神经网络系统可以帮助解决某些艰难的物理问题,如光在复杂工程材料中的的行为,“我们突然意识到,这种方法可能对自然语言处理有帮助,”Soljačić说,回忆与Tatalović交谈,他指出,这样的工具将会有助于他的工作,因而他决定写相关的论文。Tatalović当时将探索人工智能科学作为他骑士奖学金的项目。“所以我们用这个系统尝试一些自然语言处理的任务,“Soljačić说。“我们尝试的一种方法是总结文章,似乎效果很好。”例如,他们通过两种不同的神经网络(基于LSTM的神经网络和基于RUM的神经网络)提交相同的研究论文,但得到的结果完全不同。LSTM系统得出了这个高度重复且相当技术性的总结:“Baylisascariasis”杀死老鼠,危及阿勒格尼地区的人,并导致失明或严重后果等疾病。这种被称为“baylisascariasis”的感染导致老鼠死亡,危及阿勒格尼地区的人,并导致失明或严重后果等疾病。这种被称为“baylisascariasis”的感染杀死了老鼠,已经威胁到了阿勒格尼地区的人。同一篇论文,RUM系统得出了一份可读性强的摘要,其中没有包含不必要的短语重复:城市浣熊可能会比之前设想的更容易感染人类。7%的被调查者对浣熊蛔虫抗体呈阳性。圣巴巴拉90%以上的浣熊都是这种寄生虫的宿主。基于RUM的系统已经得到了扩展,因此它可以“阅读”整个研究论文,而不仅仅是摘要,从而生成关于论文的摘要。研究人员甚至尝试在他们自己的研究论文中使用这个系统来描述这些发现——这篇论文就试图总结。本文是对新神经网络的总结:研究人员开发了一种新的表示过程,对RUM的旋转单元,一种可用于解决自然语言处理的广谱神经革命的递归记忆。它可能不是优雅的散文,但它至少击中了信息的关键点。英国人工智能公司的技术研究科学家Cağlar Gulcehre,没有参与这项工作,他说这项研究解决神经网络的一个重要问题,这些相关的信息中相隔时间或空间。“这个问题在人工智能中是一个非常基本的问题,因为在序列预测任务中需要对长时间延迟进行推理,”他说。“虽然我不认为这篇论文完全解决了这个问题,但它在回答问题、文本总结和联想回忆等长期任务上显示出了有希望的结果。”Gülçehre补充说:“由于本文所进行的实验和所提出的模型都是在Github上作为开源发布的,因此许多研究人员将有兴趣在自己的任务中尝试它。……更具体地说,本文提出的方法可能对自然语言处理和强化学习领域产生非常大的影响,而这些领域的长期依赖性非常关键。”这项研究得到了陆军研究办公室、国家科学基金会、麻省理工学院-人工智能联盟和半导体研究公司的支持。该团队还得到了《科学日报》网站的帮助,该网站上的文章被用于训练本研究中的一些人工智能模型。(本文是青塔网原创文章,青塔网开放转载,转载时,需注明来源,并保留图片水印及二维码,违者必究。)双一流科研管理新闻科研管理系统