Google 开源了世界上最准确的语言解析器 Parsey McParseface

2016-05-13 15:14


Google 已经发布了开源的 SyntaxNet 自然语言神经网络框架,以帮助机器更好地理解自然语言。SyntaxNet 中包括了 Parsey McParseface,后者是一种专门用于“解剖”英语的语言解析器。Google 称之为世界上最准确的语言解析器,并且已经放出了允许人们借助自有数据来训练 SyntaxNet 的全部代码。

SyntaxNet 和 Parsey McParseface 都是自然语言理解(NLU)系统的一部分。给出一个句子,它就会将之分解成各种部分,比如名词、动词、形容词。

对自然语言研究人员和需要这种应用程序的人们来说,这款开源工具显然会助力相关研究的爆发式发展。

据 Google 自述,经过 TensorFlow 框架训练后的 Parsey McParseface,是其出产的“最复杂的网络”之一。

在某一测试中,他们发现该模型的准确度超过94%——作为比较,训练有素的语言学家的准确率在96-97%左右——这表明该软件的技能熟练度已与人类相当。

SyntaxNet目前已在GitHub上线,更多内容请翻阅Google论文