Google 开源了世界上最准确的语言解析器 Parsey McParseface

2016-05-13 15:14

译自：http://www.slashgear.com/google-makes-parsey-mcparseface-language-tool-open-source-12439901/ 作者： Brittany A. Roston
转自：http://www.cnbeta.com/articles/500905.htm

Google 已经发布了开源的 SyntaxNet 自然语言神经网络框架，以帮助机器更好地理解自然语言。SyntaxNet 中包括了 Parsey McParseface，后者是一种专门用于“解剖”英语的语言解析器。Google 称之为世界上最准确的语言解析器，并且已经放出了允许人们借助自有数据来训练 SyntaxNet 的全部代码。

SyntaxNet 和 Parsey McParseface 都是自然语言理解（NLU）系统的一部分。给出一个句子，它就会将之分解成各种部分，比如名词、动词、形容词。

对自然语言研究人员和需要这种应用程序的人们来说，这款开源工具显然会助力相关研究的爆发式发展。

据 Google 自述，经过 TensorFlow 框架训练后的 Parsey McParseface，是其出产的“最复杂的网络”之一。

在某一测试中，他们发现该模型的准确度超过94%——作为比较，训练有素的语言学家的准确率在96-97%左右——这表明该软件的技能熟练度已与人类相当。

SyntaxNet目前已在GitHub上线，更多内容请翻阅Google论文。