随着技术的进步,工业已经向自动化和智能化方向发展。在这方面,人工智能和机器学习发挥了至关重要的作用。自然语言处理( Natural language processing,NLP)是计算机科学和语言学的一个研究领域,主要研究处理自然语言的方法。那么,在自然语言处理中,有限状态机FSM和下推自动机哪个更可靠、更有效呢?
发布于 2020-04-13 20:45:08
尽管有许多技术可以做NLP,但最先进的方法是使用深度学习。在使用深度学习技术的NLP中显示了许多显着的改进。这是因为以低成本获得的巨大处理能力造成的。如果你想阅读在自然语言处理领域或任何其他研究领域使用的尖端技术,请访问谷歌学者(https://scholar.google.com/)。
发布于 2018-01-27 03:29:12
看起来你真正想问的问题是:“在自然语言处理中有哪些有效的技术?”但我会先回答你的问题。
首先,FSA (有限状态自动机)和PDA (下推自动机)都不足以对语言进行建模。FSA可以处理常规语言。然而,他们甚至不能回答一个单词是否为回文的问题。PDA更强大一些,可以回答这样的问题。图灵机提供通用的计算,对于编写任意复杂的程序很有用。
现在开始弥合这一差距。自然语言不是常规语言。因此,他们不能由FSA处理。一些上下文无关的文法,如LR(k)文法是由PDA处理的,然而自然人类语言并不是上下文无关的。作为一个例子。以下三个陈述。“吉尔开车去杂货店见她的朋友萨利,然后她去接她的孩子。萨利买了三盒麦片。然后她开车去学校。”虽然这是糟糕的语法,但它是“自然”的,因为它们是人们发出的话语,并且通常可以被其他人解析。第三句中代词“她”的先行词显然是指吉尔,因为她是有孩子的那个人。然而,它是模棱两可的,我们必须推断出这种联系。
自然人类语言中上下文的大量歧义使得不可能进行确定性的句法分析。取而代之的是,我们转向统计和决策理论领域,以对通信的最大可能模型进行推断。
语音和写作中的局部性但非确定性是使机器学习技术的应用,如利用深度递归神经网络,与经典的基于规则的对应物相比非常有效的原因之一。
虽然术语神经网络有点用词不当,因为从神经学的角度来看,人类的大脑最终要比这些基本模型复杂得多,但通过近似推理进行的一般学习表面上是接近现实的。我们最好将这些方法称为"Differentiable Computing“,但这是另一次的题外话。
总而言之。你实际问到的问题的答案是,PDA将产生比FSA更好的模型,但与基本的统计方法相比,这两种方法都是毫无价值的。
如果你对NLP感兴趣,我会推荐一门机器学习的课程和一门深度学习的后续课程。
Andrew Ng有一系列很好的针对初学者的课程。在那之后,我将在Tensorflow中跟进Sirajs的深度学习课程。
https://stackoverflow.com/questions/48462052
复制相似问题