自然语言生成是从机器表示系统(如知识库或逻辑形式)生成自然语言的自然语言处理任务。-维基百科
NLG是关于建立有意义的句子、报告等吗?NLG也能建立有效的字典词吗?例如,在不查阅/阅读英语(或任何语言)词典的情况下,算法能生成这样的单词吗?
发布于 2015-08-09 18:49:55
在NLG的上下文之外(因此不是对整个问题的直接回答,而是对您问题标题的回答):从字符级别的模型中生成单词是通过向大量文本语料库(如维基百科内容)暴露的RNN完成的,并接受了逐字符预测文本的训练。
用于生成内容时,通常会向模型提供几个起始字符,并要求预测下一个字符。从其最有可能的预测中做出选择,并反馈给它继续这个序列。
这是一个博客,展示了一些莎士比亚和维基百科的例子。
这样的网络可以而且确实会产生无稽之谈,尽管它们通常是合适的,读起来可能就像你可以根据上下文预期的名词或动词。句子的结构和语法可以说是正确的,但语义内容通常是完全胡说八道的。
发布于 2015-08-11 12:22:01
您正在寻找用于字符级语言模型的递归神经网络。
https://datascience.stackexchange.com/questions/6737
复制相似问题