因此,我删除一些不必要的东西,如评论,描述一个动作,或者场景例如“[灭霸粉碎了宇宙魔方,得到了空间原石……]”, 以及说台词的角色的名字(实际上,这个名字是用来知道谁说什么,但不作为实际语料库的一部分,...结果是一个Doc对象,一个保存处理过的文本的对象。...“我知道”、“你认为”是一些最常见的短语
“知道”、“走”“来”,“得到”,“想”,“告诉”,“杀”,“需要”,“停止”和“希望”。我们能从中推断出什么?...——暗夜比邻星
看到“石头”作为第一个出现次数最多的结果并不奇怪,毕竟这部电影是围绕他们的。...因此,我使用了与查找前十名动词和名词相同的程序,但是是在角色级别上。
因为电影中有很多角色,所以我只选择了一些台词比较合理的角色,加上一些我最喜欢的角色:)。