我已经建立了一个测试语料库的三角图模型,我想要计算最大似然估计。
假设我们有以下案文:
text = "The white fox, The white fox, the black fox."
它的曲线图是:(The white fox), (white fox The), (fox The white) ...
要做到这一点,我将不得不计算所有的事件,比如“白色”,然后是以“狐狸”结尾的所有曲线图,然后是“白色”、“黑色”等等。
是否有更好的方法,而不是迭代所有的三角图,分割它们,阅读它们的内容,看看它们是否是我现在的迭代所需要的?
我知道nltk,但这是为了学习,我宁愿自
我有一个很大的数据集,标题是x轴上的Site.377,我想要X列中的时间,然后其他4列的标题是Results1、Results2和Results3。我想把它们都放在同一张图上,以比较Results1到3在一段时间内的比较情况。
我目前所做的是:
library(ggplot2)
p <- ggplot(Site.377, aes(x=X, y = Results1) #This was just an attempt to get one of them to post
p + geom_line()
当我这样做的时候,得到的曲线图只是将所有的数值压在一起并堆叠在一起。看起来像一列重叠的
我正在使用以下代码:
ggplot2::ggplot(gtfDf, ggplot2::aes(x = type)) +
ggplot2::geom_bar(position = ggplot2::position_dodge(width = 2)) +
ggplot2::xlab('Type of feature') +
ggplot2::ylab('Number of features') +
ggplot2::ggtitle('Number of features of each type in the GTF file'