我正在尝试从一个相当大的语料库中随机抽取KWIC示例。对于较小的语料库,我可以使用xtable查看整个KWIC输出,然后创建随机数列表来识别并复制和粘贴随机示例。但是对于更大的语料库,这是行不通的,因为KWIC对象中有超过500,000个示例。
有没有办法对此进行编码,以便我可以将KWIC对象限制为30或40个命中的随机样本,而不是所有命中的列表?非常感谢你的帮助。我在文档中看不到任何明显的方法。
发布于 2019-02-28 23:44:41
好吧,我应该更加努力的尝试找到我自己问题的答案。下面的代码实现了我希望做的事情:
要求kwic <- kwic(cfrcorpus,pattern = "requir*",window = 50)
samplerequirekwic <- requirekwicsample(nrow(requirekwic),15),
https://stackoverflow.com/questions/54928650
复制相似问题