我的限制是不可能在数据库上执行实时查询-我必须在夜间批处理作业期间将“索引”生成为平面文件。因此,从如下所示的db开始:1.这里的规则是“n”是第一列中字符串的长度,只有a-z和_是有效字符,任何其他字符被规范化为小写,或映射到_,group by n-gram子句可以应用于表。因此,我希望获得一个表,它允许我快速查找特定的n-gram,并获得包含该序列的行的所有I的列表。我不是一个足够聪明的SQL cookie来解决这个问题。你能?
编写一个函数construct_ngrams(语句,n),它接受输入参数语句(类型字符串)和n(类型整数),并返回包含从给定句子生成的N克的列表。如果不能生成这样的N-g(考虑情况),那么它只返回一个空列表。到目前为止我有这个 """Returns a list that counts N-gram generated from