如果文档中包含一个标记(X),我将尝试清理文本文档,并从文档中的每一行删除特定的单词。因此,对于以下一行:
Adäë ee tee tdX hnX dedas ödaX.字母表的字符是a, e, i, o, u, ë, ä, ö, t, d, n,所以X不包括在内。此外,标记X将始终是要删除的单词中的最后一个字符。我曾试图修改的声明,但我一直未能使它发挥作用。
我正在查看BigQuery中的文本序列,并试图识别多行(共享ID)上的单词完成情况。对于每个给定的ID和序列,我试图找到下一个单词的边界。, Boundary1, th, the1, the ca, the cat在上面的下一个行中,两个共享ID并以空格结尾的下一行提供了下一个(可以有多个)字完成边界。