我读过post,它解释了滑动窗口是如何工作的,但是我找不到任何关于它实际上是如何实现的信息。
据我所知,如果输入太长,可以使用滑动窗口来处理文本。
如果我错了,请纠正我。假设我有一个文本“在2017年6月,Kaggle宣布它超过了100万注册用户”。
在给定一些stride和max_len的情况下,输入可以被分割成块,并带有超重叠的单词(不考虑填充)。
In June 2017 Kaggle announced that # chunk 1
announced that it passed 1 million # chunk 2
1 million registered users # chu