在阅读了BERT论文(https://arxiv.org/abs/1810.04805)之后,我仍然对输入(单词)取什么感到有点困惑。
他们指的是一篇论文,本质上是对单词进行标记化,但没有明确地展示它是什么样子的。
谢谢你的澄清。
汤姆
发布于 2019-02-22 04:48:45
如果您能看到BERT's official Github repo中提供的真实示例,那会更好。tokenization一节也许能让您更好地理解它的实际工作原理。
https://stackoverflow.com/questions/54537716
复制相似问题