在本文“深度学习时代数据的不合理有效性”中,作者使用一个新的数据集JFT-300M探讨了大数据对深度learning.The的影响,作者描述了数据集具有重长尾,实际上,尾部很重,每一个category.At的图像少于100幅,约有2K类,每个category.At有20幅以下的图像。这种长尾似乎不会对随机训练产生不利影响,ConvNets (训练仍然收敛).I想知道背后的原因,还是用其他技术呢?
https://stackoverflow.com/questions/48496885
复制相似问题