http://blog.csdn.net/u011239443/article/details/78132697
标注错误:
纠正错误 dev / test 数据集的方法:
尽快的搭建你的第一个系统。
对于不同来源的数据,最佳方案可能并不是将其混合。如,我们最终需要预测的数据来自于app,那么 dev / test 数据集应该也要来自于 app。option 2 会是更好的选择:
对于三个不同的问题(不匹配数据或者说数据不是相同分布,偏差和方差),我们有不同的策略。为了判断是那种问题,我将 train 和 dev 的合并称为 training-dev,根据人类误差和不同数据集下的误差来判断是什么问题:
总结来说:
如:
总结:
当label向量中的某项y不存在,则不计算该项的交叉熵损失。
多任务学习的适用情况:
左边的是迁移学习的数据情况,右边的多任务学习的。
例如:
端到端的深度学习的优缺点:
使用端到端的深度学习需要注意的地方: