昨天,谷歌发布了TensorFlow Lattice,想拯救被训练数据中噪音折磨的机器学习模型开发者。
TensorFlow Lattice是一个实现了基于快速评估和可解释模型的库,也称为插值查找表。用户可在将任意近似输入-输出关系的数据从查找表中提取出来,简化定义宏观规则限制模型的过程,使机器学习模型能更好地适应总体趋势。
△ TensorFlow Lattice的官方讲解
将单个输入对应至单个输出很简单,但在更复杂的多维函数中,可以存在多个输入。研究人员利用查找表能满足多个输入、近似灵活关系结构,满足用户想更好泛化指定单调关系的需求。
也就是说,训练查找表值是让训练样例的损失最小化,但此外,查找表中的临近值被限制在输入空间的给定方向上增加,这使这些方向上模型输出增加。
重要的是,由于在查找表之间插入了值,因此lattice模型平滑且预测是有界的。也就是说,TensorFlow团队通过训练数据训练查找表的输出,用约束条件将准确性最大化。
谷歌官方研究博客介绍:
https://research.googleblog.com/2017/10/tensorflow-lattice-flexibility.html
相关代码:
https://github.com/tensorflow/lattice
研究论文:
https://arxiv.org/pdf/1709.06680.pdf
安装方法:
https://github.com/tensorflow/lattice/blob/master/INSTALL.md
使用演示:
https://github.com/tensorflow/lattice/blob/master/g3doc/tutorial/index.md