迁移机器学习之特征迁移和关系迁移简介

特征迁移旨在通过引入源数据特征来帮助完成目标数据特征域的机器学习任务。一个机器学习任务中,可能由于目标特征域缺少足够的标签而导致学习的效果很差。通过挖掘源数据与目标数据的交叉特征结构,或者借助中间数据进行“桥接”,可以帮助我们在目标数据特征上进行的机器学习任务实现不同特征空间之间的知识迁移。例如,我们在进行图片数据分类时缺少足够带有标记的训练数据,就可以借助已经标注好的文本数据,以及具有交叉特征的中间数据来协助提高在图片数据上的学习效果。在识别图片中花的种类的任务中,如果缺少花种类的标注数据,我们就可以通过自然带有标记的wiki等相关文本数据源获得带有标注的源数据以及同时具有文本和图片的中间数据,通过对特征空间的聚类来挖掘共同的特征结构,帮助提高这一学习任务的准确性。

特征迁移通常假设源域和目标域间有一些交叉特征,是从共同的特征空间的角度迁移知识,其主要的研究方法包括特征的映射、迁移成分分析和基于神经网络的特征表示等。

关系迁移关注的是源域和目标数据域之间关系的相似性,通过从源领域挖掘与目标数据相关的关系模式,帮助在目标数据上进行机器学习任务。如生物病毒和计算机病毒之间,他们的相似关系包括了可复制性、传播性和破坏性;师生关系和上下级关系也具有相似性,包括服从性、学习性和指导性等。这些共同的关系模式可以帮助我们对目标数据的分布和性质有更加深刻的了解。目前针对关系迁移的研究还相对较少,现有工作多通过逻辑网络来进行关系建模,从而描绘数据之间的关系模式。

关系迁移不再局限于数据样本、特征和模型这些具体的数据表达方式,而是更深刻地挖掘数据内部和数据之间的外在联系和相关性,为更好地进行数据学习提供了新的角度。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181108A0P0HY00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券