据2015年10月美国麻省理工学院新闻,该校科学家将在2015年12月的神经信息处理系统年会上提出一种更加灵活的机器学习方法,该方法能够加强语义相关概念之间的联系。
在试验中,研究人员发现使用他们训练策略的机器学习算法可以更好地预测用户在Flickr网站应用于图像的标签。研究人员认为,当有很多的可能的类别时,传统的方法仅使用每一类的数据来训练该类的模型,这对所有其他类别都是不利的,因为这些类之间存在语义相关性。该研究团队利用语义相近类别的数据来训练模型。
(1)相近计分
通过梳理Flickr图像中经常同时出现的识别标签来量化语义相似性的概念,如阳光、水和影像。两个词的语义相似性是它们同时出现的频率的函数。
一般地,预测Flickr标签的机器学习算法尝试识别始终对应于特定标签的视觉特征。对于模型训练中的每一标签,如果算法预测正确,则获得得分;否则进行惩罚。对于与正确标签语义相关的不正确标签,MIT研究人员的算法获得部分得分。例如,一张水景图片被标记为“水”、“船”和“阳光”。在传统机器学习中,将此图标记为“水”、“船”和“夏天”的系统和将此图标记为“水”、“船”和“犀牛”的系统一样不会获得得分,但是MIT开发的系统将会获得得分。这个得分是标签“夏天”和“阳光”同时出现在Flickr数据库中的似然函数。
(2)人为错误
蕴含语义相似性的系统在预测语义相似性方面有较好的预测性,这听起来有些循环论证。但是,当网络用户试图查找在线图片时,一般的主题相关可能比精确的关键词更重要。
用户指定任意给定的Flickr图片的标签可以是各种各样的。根据语义相关性自动聚类生成的标签比人为定义的标签可能更有用。例如,MIT研究人员的测试集中的一张图片描述了一个穿着制服戴着头盔沿着丘陵小道骑着山地自行车的人。实际的标签是“春天”,“比赛”和“训练”。但是图片中的树是光秃秃的,草是棕色的,标签“比赛”和“训练”都不可能是正确的。MIT研究人员开发的系统预测此图的标签为“道路”,“自行车”和“选拔赛”,然而传统机器学习算法预测为“狗”,“冲浪”和“自行车”。