干货 | 深度学习在携程攻略社区的应用

携程攻略社区是携程旗下的旅游攻略类社区,致力于为旅行者提供出行指南和资讯服务。依托携程2.5亿用户总量,社区日活跃用户超过500万,并汇集3000万条真实用户的旅行和酒店点评,并有40万篇旅行游记,2000位知名旅行达人。面对数据库中浩如烟海的信息,我们如何能去其糟粕,留其精华?

攻略社区的主要需求

攻略社区的数据比较复杂,包括了多语种,不同篇幅的自然语言处理,如用户评论,长短篇幅的游记,景点官网页面数据;图像数据处理,如用户上传的景点照片等多种应用场景。模型需要在极短的时间内对海量的这些信息进行正确分类。

深度学习及一些经典模型简介

介绍浅层机器学习模型和深度学习模型的异同。从传统的支持向量机(SVM)起始,循序渐进,引出了在今天的分享中扮演了非常重要角色的卷积神经网络模型(CNN)。

从最基本算法角度简单明了地指出了CNN的特点,优势和应用场景。除CNN之外,还有词向量模型(WORD2VEC),循环神经网络(RNN),长短期记忆人工神经网络(LSTM),循环卷积神经网络(RCNN)。

DL在攻略社区应用

在介绍了攻略社区的特殊需求和主流深度学习模型之后,下一步便是如何根据实际情况和模型特点高效满足现有的需求。根据数据类型,应用场景又可分为以下若干部分:

1、在自然语言处理方面,主要运用CNN模型进行语义情感分析,LSTM模型进行地址质量打分,CNN+Highway+LSTM+Attention模型完成指定景点开放时间的抓取和判断。

2、在图像处理方面,运用CNN进行图像分类,识别广告图片,侵权图片和非法图片。以及CNN+LSTM+Attention进行图像中物体检测以及自动生成图片对应的带情感文字描述。

3、在视频领域中,使用RCNN和LSTM模型对视频数据进行自动审核并生成对应文字描述。

4、在数据内容领域中,用模糊神经网络进行目的地和POI信息的多元信息匹配。

未来趋势和关注点

对于携程攻略社区而言,之后的工作目标除了优化现有模型外,还将从自动纠错,知识图谱,虚拟现实和更多更广泛的深度学习模型入手,进一步提高计算效率和准确率,为用户带来更多样化更好的体验。

原文发布于微信公众号 - 携程技术中心(ctriptech)

原文发表时间:2016-07-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【机器学习】一文读懂机器学习,大数据/自然语言处理/算法全有了……

作者:计算机的潜意识 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是...

480100
来自专栏CDA数据分析师

正在研究机器学习?我们帮你准备了27个小抄…

机器学习(Machine Learning)有很多方面,当我开始研究学习它时,我发现了各种各样的“小抄”,它们简明地列出了给定主题的关键知识点。最终,我汇集了超...

12830
来自专栏机器之心

业界 | 深度学习真的万能吗?理解深度学习的局限性

选自venturebeat 作者:MARIYA YAO, TOPBOTS 机器之心编译 参与:蒋思源、李亚洲、韩小西 深度学习较其他机器学习方法在各类任务中都表...

33160
来自专栏机器学习算法工程师

《机器学习》笔记-绪论(1)

作者:刘才权 编辑:王抒伟 写在最前面 1 如今机器学习和深度学习如此火热,相信很多像我一样的普通程序猿或者还在大学校园中的同学,一定也想参与其中。不管是出于好...

35970
来自专栏智能算法

史上最强----机器学习经典总结---入门必读

导读:在本篇文章中,将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。当然,本文也面对一般读者,不会对...

48370
来自专栏杨熹的专栏

强化学习是什么

参考 2013年伦敦的一家人工智能公司 Deep Mind 发表了一篇论文 “Playing Atari with Deep Reinforcement Lea...

37490
来自专栏AI科技评论

UC Berkeley 讲座教授王强:Deep Learning 及 AlphaGo Zero(上)

AI 科技评论按:北京时间 10 月 19 日凌晨,DeepMind 在 Nature 上发布论文《Mastering the game of Go witho...

40070
来自专栏AI科技评论

学界 | 专家标注的数据少就少吧,普通人标的数据现在也可以用了

AI 科技评论按:对于缺乏高质量标注数据的专业应用,除了继续花钱标数据之外,常用方法似乎也就只有 ImageNet 预训练 + 任务专用数据 fine-tune...

10620
来自专栏人工智能LeadAI

关于机器学习的知识,这篇文章都有

前言 机器学习[Machine Learning]在当今社会的火热程度有目共睹,自己也一直想写一下自己对Machine Learning(简称ML)的认识,今天...

38080
来自专栏专知

【深入浅出】一篇超棒的机器学习入门文章

【链接】http://www.cnblogs.com/subconscious/p/4107357.html 在本篇文章中,我将对机器学习做个概要的介绍。本文的...

37790

扫码关注云+社区

领取腾讯云代金券