前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >干货 | 深度学习在携程攻略社区的应用

干货 | 深度学习在携程攻略社区的应用

作者头像
携程技术
发布2018-02-06 16:30:48
9500
发布2018-02-06 16:30:48
举报
文章被收录于专栏:携程技术

携程攻略社区是携程旗下的旅游攻略类社区,致力于为旅行者提供出行指南和资讯服务。依托携程2.5亿用户总量,社区日活跃用户超过500万,并汇集3000万条真实用户的旅行和酒店点评,并有40万篇旅行游记,2000位知名旅行达人。面对数据库中浩如烟海的信息,我们如何能去其糟粕,留其精华?

攻略社区的主要需求

攻略社区的数据比较复杂,包括了多语种,不同篇幅的自然语言处理,如用户评论,长短篇幅的游记,景点官网页面数据;图像数据处理,如用户上传的景点照片等多种应用场景。模型需要在极短的时间内对海量的这些信息进行正确分类。

深度学习及一些经典模型简介

介绍浅层机器学习模型和深度学习模型的异同。从传统的支持向量机(SVM)起始,循序渐进,引出了在今天的分享中扮演了非常重要角色的卷积神经网络模型(CNN)。

从最基本算法角度简单明了地指出了CNN的特点,优势和应用场景。除CNN之外,还有词向量模型(WORD2VEC),循环神经网络(RNN),长短期记忆人工神经网络(LSTM),循环卷积神经网络(RCNN)。

DL在攻略社区应用

在介绍了攻略社区的特殊需求和主流深度学习模型之后,下一步便是如何根据实际情况和模型特点高效满足现有的需求。根据数据类型,应用场景又可分为以下若干部分:

1、在自然语言处理方面,主要运用CNN模型进行语义情感分析,LSTM模型进行地址质量打分,CNN+Highway+LSTM+Attention模型完成指定景点开放时间的抓取和判断。

2、在图像处理方面,运用CNN进行图像分类,识别广告图片,侵权图片和非法图片。以及CNN+LSTM+Attention进行图像中物体检测以及自动生成图片对应的带情感文字描述。

3、在视频领域中,使用RCNN和LSTM模型对视频数据进行自动审核并生成对应文字描述。

4、在数据内容领域中,用模糊神经网络进行目的地和POI信息的多元信息匹配。

未来趋势和关注点

对于携程攻略社区而言,之后的工作目标除了优化现有模型外,还将从自动纠错,知识图谱,虚拟现实和更多更广泛的深度学习模型入手,进一步提高计算效率和准确率,为用户带来更多样化更好的体验。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-07-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 携程技术中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档