首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

干货 | 深度学习在携程搜索词义解析中的应用

绝大部分的电商搜索是通过搜索框输入搜索词(Query)来完成,因此,搜索词的词义解析和意图理解成为了搜索中的重要一环。...在旅游场景下,用户输入的类目存在歧义的搜索词占总量约11%,其中包含大量无分词的搜索词。“无分词”是指经过分词处理后无更细化的切分片段,“类目存在歧义”是指搜索词本身存在多种可能的类目。...如果搜索词本身是多个词的组合,则可以通过搜索词自身上下文明确类目,优先会以搜索词本身作为识别目标。...如果单从搜索词本身不能明确所属类目,我们会优先追加该用户不相同的最近历史搜索词,以及最近商品类目点击记录,若无上述信息则追加定位站,作为补充语料。原始搜索词经过处理获得待识别的Query R。...在目前的线上真实搜索场景,深度学习方法一般选择与传统的搜索词义解析方法相结合,这样既可以保证头部常见搜索词的性能稳定,又可以加强泛化能力。

97720

干货 | 深度学习在携程搜索词义解析中的应用

绝大部分的电商搜索是通过搜索框输入搜索词(Query)来完成,因此,搜索词的词义解析和意图理解成为了搜索中的重要一环。...在旅游场景下,用户输入的类目存在歧义的搜索词占总量约11%,其中包含大量无分词的搜索词。“无分词”是指经过分词处理后无更细化的切分片段,“类目存在歧义”是指搜索词本身存在多种可能的类目。...如果搜索词本身是多个词的组合,则可以通过搜索词自身上下文明确类目,优先会以搜索词本身作为识别目标。...如果单从搜索词本身不能明确所属类目,我们会优先追加该用户不相同的最近历史搜索词,以及最近商品类目点击记录,若无上述信息则追加定位站,作为补充语料。原始搜索词经过处理获得待识别的Query R。...在目前的线上真实搜索场景,深度学习方法一般选择与传统的搜索词义解析方法相结合,这样既可以保证头部常见搜索词的性能稳定,又可以加强泛化能力。

55020

2021年大数据Spark(二十一):Spark Core案例-SogouQ日志分析

数据网址:http://www.sogou.com/labs/resource/q.php  1)、数据介绍:搜索引擎查询日志库设计为包括约1个月(2008年6月)Sogou搜索引擎部分网页查询需求及用户点击情况的网页查询日志数据集合...download.labs.sogou.com/dl/sogoulabdown/SogouQ/SogouQ.reduced.zip 完整版(1.9GB):http://www.sogou.com/labs/resource/ftp.php...获取搜索词,进行中文分词 val wordsRDD: RDD[String] = recordsRDD.mapPartitions(iter => {   iter.flatMap(record =>...top10SearchWords.foreach(println) 运行结果如下: ​​​​​​​用户搜索点击统计 统计出每个用户每个搜索词点击网页的次数,可以作为搜索引擎搜索效果评价指标。...{     // 获取用户ID和搜索词     val key = (record.userId, record.queryWords)     (key, 1)   })   // 按照用户ID和搜索词组合的

1.9K30

利用artDialog给网站添加一个能显示搜索来路和关键词的欢迎框

最新消息:目前该功能已推出 WordPress 版和 ZBlog(PHP)版插件!...一、功能由来 前些天,我在查看 CNZZ 搜索词的时候发现了一种跳出率为 100%的情况:搜索词和我博客的文章有一定相关性,但可能并不是用户确切想要的解决方法,所以用户就随手 Close 了。...将前期跳出率为 100%的搜索词都看了一遍之后,我不禁心里呐喊:虽然用户搜索的问题,博客当前的文章无法解决,但是并不代表我不会啊!我只是没遇到这种情况,从而文章就没写到而已!!...当我拿到这个问题时,我就有了一个想法:当用户从搜索引擎通过搜索词打开你的博客文章时,网站可以在右下角弹出一个友好提示,告诉用户如果当前文章无法解决问题,你可以直接留言联系博主,从而间接和用户搭上了线!

1.1K40
领券