专栏首页罗超频道如何让搜索引擎拥有“生命”?

如何让搜索引擎拥有“生命”?

在许多人看来搜索引擎只是一个检索工具,就像其他冷冰冰的科技产品一样。实际上,搜索引擎正在成为人人依赖的智能助手。它在拥有感知环境和自我学习的能力后,随着岁月流逝将不断地将信息转化为知识,再将知识沉淀为智慧,被赋予“生命”价值。

Online Learning,让搜索引擎“活起来”

Online Learning(在线学习)便是让搜索引擎“活起来”的关键技术,它让搜索引擎拥有更强大的学习能力进而越来越聪明。

理论上来说,一个用户使用搜索引擎越多,搜索引擎就愈发了解这个用户和整体热度变化,推荐精准度会越来越高。根据用户特征不断调整算法提高准确度就是学习过程。在Online Learning技术之前,搜索引擎的学习是离线完成的,定时进行数据模型和排序及推荐算法的更新,但不会做到在用户每一次反馈之后都更新算法。Online Learning则让“学习”更加具有时效性,粒度细化到每个用户。它可以随时根据用户的下载、点击、停留时间、鼠标移动这些行为去理解用户进而动态调整排序和推荐算法,给用户想要的。

在技术上Online Learning只需要对当前用户相关的数据进行计算即可,增量学习的方式节省了计算资源同时增强了时效性,因为它可以一边学习一边预测、推荐和排序,这可以做到对推荐的动态调整进而确保推荐效果。

在这种快速迭代的基础上,Online Learning能够采取比离线预测更为灵活的策略,如Bandit策略,它能够降低信息的冗余, 缓解马太效应,给了资源更多更平等的机会,可以说形成一种“百花齐放”的状态,在短时间内迅速定位优质资源。

Online Learning或将迎来大规模应用

在百度的搜索引擎结果中,右侧知心中,App助手推荐,多媒体搜索结果中,在线学习系统已被大规模应用,相关测试表明Online Learning可大幅提升推荐点击率和用户满意度。现在你搜索“双层床”右侧不会只出现相关结果,而是根据之前用户搜索类似关键词后的反馈,推荐了小户型装修等服务。

Online Learning即在线机器学习,目前业界只有百度进行了大规模的商业化应用。Yahoo和Google进行了一些尝试,但集中在实验、调研或者论文层面。Online Leaning技术与百度正在深耕的深度学习、百度大脑以及大数据业务有着千丝万缕的联系,接下来必将得到更大的提升和应用机会,据说百度已经在为与之相关的技术已经在申请专利。

好比一个儿童在早期说法、写字、走路都需要有大人刻意训练一样,这时候它并无“在线学习”能力,而是“监督学习”;到了一定阶段它可以根据环境反馈和个人经验自己掌握一些技能,譬如在不断跌倒和骑行过程中自学自行车,下水喝了几次水之后自然习得游泳技术,这时候就是“在线学习”模式。可以说,人脑本身就是一个基于反馈在线学习的系统,Online-learning就是人脑接收环境和外界对于人的“反馈”,以使得人不断调整自己行为的过程,这种学习机制是人类不断自我进步和自我发展的源动力。

Online Learning让搜索引擎拥有生命

今年李彦宏曾对外透露“百度大脑”的智力水平已接近3岁婴儿,我们尚不知道这个项目究竟做了什么看得见的东西,没有科技媒体能够走进这个项目深入了解它。百度对此介绍只有寥寥数字:利用计算机技术模拟人脑。百度大脑还出现在了百度推出的世界首个大数据引擎中,百度大脑发挥的作用就是让大数据引擎能够在数据挖掘的基础上,形成“如何挖掘数据”的学习能力。

现在看来所有技术都是互联互通的,百度大脑与Online Learning相似之处都是让搜索引擎“活起来”,拥有学习能力和智力水平,最终越来越聪明。

近年来越来越多科技巨头开始关注科技与人类和谐共处的问题,苹果让科技与人文和艺术更加紧密的结合,可穿戴设备让科技穿戴或植入人体隐秘存在,Nest则让科技具有感知环境和自我学习能力,百度则是让搜索引擎愈发聪明,理解人,与人自然对话。未来所有这些科技都会融为一体:手机、智能硬件、物联网、互联网服务,无处不在的科技最终让人们感受不到科技的存在,科技与世界已经浑然一体,水乳相融。

SuperSofter是WeMedia早期成员。关注SuperSofter与阿超一起围观冷暖科技世界。

本文分享自微信公众号 - 罗超频道(luochaotmt),作者:罗超

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-08-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 百度杀入在线票务:投名状为100万张电影票

    现如今,一切都在搬上互联网销售,从标准商品到大宗物品,从实物到虚拟,从产品到服务…其中,看上去卖的是虚拟产品、实际上却是线下服务的互联网票务正在高 速增长...

    罗超频道
  • 李彦宏南京大学演讲:事业、理想和技术未来

    10月21日晚南京大学体育馆,百度董事长兼CEO李彦宏与90后大学生聊了自己对大学生就业、对这个时代、对技术未来的看法。李彦宏每年均会选择一所高校与年轻人分享交...

    罗超频道
  • 百度金融独立分拆,不过朱光透露的这个信息更值得关注

    节前,百度正式宣布旗下金融服务事业群组(FSG)融资19亿美元独立拆分,拆分后新公司将启用全新品牌“度小满”。度小满金融CEO由百度高级副总裁、FSG当家人朱光...

    罗超频道
  • 优雅的在终端中编写Python

    專 欄 ❈PytLab,Python 中文社区专栏作者。主要从事科学计算与高性能计算领域的应用,主要语言为Python,C,C++。熟悉数值算法(最优化方法,蒙...

    Python中文社区
  • ASP.NET重用代码技术 – 代码绑定技术

    作者:苏红超   导读 代码绑定是ASP.NET提供的一个重要的新技术。本文将会为您展示如何数...

    Java架构师必看
  • 试试IEnumerable的另外6个小例子

    IEnumerable 接口是 C# 开发过程中非常重要的接口,对于其特性和用法的了解是十分必要的。本文将通过6个小例子,来熟悉一下其简单的用法。

    newbe36524
  • 「思考」百度搜索算法与手机号之间的事情

    黄伟SEO
  • Scrapy 爬虫框架学习记录

    安装完 scrapy 后,新建一个爬虫的目录,然后在命令行窗口进入该目录,输入以下命令:

    caoqi95
  • Python爬虫之scrapy_redis原理分析并实现断点续爬以及分布式爬虫

    但是在settings.py中多了以下内容,这几行表示scrapy_redis中重新实现的了去重的类,以及调度器,并且使用RedisPipeline管道类

    海仔
  • 这些linux技巧大大提高你的工作效率

    linux中的一些小技巧可以大大提高你的工作效率,本文就细数那些提高效率或者简单却有效的linux技巧。

    编程珠玑

扫码关注云+社区

领取腾讯云代金券