首页
学习
活动
专区
工具
TVP
发布

PPV课数据科学社区

专栏作者
2119
文章
2441002
阅读量
187
订阅数
推荐 :如何才能获得一份数据科学家的职位
? 作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:“如何才能获得一份数据科学家的职位?” 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非
小莹莹
2018-04-24
6840
多模型融合推荐算法——从原理到实践
1 研发背景 互联网时代也是信息爆炸的时代,内容太多,而用户的时间太少,如何选择成了难题。电商平台里的商品、媒体网站里的新闻、小说网站里的作品、招聘网站里的职位……当数量超过用户可以遍历的上限时,用户就无所适从了。 对海量信息进行筛选、过滤,将用户最关注最感兴趣的信息展现在用户面前,能大大增加这些内容的转化率,对各类应用系统都有非常巨大的价值。 搜索引擎的出现在一定程度上解决了信息筛选问题,但还远远不够,其存在的两个主要弊端是:第一搜索引擎需要用户主动提供关键词来对海量信息进行筛选。当用户无法准确描述自己的
小莹莹
2018-04-24
2.5K0
技术帖:解析今日头条公开的推荐算法
1月11日,北京今日头条总部,一场问诊算法、建言算法的“让算法公开透明”分享会正在进行,雷锋网(公众号:雷锋网)观察到,包括BAT等在内的诸多科技公司算法工程师、产品经理等100多人参与现场讨论。资深算法架构师、中国科学技术大学曹欢欢博士于现场介绍了今日头条的推荐算法原理。 曹欢欢表示,今日头条资讯推荐系统本质上要解决用户、环境和资讯的匹配,要达到这一效果,其算法推荐系统输入三个维度变量: 一是内容特征,图文、视频、UGC小视频、问答、微头条等,每种内容有很多自己的特征,需要分别提取; 二是用户特征
小莹莹
2018-04-24
3K2
【了解】推荐系统的坑
不知不觉,从事推荐系统相关工作已近两年,这两年自己踩坑,看人踩坑已然不少。记得一位资深从业者说“现在看起来,推荐系统就是个坑啊!”,心有戚戚的同时又不禁思索,到底坑在哪? 第一坑:高估系统对用户需求的捕捉能力; 我们都说,搜索引擎是满足用户主动需求的产品,而推荐系统则是满足用户隐含需求的产品。当用户明确需要什么信息,就把需求转化为检索词,丢到搜索引擎,搜索引擎帮用户找到它,而推荐系统则能良好的感知用户未明确陈述的需求,为其呈现信息。那么问题来了,既然推荐系统能够捕捉用户的需求,也就是说用
小莹莹
2018-04-23
6430
【学习】关于推荐系统中的特征工程
在多数数据和机器学习的blog里,特征工程 Feature Engineering 都很少被提到。做模型的或者搞Kaggle比赛的人认为这些搞feature工作繁琐又不重要不如多堆几个模型,想入手实际问题的小朋友又不知道怎么提取feature来建模型。我就用个性化推荐系统做个例子,简单说说特征工程在实际的问题里是怎么做。 定义 特征工程 Feature Engineering 在一篇Kaggle bloghttp://blog.kaggle.com/2014/08 ... best/ 上
小莹莹
2018-04-23
1.4K0
【学习】推荐算法实践
前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。 解决信息过载有几种手段:一种是搜索,当用户有了明确的信息需求意图后,将意图转换为几个简短的词或者短语的组合(即query),然后将这些词或短语组合提交到相应的搜索引擎,再由搜索引擎在海量的信息库中检索出与query
小莹莹
2018-04-23
7030
【学习】什么是推荐系统的坑
不知不觉,从事推荐系统相关工作已近两年,这两年自己踩坑,看人踩坑已然不少。记得一位资深从业者说“现在看起来,推荐系统就是个坑啊!”,心有戚戚的同时又不禁思索,到底坑在哪? 第一坑:高估系统对用户需求的捕捉能力 我们都说,搜索引擎是满足用户主动需求的产品,而推荐系统则是满足用户隐含需求的产品。当用户明确需要什么信息,就把需求转化为检索词,丢到搜索引擎,搜索引擎帮用户找到它,而推荐系统则能良好的感知用户未明确陈述的需求,为其呈现信息。那么问题来了,既然推荐系统能够捕捉用户的需求,也就是说用户还没丢关键词给搜
小莹莹
2018-04-23
5270
总结 2014 年中国互联网十大段子
  段子年年有,今年特别多。追寻回忆,搜集了一年中和互联网行业相关的一些段子,以飨读者。网络段子或赞扬或讽刺,或嘲弄,或戏谑,或调侃,或规劝,目的尽在不言中。一句段子的效果,抵得过千言万语。“互联网的一些事”推荐此文。   【段子1】   民企腾讯有个老员工,每月收入买公司股票,坚持 7 年,生活俭朴,只有夏利一辆,全家租房,工资屌丝,目前资产过亿;   国企中国远洋老员工 07 年开始,每月收入买公司股票,坚持 6 年,生活俭朴,宝马车换成了自行车,全家睡澡堂,工资一直很屌丝,目前负债过亿……   点
小莹莹
2018-04-20
1.2K0
2014互联网职场薪酬报告
那么问题来了…… 你的薪水及格了吗? 在应届生中,薪资水平最高的职位依次有:架构师、mac、hadoop、技术经理以及算法。最低的有vb、自动化测试、广告算法。 普通职位中,db2的工资水平最高,平均
小莹莹
2018-04-20
7940
45页PPT|大数据环境下实现一个O2O通用推荐引擎的实践
58同城是中国本地生活服务应用的代表。从最新数据规模上看,58同城已经超过了美国的Graigslist成为该领域世界第一,拥有超过1.3亿的月独立用户和400多万的季度活跃本地商户,月度发布超过5600万条本地生活服务信息。更复杂的是,58同城覆盖了诸如招聘、二手、二手车、房产等几乎所有垂直生活服务领域,所以数据类型非常异构多样。本案例将介绍在这样一个海量异构的数据源上,如何构建一个满足全领域需求的个性化推荐引擎。 PPT要点: 推荐系统:发现用户偏好,给用户主动推荐符合其意图的信息 好友推荐,商品推荐,网
小莹莹
2018-04-20
1.4K0
【活动】客户标签画像推荐系统讲座于9月19日举行,小伙伴赶紧报名吧!
活动概况 ---- 活动主题:客户标签画像推荐系统 活动嘉宾:李永、符鹏飞 活动对象:信息主管CIO、业务部门主管、工程师、SI人员 活动时间: 2015年9月19日14:00~17:30 活动地点:罗湖世界金融中心A座5楼(深南东路4003号) 主办承办:大数据厂商联盟、PPV课 嘉宾介绍及分享内容 ---- 嘉宾:李永——大数据厂商联盟秘书长 分享内容:《怎样规划部署大数据分析应用》 1,怎样部署客户(消费者、会员)统一视图(客户标签与360度画像) 2,怎样部署产品标签画像与订单分析 3
小莹莹
2018-04-20
9630
【干货】个性化推荐十大挑战(中)
前文介绍了个性化推荐十大挑战的背景其中的数据稀疏性问题,冷启动问题。本篇介绍个性化推荐十大挑战中的大数据处理与增量计算问题,多样性与精确性的两难困境,推荐系统的脆弱性问题,用户行为模式的挖掘和利用。篇幅较长,大家耐心看噢~ 接上文:个性化推荐十大挑战(上) 挑战三:大数据处理与增量计算问题。 尽管数据很稀疏,大部分数据都包含百千万计的用户和商品,与此同时,新商品也不断加入系统,新用户不停进入系统,用户和商品之间还不停产生新的连接。数据量不仅大,而且数据本身还时时动态变化,如何快速高效处理这些数据成为迫在
小莹莹
2018-04-20
8190
【深入浅出】推荐系统那点事
推荐系统的误区 回想起来,我也算是国内接触推荐系统较早的人之一了,最近和人聊天,觉得不少人对推荐系统有所误解,以为需要多么高大上的算法才能搭建起来的,我只想说我经常说的那句话【不是这样的】,所以有了这篇文章。 第一次接触【推荐系统】是在两年前在某高校的互联网信息处理实验室的时候,那时候,【机器学习】和【大数据】都是新概念,但是差不多半年后,【大数据】的概念就开始风靡全球了,到现在已经被爆炒得面目全非。 那年还因此买了一本项亮的书《推荐系统实践》,那本书和现在的很多热门书籍一样,都是跟着概念热起来的。虽然
小莹莹
2018-04-19
1.1K0
【学习】王答明:个性化推荐的前世今生及1号店实践
【大数据100分】王答明:个性化推荐的前世今生及1号店实践 主讲嘉宾:王答明 主持人:中关村大数据产业联盟 副秘书长 陈新河 承办:中关村大数据产业联盟 嘉宾介绍: 王答明: 1号店IT资深经理,负责个性化推荐/大数据挖掘。早年曾在Intel, Alcatel等公司做过大型分布式系统,p2p网络, 移动自组织网络等分布式协议的研发。后加入Autodesk,成为其内容搜索组上海区的创始成员和技术负责人,期间曾负责过基于机器学习的自动分类,分词和信息抽取等方向,也曾带团队利用hadoop对搜索的backe
小莹莹
2018-04-19
1.1K0
【观点】社会网络分析:探索人人网好友推荐系统
image.png 最近四五年间,互联网行 业似乎总是绕不开社交网络这个概念。无论是旗舰级别的传说中的facebook、LinkedIn,还是如雨后春笋般冒出来 的各种团购和微博网站,全都或多或少地体现着SNS(社会网络服务)的特色。这些五花八门的产品,在丰富我们业余生活的同时,也为研究者提供了大量珍贵的 数据。以往只能依靠有限的调研或模拟才能进行的社会网络分析(SNA),现在具备了大规模开展和实施的条件。国内著名而典型的SNS网站“人人网”,最近 依靠上市新闻重新赢得了大家的关注。本文基于人人网的好友
小莹莹
2018-04-19
1.1K0
机器学习几个基本的问题
关键词:机器学习、推荐系统、文本挖掘 正文如下: 从今年四月份到现在已经工作快9个月了,最开始是做推荐系统,然后做机器学习,现在是文本挖掘,每个部分研究的时间都不多,但还是遇到了很多问题,目前就把一定要总结的问题总结一下,以后有时间多看看,提醒自己看有没有解决。 推荐系统:   1.冷启动热启动区别和联系?各个阶段需要的算法?   2.每个算法的数学推导、适用情况、优缺点、改进方法、数据类型?   3.如何平衡热启动时的准确率和召回率,两者不可能同时高,怎么平衡?从算法本身还是业务层面?惊喜度怎么添加
小莹莹
2018-04-18
7190
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档