首页
学习
活动
专区
工具
TVP
发布

达观数据

专栏作者
116
文章
152126
阅读量
39
订阅数
达观数据:5分钟带你理解机器学习及分类算法
机器学习是什么?机器学习是从历史数据(历史经验)中获取模型(规律),并将其应用到新的类似场景中。 举个很简单的例子:
达观数据
2019-11-07
7200
技术干货|集成学习算法(Ensemble Method)浅析
个性化推荐系统是达观数据在金融、电商、媒体、直播等行业的主要产品之一。在达观数据的个性化推荐系统架构中, 可以简单地分为5层架构,每层处理相应的数据输出给下一层使用,分别是: 数据处理层 作为推荐系统最低端的数据处理层,主要功能是首先将客户上传上来的一些无用的噪声数据进行清理过滤,将推荐系统所需要用到的数据导入到数据存储层中; 数据存储层 对于item的数据一般存入在Mysql中,随着数据量越来越大的item的数据,相比Mysql的扩展性来说,HBase和Hive是一个更好的选择,Hive可以方便离线
达观数据
2018-04-02
1.1K0
技术干货 | 一文详解LDA主题模型
作者简介 夏琦,达观数据NLP组实习生,就读于东南大学和 Monash University,自然语言处理方向二年级研究生,师从知识图谱专家漆桂林教授。曾获第五届“蓝桥杯”江苏省一等奖、国家二等奖。 本篇博文将详细讲解LDA主题模型,从最底层数学推导的角度来详细讲解,只想了解LDA的读者,可以只看第一小节简介即可。PLSA和LDA非常相似,PLSA也是主题模型方面非常重要的一个模型,本篇也会有的放矢的讲解此模型。如果读者阅读起来比较吃力,可以定义一个菲波那切数列,第 f(n) = f(n-1) + f
达观数据
2018-03-30
3.1K0
技术干货 | 漫谈Word2vec之skip-gram模型
新媒体管家 作者简介 刘书龙,现任达观数据技术部工程师,兴趣方向主要为自然语言处理和数据挖掘。 word2vec是Google研究团队的成果之一,它作为一种主流的获取分布式词向量的工具,在自然语言处理
达观数据
2018-03-30
2.8K0
技术分享 | 个性化推荐系统商业化的五大要素
在日前举行的2017 CSDI 中国软件研发管理行业峰会上,包括摩拜单车创始人及CTO夏一平、华为首席系统工程专家徐琦海、京东云、携程等一线互联网企业大数据平台负责人等在内一线技术大咖齐聚一堂,分享了各自领域的顶尖技术实践。在峰会大数据专场上,达观数据CTO纪达麒围绕“数据挖掘算法落地实践”做了主题演讲,就个性化推荐系统商业化的五大要素进行了详细探讨。下面为大家献上演讲的精华内容。 1 机器学习的原理并不神秘 最近“人工智能”特别火。“人工智能”的概念虽然很高大上,但从算法角度来说,离我们是很近的。这些
达观数据
2018-03-30
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档