首页标签数据挖掘

#数据挖掘

跨学科的计算机科学分支。用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式的计算过程

CIBERSORT根据LM22来分类

生信技能树

CIBERSORT should enable large-scale analysis of RNA mixtures for cellular biomar...

2720

腾讯游戏自研学术成果:基于图分割的网络表征学习初始化技术

腾讯技术工程官方号

腾讯 · 产品经理 (已认证)

WSDM是数据挖掘和分析领域成长较快的国际顶级学术会议,通常读作“wisdom”。如图3所示,在Google Scholar上的学术会议和期刊影响力排名中,WS...

8620

云计算给大数据分析工具带来了什么

青果云小潘

大数据与传统的海量数据不同的是,它除了数据规模呈现几何级数增长的特征之外,还包括所有数据类型的整合、处理、分析和展现等多个方面,从而最终实现从大数据挖掘潜在巨大...

8130

分析周杰伦75775字歌词后,我们用他最爱的词重写了《说好不哭》

用户2802732

有人觉得,听着这首歌,仿佛自己的青春岁月回来了,说好不哭,可还是哭了下来,那个周杰伦又回来了!

5610

如何把握数据治理项目启动的最佳时机

Spark学习技巧

环数科技有限公司 · 数据库开发工程师 (已认证)

如今,大数据正在社会的各行各业发挥着越来越重要的作用,数据已成为企业的核心资产和重要战略资源,是重要的生产因素。在数据驱动的信息化时代,企业只有将核心业务数据更...

8730

一文总结BI、数据仓库、数据湖和数据中台内涵与差异

Sam Gor

随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能(BI)、数据仓库、数据湖...

6720

受限玻尔兹曼机原理及在推荐系统中的应用

AINLP

作者于敬,达观数据联合创始人,中国计算机学会(CCF)会员,第23届ACM CIKM Competition竞赛国际冠军,达观数据个性化推荐组总负责人,负责达观...

8520

系列 | 漫谈数仓第四篇NO.4 『数据应用』(BI&OLAP)

用户1564362

数据应用,是真正体现数仓价值的部分,包括且又不局限于 数据可视化、BI、OLAP、即席查询,实时大屏,用户画像,推荐系统,数据分析,数据挖掘,人脸识别,风控反欺...

12830

推荐收藏 | 100个数据分析常用指标和术语

用户2769421

数据挖掘(Data mining):数据挖掘是通过使用复杂的模式识别技术,从而找到有意义的模式,并得出大量数据的见解。

10640

大数据 SQL Boy 脱坑指南

用户2769421

不可否认的是 SQL 是一个伟大的发明,它让增删改查的操作更加地便捷化,而且 SQL 的学习成本相对其他编程语言来说较低,被逼到会写 SQL 的运营和产品我都见...

8320

跟Kaggle大神17枚金牌得主学NLP实战

CDA数据分析师

本文作者Dean Sublett是Kaggle大神Abhishek Thakur的迷弟,通过学习Abhishek的相关教程受益良多,因此,近期他在medium上...

6340

NLP之文本表示

prepared

我们在做模型训练的时候,不是直接把文本或者词语传给计算机让其进行计算,而是需要将单词、句子、文本转换成向量或者矩阵进行计算,而如何将文本转换成向量就是本文需要介...

6510

文本数据的特征提取都有哪些方法?

double

介绍了一些传统但是被验证是非常有用的,现在都还在用的策略,用来对非结构化的文本数据提取特征。

7810

系列 | 漫谈数仓第四篇NO.4 『数据应用』(BI&OLAP)

Spark学习技巧

环数科技有限公司 · 数据库开发工程师 (已认证)

数据应用,是真正体现数仓价值的部分,包括且又不局限于 数据可视化、BI、OLAP、即席查询,实时大屏,用户画像,推荐系统,数据分析,数据挖掘,人脸识别,风控反欺...

9120

「首席架构师推荐」精选数据挖掘和机器学习软件列表

首席架构师智库

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。[1]

6430

推荐收藏 | 100个数据分析常用指标和术语

石晓文

美团点评 · 算法实习生 (已认证)

数据挖掘(Data mining):数据挖掘是通过使用复杂的模式识别技术,从而找到有意义的模式,并得出大量数据的见解。

6320

【科研猫·绘图】献礼国庆70年,R语言绘制中国地图

用户6317549

建国70周年大庆即将到来,各行各业都在积极筹备迎接祖国的生日,在这个举国欢腾的时刻,我们决定以一种特殊方式来表达自己对祖国母亲的祝福:一副用R语言绘制的中国地图...

17120

如何把握数据治理项目启动的最佳时机

木东居士

腾讯 · 数据分析 (已认证)

如今,大数据正在社会的各行各业发挥着越来越重要的作用,数据已成为企业的核心资产和重要战略资源,是重要的生产因素。在数据驱动的信息化时代,企业只有将核心业务数据更...

8310

Python数据可视化:浅谈数据挖掘岗

数据森麟

没找到如何用Python创建PG数据库,所以数据库的创建在Navicat for PostgreSQL中完成。

10410

【数据挖掘&机器学习篇】

数据森麟

作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

7410

扫码关注云+社区

领取腾讯云代金券