大数据

多年海量数据处理经验,化数据为力量
174 篇文章
76 人订阅

全部文章

大数据弄潮儿

腾讯云—蓝鸥正式签约,强强联手打造强大云教育生态

7月12日,腾讯云-蓝鸥科技签约暨蓝鸥科技2018年教育部“产学合作协同育人”项目启动大会在上海浦东绿地铂骊酒店隆重启幕。大会上腾讯云与蓝鸥签约...

933
大数据弄潮儿

用R处理不平衡的数据

在分类问题当中,数据不平衡是指样本中某一类的样本数远大于其他的类别样本数。相比于多分类问题,样本不平衡的问题在二分类问题中的出现频率更高。举例来说,在银行或者金...

3044
大数据弄潮儿

100000个故事的情节分析:一个简单案例

最近我从马克·里德尔 那拿到了很棒的自然语言方面的数据集 :从WIKI下载了112000个故事作品的情节。其中包括了书籍,电影,电视剧集,视频游戏等有“情节”的...

3304
大数据弄潮儿

十的次方 - 第一部分

这篇文章最初由Stephen Mallette和Daniel Kuppitz在Aurelius发表。

2004
大数据弄潮儿

大数据图:循环点阵

本文的内容最初由Marko Rodriguez和Bobby Norton在Aurelius博客上共同撰写。

2195
大数据弄潮儿

Kafka 的详细设计及其生态系统

原文地址:https://dzone.com/articles/kafka-detailed-design-and-ecosystem

1412
大数据弄潮儿

API场景中的数据流

原文地址:https://dzone.com/articles/data-streaming-in-the-api-landscape

1530
大数据弄潮儿

使用Go构建一个Data Thrashing CLI工具

以下所撰就是这个快速上手的项目。最后,我将在容器中搭建服务,并将其放入Kubernetes(k8s)集群中,不过下面操作都是在CLI环境下进行的。

1950
大数据弄潮儿

在Ubuntu上启动并运行Hadoop

Hadoop是一个用Java编写的框架,它允许在大型商品硬件集群上以分布式方式处理大型数据集。

1801
大数据弄潮儿

带有Apache Spark的Lambda架构

市场上的许多玩家已经建立了成功的MapReduce工作流程来每天处理以TB计的历史数据。但是谁愿意等待24小时才能获得最新的分析结果?这篇博文将向您介绍旨在利用...

2584
大数据弄潮儿

采购中的高级分析方法

原文地址:https://dzone.com/articles/advanced-analytics-in-procurement

2299
大数据弄潮儿

内存计算网格解释

Dmitriy Setrakyan在最近为In-Memory数据网格 (IMDG)提供了一个很好的解释 - 现在我尝试为In-Memory Compute Gr...

2878
大数据弄潮儿

大数据架构最佳实践

原文地址:https://dzone.com/articles/big-data-architecture-best

1554
大数据弄潮儿

概率数据结构简介

在处理大型的数据集时,我们常常进行一些简单的检查,如稀有项(Unique items)的数量、最常见的项,以及数据集中是否存在某些指定的项。通常的做法是使用某种...

2936
大数据弄潮儿

Hadoop/R 集成 I:流处理

原文地址:https://dzone.com/articles/hadoopr-integration-i

1322
大数据弄潮儿

使用Elasticsearch进行智能搜索的机器学习

众所周知,机器学习正在改变许多行业。搜索行业也是如此,公司通过手动调整搜索相关性来压榨潜能。成功的搜索组织希望通过“足够好”的手动调整来构建更智能...

2465
大数据弄潮儿

使用Hadoop分析大数据

大数据由于其庞大的规模而显得笨拙,并且大数据需要工具进行高效地处理并从中提取有意义的结果。Hadoop是一个用于存储,分析和处理数据的开源软件框架和平台。本文是...

1392
大数据弄潮儿

协同过滤的R语言实现及改进

协同过滤算法(CF)是构建推荐系统时最常用的技术之一。它可以基于收集到的其他用户的偏好信息(协同)来自动地预测当前用户的兴趣点。协同过滤算法主要分为两种:基于记...

2856
大数据弄潮儿

季节性单位根

正如MAT8181课程中所讨论的那样,至少有两种非平稳的时间序列:存在趋势的和存在单位根(这种类型被称为 单整的)。单位根测试不能用来评估一个时间序列是否平稳,...

2715
大数据弄潮儿

大数据处理的开源框架:概述

本文讨论大数据处理生态系统和相关的架构栈,包括对适应于不同任务的多种框架特性的调研。除此之外,文章还从多个层次对框架进行深入研究,如存储,资源管理,数据处理,查...

4226

扫码关注云+社区