首页
学习
活动
专区
工具
TVP
发布

大数据

多年海量数据处理经验,化数据为力量
专栏作者
174
文章
273817
阅读量
108
订阅数
腾讯云—蓝鸥正式签约,强强联手打造强大云教育生态
7月12日,腾讯云-蓝鸥科技签约暨蓝鸥科技2018年教育部“产学合作协同育人”项目启动大会在上海浦东绿地铂骊酒店隆重启幕。大会上腾讯云与蓝鸥签约成为重要合作伙伴,双方将在云计算、云运维、云安全等前沿技术领域,集取行业最 强实力共建强大的云教育生态。腾讯云教育认证中心负责人 李峰先生、蓝鸥科技有限公司董事长 李静波先生以及众多厂商、高校代表纷纷到会。而这场企业、高校共享的云计算饕餮盛宴也引发了业内众多知名媒体的强烈关注。
大数据弄潮儿
2018-11-22
1K0
用R处理不平衡的数据
在分类问题当中,数据不平衡是指样本中某一类的样本数远大于其他的类别样本数。相比于多分类问题,样本不平衡的问题在二分类问题中的出现频率更高。举例来说,在银行或者金融的数据中,绝大多数信用卡的状态是正常的,只有少数的信用卡存在盗刷等异常现象。
大数据弄潮儿
2018-06-04
1.6K0
十的次方 - 第一部分
这篇文章最初由Stephen Mallette和Daniel Kuppitz在Aurelius发表。
大数据弄潮儿
2018-06-01
1.7K0
大数据图:循环点阵
本文的内容最初由Marko Rodriguez和Bobby Norton在Aurelius博客上共同撰写。
大数据弄潮儿
2018-06-01
3.5K2
Kafka 的详细设计及其生态系统
原文地址:https://dzone.com/articles/kafka-detailed-design-and-ecosystem
大数据弄潮儿
2018-05-31
1K0
关注专栏作者,随时接收最新技术干货
Techeek
腾讯产品运营
花落花飞去
腾讯社区运营
QiqiHe
腾讯产品运营
API场景中的数据流
原文地址:https://dzone.com/articles/data-streaming-in-the-api-landscape
大数据弄潮儿
2018-05-30
1.5K0
使用Go构建一个Data Thrashing CLI工具
以下所撰就是这个快速上手的项目。最后,我将在容器中搭建服务,并将其放入Kubernetes(k8s)集群中,不过下面操作都是在CLI环境下进行的。
大数据弄潮儿
2018-05-30
8720
带有Apache Spark的Lambda架构
市场上的许多玩家已经建立了成功的MapReduce工作流程来每天处理以TB计的历史数据。但是谁愿意等待24小时才能获得最新的分析结果?这篇博文将向您介绍旨在利用批处理和流处理方法的Lambda架构。我们将利用Apache Spark(Core,SQL,Streaming),Apache Parquet,Twitter Stream等实时流数据快速访问历史数据。还包括清晰的代码和直观的演示!
大数据弄潮儿
2018-05-29
1.9K0
大数据架构最佳实践
原文地址:https://dzone.com/articles/big-data-architecture-best
大数据弄潮儿
2018-05-28
5210
Hadoop/R 集成 I:流处理
原文地址:https://dzone.com/articles/hadoopr-integration-i
大数据弄潮儿
2018-05-28
6650
使用Hadoop分析大数据
大数据由于其庞大的规模而显得笨拙,并且大数据需要工具进行高效地处理并从中提取有意义的结果。Hadoop是一个用于存储,分析和处理数据的开源软件框架和平台。本文是Hadoop如何帮助分析大数据的初学者指南。
大数据弄潮儿
2018-05-24
7290
大数据处理的开源框架:概述
本文讨论大数据处理生态系统和相关的架构栈,包括对适应于不同任务的多种框架特性的调研。除此之外,文章还从多个层次对框架进行深入研究,如存储,资源管理,数据处理,查询和机器学习。
大数据弄潮儿
2018-05-23
2K1
快速数据管道设计:通过交换表更新各个事件决策
在 VoltDB(这是一种数据库) 经常使用到的术语,快速数据管道(Fast data pipeline),这是一种全新的现代应用程序 —— 这种应用程序将流式传输(或者说 “快速数据”) 与大数据紧密结合在了一起。
大数据弄潮儿
2018-05-23
1.1K0
扩展大数据网络的规模
原文地址:https://dzone.com/articles/scaling-big-data-fabrics
大数据弄潮儿
2018-05-22
8180
如何用SQL计算客户生命周期价值
Statsbot团队针对不同的客户和不同的商业模型预估了592次LTV(用户生命周期价值,Custom lifetime value)。我们在本文以及免费的电子书中分享了我们如何使用不涉及复杂的统计模型的SQL语句来计算客户生命周期价值。
大数据弄潮儿
2018-05-22
3.2K0
数据可视化的艺术
在我上一篇博客中,我们研究了如何依据数据趋势聚合数据。在本文中,我们将讨论如何以更有意义的方式将这些数据呈现给用户。
大数据弄潮儿
2018-05-21
2.1K0
大数据对你来说意味着什么?
毋庸置疑,现如今是属于大数据(Big Data)的,革命性的时代。从社交媒体到企业,每时每刻都在产生大量的数据。无所作为,从而把这样的宝藏白白浪费掉是及其愚蠢的。企业已经学会了收集大数据以获取更高的利润,并提供更好的服务以及更深入地了解其目标客户。
大数据弄潮儿
2018-05-21
1.4K0
Spring 数据处理框架的演变
定量分析的成败在很大程度上取决于采集,存储和处理数据的能力。若能及时地向业务决策者提供深刻并可靠的数据解读,大数据项目就会有更多机会取得成功。
大数据弄潮儿
2018-05-17
2.7K1
Spark Streaming入门
本文将帮助您使用基于HBase的Apache Spark Streaming。Spark Streaming是Spark API核心的一个扩展,支持连续的数据流处理。
大数据弄潮儿
2018-05-15
2.2K0
大数据安全市场现状和需求分析
后web2.0时代,互联网、物联网每天都在生产大量数据,人们对于这些庞大数据资源的价值渴求,使得“大数据”的概念得以问世。如果说“数据”是支撑未来核心技术的基础“原材料”,那么“大数据”正在演变成一种战略资源,当“用户需求导向”成为企业共识,大数据的收集、挖掘和分析开始支撑企业的业务运转、营销策略乃至战略方向,数据成为企业愈加珍视的宝贵资产。 目前,建设有大数据平台的企业不在少数,对比传统数据库,大数据平台数据大量集中,且蕴含更高价值,其安全建设要求明显更高。然而,由于大数据平台使用非结构化数据库类型,以及
企鹅号小编
2018-03-05
1.7K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档