首页标签大数据

#大数据

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

AI测试的思考与探索

叉叉敌

哈曼汽车智联 · Media (已认证)

综上所述,数据驱动的AI系统相对于传统软件测试更复杂,更具有挑战。同样,还需要测试人员掌握更加全面的知识,比如机器学习、统计学、大数据分析等。

2100

云加社区技术沙龙资料合集

云加社区技术沙龙

61130

首届Apache Hadoop技术社区中国Meetup在京举办(内附完整PPT)

腾讯开源

? 近日,在Apache Hadoop社区主导及邀请下,腾讯开源、腾讯大数据、腾讯云联合承办了Hadoop技术社区在中国的首次Meetup。围绕Hadoop技...

7420

首届Apache Hadoop技术社区中国Meetup在京举办(附PPT)

腾讯技术工程官方号

腾讯 · 产品经理 (已认证)

? 近日,在Apache Hadoop社区主导及邀请下,腾讯开源、腾讯大数据、腾讯云联合承办了Hadoop技术社区在中国的首次Meetup。围绕Hadoop技...

3710

百度助力数据挖掘世界杯KDD Cup 历史性革新

用户1386409

8月6日,一年一度的KDD(国际数据挖掘与知识发现)大会召开,这是数据挖掘领域国际最高级别会议,而其旗下赛事KDD Cup 被称为数据挖掘领域的“世界杯”。今年...

5520

从原理到代码,轻松深入逻辑回归模型!

AI科技大本营

【导语】学习逻辑回归模型,今天的内容轻松带你从0到100!阿里巴巴达摩院算法专家、阿里巴巴技术发展专家、阿里巴巴数据架构师联合撰写,从技术原理、算法和工程实践3...

5420

使用AR、AI以及大数据改革教育体系——为每位学生打造自己的私人定制学习路线

用户3578099

教育一直以来都是社会大众讨论的热门话题,人们所喊得口号基本没有太大的变化,比如“给孩子们减负”、“还孩子一个美好童年”等。相关的教育部门也为此制定了一些政策,比...

6310

妈妈再也不用担心,我学不会大数据 flink 啦

一猿小讲

面对霸气侧漏的业务需求,由于没有大数据知识储备,咱心里没底,咱也不敢问,咱也不敢说,只能静下来默默储备、默默寻觅解决方案。

3010

是什么让Flink成为最火计算引擎

Yajun_

我是在两年前随公司参加一个会议上知道的Flink,那是一家做大数据安全的公司,利用大数据分析安全威胁预警。当时会议上他们展示了三种流计算技术,大家应该都知道,也...

6810

Apache Parquet 干货分享

Yajun_

Parquet 是一种面向分析的、通用的列式存储格式,兼容各种数据处理框架比如 Spark、Hive、Impala 等,同时支持 Avro、Thrift、Pro...

4130

HBase案例 | 20000个分区导致HBase集群宕机事故处理

Yajun_

这是几个月前遇到的一次HBase集群宕机事件,今天重新整理下事故分析报告。概况的说是业务方的一个10节点HBase集群支撑百TB级别的数据量,集群region数...

6410

Hadoop、Spark、Kafka面试题及答案整理

Yajun_

一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成。

5520

一份超详细的 Spark 入门介绍

Yajun_

Apache Spark 是 UC Berkeley AMP Lab 开源的类 Hadoop MapReduce 的通用并行框架,是专为大规模数据处理而设计的...

7120

HDFS 读写流程与数据完整性

Yajun_

开始之前先看看其基本属性,HDFS(Hadoop Distributed File System)是GFS的开源实现。

4420

万物互联背景下的边缘计算安全需求与挑战

边缘计算

摘要:作为万物互联时代新型的计算模型,边缘计算具有的分布式、“数据第一入口”、计算和存储资源相对有限等特性,使其除了面临信息系统普遍存在网络攻击之外,还不可避免...

7250

从TDengine的开源说起技术选型

曲奇泡芙

“TDengine是一个针对物联网,车联网和工业物联网领域优化的开源大数据平台。除了是一个速度快10倍的时序数据库,它还提供了缓存,流式计算,消息队列和其他以减...

4330

在Java大环境下.NET程序员如何夺得一线生机

梁规晓

  .NET其实很早就能做大数据项目了,有本地的也有云端的,本地的太生僻,没人知道,也很少有.NET开发去学习,云端的更是用不起,笔者身边倒是有一位做.NET大...

4830

机器学习数据集的获取和测试集的构建方法

材ccc

上一篇机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)介绍了开始一个机器学习项目需要明确的问题,比如当前任务属于有监督还是无监督学习问题,然后性能...

4830

选型宝访谈:移动+社交时代,如何治理“大数据洪水”?

用户5952482

提到大数据,我们首先会遇到一些概念,比如说大数据、数据仓库、数据湖等,请李总先为我们梳理一下这些概念,说说它们的发展渊源吧。

3900

Kafka深度解析

天涯泪小武

本文转发自技术世界,原文链接 http://www.jasongj.com/2015/01/02/Kafka深度解析

8120

扫码关注云+社区

领取腾讯云代金券