首页
学习
活动
专区
圈层
工具
发布
首页标签streaming

#streaming

深入解析Spark Structured Streaming:无限DataFrame的核心机制与应用

用户6320865

在2025年数据驱动的世界中,实时数据处理已成为企业决策和业务优化的核心需求。无论是金融交易监控、电商实时推荐,还是物联网设备状态追踪,流处理技术正以前所未有的...

11210

Spark Streaming 深度解析:微批处理模型、DStream与面试关键点

用户6320865

在大数据技术快速演进的今天,流处理已成为企业实时数据分析和决策支持的核心能力。作为Apache Spark生态系统的重要组成部分,Spark Streaming...

11610

让AI对话像流水般自然:深入大模型Streaming技术核心源码

老周侃AI

在传统的大模型交互中,用户输入请求后需等待整个响应生成完毕才能看到结果。当响应内容较长(如长文本生成、多轮对话)时,这种阻塞式交互会导致:

52410

Spark实时(四):Strctured Streaming简单应用

Lansonli

Structured Streaming中结果输出时outputMode可以设置三种模式,三种默认区别如下:

20610

Spark实时(三):Structured Streaming入门案例

Lansonli

我们使用Structured Streaming来监控socket数据统计WordCount。这里我们使用Spark版本为3.4.3版本,首先在Maven po...

21310

解决spark streaming重复提交第三方jar包问题

shengjk1

由于spark streaming每次提交都需要上传大量jar包到hdfs,为节约HDFS资源,现只存一份来解决这个问题

9610

Spark Streaming 中使用 zookeeper 保存 offset 并重用 Java版

shengjk1

最近中使用spark Streaming +kafka,由于涉及到金额,所以需要保证at only one, 而网上关于java版的kafka offset...

11000

【智能大数据分析 | 实验四】Spark实验:Spark Streaming

Francek Chen

打开 IntelliJ IDEA 准备编写 Spark-streaming 代码。点击 File -> New -> Module -> Maven -> Ne...

73800

Spark编程实验五:Spark Structured Streaming编程

Francek Chen

1、通过实验掌握Structured Streaming的基本编程方法; 2、掌握日志分析的常规操作,包括拆分日志方法和分析场景。

42000

Structured Streaming

Francek Chen

提供端到端的完全一致性是设计Structured Streaming 的关键目标之一,为了实现这一点,Spark设计了输入源、执行引擎和接收器,...

1K00

Spark编程实验四:Spark Streaming编程

Francek Chen

继续在流计算端的sparkstreaming目录下创建一个socket目录,然后在该目录下创建一个NetworkWordCount.py程序:

36700

Spark Streaming

Francek Chen

很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是静态数据。技术人员可以利用数据挖掘和OLAP(On-Line Analy...

28300

Spark中的Spark Streaming是什么?请解释其作用和用途。

GeekLiHua

Spark Streaming是Apache Spark中的一个组件,用于处理实时数据流。它提供了高级别的API,可以以类似于批处理的方式处理连续的数据流。Sp...

61510

Spark流计算Structured Streaming实践总结

用户9421738

结合日常项目需求,本文总结记录spark streaming和structured streaming 比较常用的使用案例,如:kafka2hdfs、 k...

46910

推荐一个Python流式JSON处理模块:streaming-json-py

Python兴趣圈

每天,我们的设备、应用程序和服务都在生成大量的数据流,这些数据往往大多是以JSON格式存在的。

64910

别再混淆事件源(Event Sourcing)和消息流(Message Streaming)了!

JavaEdge

除了聚合子流,事件源域模型的所有事件通常都按照聚合最初发出的时间顺序作为全序事件流。为此还需要一个顺序索引。因此,事件溯源数据库须支持两种类型的索引。

23100

.NET分布式Orleans - 7 - Streaming

Chester Chen

在Orleans中,Streaming是一组API和功能集,它提供了一种构建、发布和消费数据流的方式。

25910

Spark Streaming 整体介绍

Freedom123

1. 概要     Hadoop的MapReduce及Spark SQL等只能进行离线计算,无法满足实时性要求较高的业务需求,例如实时推荐,实时网站性能分析等...

45410

论文解读: streaming-LLM 使各种模型稳定、高效地处理长达400万tokens的文本

唐国梁Tommy

为了保持论文中原汁原味的语义信息,保留相关原文,没有刻意翻译成中文,避免造成误解。

2.2K20

grpc streaming实战

公众号guangcity

前段时间看到开源项目中使用到grpc streaming接口,趁此机会学习一下,找了个很久之前的官方demo,RouteGuide,将其代码适配到最新grpc版...

42220
领券