腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(1721)
视频
沙龙
1
回答
pyspark
streaming
如何
设置
ConnectionPool
、
、
在spark官方文档中,我发现: #
ConnectionPool
is a static, lazily initialized pool ofconnections for record in iter:但是我找不到任何用火种
设置
<
浏览 11
提问于2019-07-22
得票数 1
1
回答
如何
在火花流中启用背压(使用火花放电)
、
、
、
我想知道通过backpressure在spark
streaming
中通过
pyspark
启用
pyspark
的正确方法是什么。看起来我在很短的时间内收到了太多来自Kafka的消息,然后就爆炸了。下面是我的spark
streaming
代码。
浏览 1
提问于2018-05-13
得票数 2
回答已采纳
1
回答
电火花流卡夫卡偏移管理
、
、
、
、
我一直在做星火流工作,这些工作是通过卡夫卡( kafka )来消费和生产数据的。我使用了directDstream,所以我不得不自己管理偏移量,我们用redis编写和读取offsets.Now有一个问题,当我启动我的客户端时,我的客户需要从redis获得偏移量,而不是使用itself.how中存在的偏移量来显示我编写的代码?现在我已经编写了下面的代码: ssc, kafkaParams={"boots
浏览 0
提问于2018-04-12
得票数 2
回答已采纳
2
回答
卡夫卡的
PySpark
直接流媒体
、
、
、
bin/
pyspark
--packages org.apache.spark:spark-
streaming
-kafka_2.10:1.5.2基于中的示例。from
pyspark
.
streaming
import StreamingContext ssc =/
streaming
/util.py", line 62
浏览 3
提问于2015-11-15
得票数 3
2
回答
如何
在木星笔记本中使用
PySpark
时包含外部火花库
、
、
、
、
我试图运行以下
PySpark
流在木星笔记本。下面是我在笔记本中使用的代码的第一部分:from
pyspark
.
streaming
import StreamingContextfrom
pyspark
.
streaming
.kafka import KafkaUtils sc =
pyspark
.SparkContext(master='local[*]',appName="
浏览 0
提问于2018-06-29
得票数 1
回答已采纳
1
回答
TypeError:“JavaPackage”对象不可调用
、
、
、
、
不确定
如何
继续。下面是我正在运行的命令和错误。/opt/spark/bin/spark-submit --jars spark-
streaming
_2.10-2.0.0.jar test_kafka.py broker.txt "localhostKafkaUtils.createDirectStream(ssc, [topic], {"metadata.broker.list": brokers}) File "/opt/spark/p
浏览 9
提问于2016-08-29
得票数 3
2
回答
电火花外壳中的外部包(jars) --
如何
、
我试图通过环境变量
PYSPARK
_SUBMIT_ARGS中
设置
的
PYSPARK
_SUBMIT_ARGS选项导入库。(如果我试图在
pyspark
-shell之前指定--packages选项,则根本无法实例化spark上下文) 我不知道这些下载的jars (或一般的jars//spark.apache.org/docs/latest/api/python/
pyspark
.h
浏览 0
提问于2019-12-11
得票数 0
1
回答
Pyspark
:在运行文件时使用星火提交时执行木星命令时出错。
、
、
我可以运行火星雨和运行一个脚本的木星笔记本。但是,当我试图使用submit从终端运行文件时,会得到以下错误:有人能帮我一下我的配置有什么问题吗?
浏览 2
提问于2017-09-30
得票数 9
2
回答
如何
在
PySpark
中创建带偏移量的InputDStream (使用KafkaUtils.createDirectStream)?
、
、
如何
在
Pyspark
中使用带有特定Topic偏移量的KafkaUtils.createDirectStream?
浏览 0
提问于2015-10-22
得票数 12
1
回答
如何
使从卡桑德拉流到星火?
、
、
、
、
print_function import sysfrom random import randomfrom
pyspark
.
streaming
import StreamingContextfrom
pyspark
.
streaming
.kafka importKafkaUtils from
pyspark</em
浏览 1
提问于2016-01-26
得票数 7
回答已采纳
1
回答
在
pyspark
中将Kafka的结果写入csv
、
、
我已经
设置
了一个Kafka代理,并且我设法用
pyspark
读取记录。import osimport
pyspark
from
pyspark
import SparkConf, SparkContext, SQLContext, Rowfrom
pyspark
.
浏览 12
提问于2020-05-20
得票数 0
2
回答
_jvm.org.apache.spark.
streaming
.kafka.KafkaUtilsPythonHelper() TypeError:“JavaPackage”对象在使用
、
我正在学习
如何
将spark与kafka集成。目前,我创建了一个virtualenv并安装了
pyspark
、py4j包。我还配置了以下环境: from
pyspark
.
streaming
import StreamingContext from
pyspark
.<e
浏览 0
提问于2019-07-15
得票数 0
回答已采纳
1
回答
只能在流式数据集/数据帧上调用Spark :writeStream
、
、
、
、
我正在尝试从我的Kafka集群中检索tweet到Spark
Streaming
,在Spark
Streaming
中我执行一些分析,将它们存储在ElasticSearch索引中。import os os.environ['
PYSPARK
_SUBMIT_ARGS'] = '--packages org.apache.spark:spark-
streaming
-kafka-0-8_2.11:2.3.0,org.elasticsearch:elasticsearch-hadoop:7.6.2
浏览 82
提问于2020-11-04
得票数 2
1
回答
getBatch从MQTTTextStreamSource返回的DataFrame没有isStreaming=true
、
、
、
、
我尝试将MQTT与
PySpark
结构流结合使用。from
pyspark
.sql import SparkSessionfrom
pyspark
.sql.functions$apache$spark$sql$execution$
streaming
$StreamExecution$$runStream(StreamExecution.scala:295) at org.apache.spark.sql.execut
浏览 5
提问于2018-07-26
得票数 3
1
回答
卡夫卡与火花的整合
我想使用Apache和Spark流来
设置
一个流应用程序。Kafka运行在一个单独的unix机器版本0.9.0.1上,Sequv1.6.1是hadoop集群的一部分。我用python编写了代码,并使用以下命令执行:/opt/mapr/spark/spark-1.6.1/python/lib/
浏览 6
提问于2016-08-24
得票数 1
回答已采纳
1
回答
使用外部jar文件运行
PySpark
作业时找不到库
、
、
、
我有一个包含以下代码的
PySpark
作业InitiatorSpark.py: .readStream .format("org.apache.bahir.sql.
streaming
.mqtt.MQTTStreamSourceProvider.load("tcp://{}&
浏览 10
提问于2018-07-23
得票数 1
2
回答
如何
摆脱org.apache.kafka.clients.consumer.KafkaConsumer.subscribe :火花流+卡夫卡中的NoSuchMethodError错误
、
、
、
、
我的
设置
:Scala 2.11火花2.2.1我甚至不能运行示例脚本:from
pyspark
import SparkContext, SparkConffrom <em
浏览 1
提问于2018-02-09
得票数 3
2
回答
无法看到星火中卡夫卡流的信息
、
、
、
、
我一直在Jupyter Notebook上运行整个
设置
。我正在尝试从Twitter
Streaming
获取数据。(auth, CustomStreamListener(api))火花流代码from
pyspark
.
streaming
浏览 4
提问于2017-09-30
得票数 0
1
回答
如何
在Amazon EMR上读取kinesis数据流?
、
、
、
我
如何
在
pyspark
上(在emr上)读取这个流?我希望能够在此数据流上执行操作。JavaPackage' object is not callable File "/usr/lib/spark/python/lib/
pyspark
.zip/
pyspark
/
streaming
/kinesis.py", line 8
浏览 35
提问于2020-07-03
得票数 1
1
回答
如何
将星火流与Tensorflow集成?
、
、
、
、
我正在处理来自卡夫卡的火花流(
PySpark
)中的连续数据,现在我想将处理过的数据发送到Tensorflow。
如何
用Python在Tensorflow中使用这些转换后的DStreams?谢谢。以下是py代码:from
pyspark
import SparkContextfrom
pyspark
.
streaming
.kafka import KafkaU
浏览 0
提问于2018-12-18
得票数 3
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券