腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(302)
视频
沙龙
1
回答
Spark
Structred
Streaming
Pyspark
Sink
Csv
不
附加
python-3.x
、
apache-spark
、
pyspark
、
apache-kafka
、
spark-structured-streaming
但我必须接收/写入文件
csv
。但是我不能。我只写了一次
csv
,但没有
附加
。 你可以在下面看到我的代码。 谢谢!import
pyspark
from
pyspark
.sql.types import *
spark
= SparkSession.builder\
浏览 23
提问于2020-01-11
得票数 1
回答已采纳
1
回答
Spark
Flume
streaming
-包丢失?
python
、
apache-spark
_2.10-1.6.2.jar
spark
-
streaming
-flume-
sink
_2.10-1.6.0.jar/bin/
pyspark
--master ip:7077 --total-executor-cores 1 --packages com.databricks:
spark
-
csv
_2.10:1.4.0from
浏览 3
提问于2016-08-11
得票数 0
1
回答
Spark
Streaming
水槽集成
apache-spark
、
spark-streaming
、
flume
在尝试了许多更改之后,我仍然遇到了将Flume自定义接收器和
Spark
Stream绑定到同一端口的问题。我使用的是Flume 1.6.0和
Spark
2.0.0。使用
Spark
+flume集成指南,我构建了.conf文件和
spark
.py文件。我首先启动flume代理,但当我尝试在同一端口上使用
Spark
-
streaming
(读取)时,它显示fail to bind。我尝试了多个端口,但据我所知,无法找到任何网络限制(完全权限)。
浏览 17
提问于2016-09-28
得票数 0
1
回答
TypeError:'JavaPackage‘对象不可调用&在类路径中找不到
Spark
Streaming
的Kafka库
apache-spark
、
pyspark
、
apache-kafka
、
spark-streaming
我使用
pyspark
流来读取kafka数据,但它出错了:from
pyspark
.
streaming
.kafka import KafkaUtilssc = SparkContext(appName="test"
浏览 0
提问于2020-01-05
得票数 0
2
回答
OSError:[Errno 22]火花流
PySpark
中的参数无效
apache-spark
、
pyspark
、
spark-streaming
from
pyspark
.sql import SparkSessionfrom
pyspark
.
streaming
import[*]', appName="
Spark
Kafka
streaming
test") ssc = StreamingContext(sc, 60) 最后一行是错误来自: Traceback (most-2.4.4-bin-hadoop2.7/pytho
浏览 37
提问于2019-12-16
得票数 0
1
回答
只能在流式数据集/数据帧上调用
Spark
:writeStream
apache-spark
、
elasticsearch
、
pyspark
、
apache-kafka
、
spark-structured-streaming
我正在尝试从我的Kafka集群中检索tweet到
Spark
Streaming
,在
Spark
Streaming
中我执行一些分析,将它们存储在ElasticSearch索引中。import os os.environ['
PYSPARK
_SUBMIT_ARGS'] = '--packages org.apache.
spark
:
spark
-
streaming
-kafka-0-8_#
Spark
浏览 82
提问于2020-11-04
得票数 2
1
回答
执行
Spark
streaming
从Kafka主题读取数据时出错
windows
、
apache-spark
、
pyspark
、
apache-kafka
spark
-submit --packages org.apache.
spark
:
spark
-
streaming
-kafka-0-8_2.11:2.4.7
Streaming
Example.pyfrom
pyspark
import SparkContextfrom
pyspark
.
streaming
importStreamingContext f
浏览 15
提问于2021-05-27
得票数 0
2
回答
如何将电火花数据发送到卡夫卡主题?
python
、
pyspark
、
apache-kafka
、
spark-structured-streaming
、
spark-kafka-integration
import findsparkfrom
pyspark
.sql import SparkSession ''' To open a
spark
sessi
浏览 21
提问于2022-06-13
得票数 0
2
回答
无法使用运动流在
spark
-
streaming
中创建流
pyspark
、
spark-streaming
、
amazon-kinesis
我是kinesis的新手,我正在尝试使用
spark
-
streaming
(
Pyspark
)处理kinesis流数据,并面临以下错误from
pyspark
import Spark
浏览 0
提问于2019-07-20
得票数 2
1
回答
将Flume twitter流连接到python中火花时出现的UTF-8编码错误
apache-spark
、
pyspark
、
spark-streaming
、
flume-ng
、
flume-twitter
usr/local/
spark
/python/lib/
pyspark
.zip/
pyspark
/worker.py", line 172, in main File "/usr/python/lib/
pyspark
.zip/
pyspark
/
streaming
/flume.py", line
浏览 5
提问于2017-01-01
得票数 2
回答已采纳
1
回答
在MultilayerPerceptronClassifier类中添加预测阈值
machine-learning
、
pyspark
、
classification
、
cross-validation
、
apache-spark-ml
$$anonfun$2.apply(sharedParams.scala:201) at org.apache.
spark
.ml.param.Param.validate(params.scala:72)at org.apache.
spark
.ml.param.ParamPair.<init>(params.scala:656)
浏览 1
提问于2020-06-24
得票数 1
1
回答
吡火花流和实用程序导入问题
python
、
pyspark
、
apache-kafka
'--packages org.apache.
spark
:
spark
-
streaming
-kafka-0-8_2.11:2.3.0
pyspark
-shell' importtimefrom
pyspark
import SparkContext, SparkConf from
pyspark
.
streaming
import
浏览 1
提问于2021-10-18
得票数 0
回答已采纳
1
回答
由于文件格式
不
匹配,
PySpark
数据不能保存在Hive中
apache-spark
、
pyspark
、
apache-spark-sql
、
spark-streaming
我可以通过阅读kafka主题来创建数据格式,但是由于文件格式
不
匹配,数据没有被写入Hive表。): table = kafka_
sink
_name kafka_config = { ..
浏览 10
提问于2022-03-23
得票数 0
回答已采纳
1
回答
如何使用多个输入流和多个输出流在一个单一的电火花会话?
apache-spark
、
pyspark
、
apache-spark-sql
、
spark-streaming
、
spark-structured-streaming
下面是我的代码,from
pyspark
.sql.types import StructType, StructField,StringType
浏览 3
提问于2021-07-18
得票数 0
1
回答
Pyspark
结构化流处理
apache-spark
、
pyspark
、
spark-structured-streaming
我正在尝试用
spark
做一个结构化的流媒体应用程序,主要思想是从kafka源读取,处理输入,写回另一个主题。我已经成功地让
spark
读写了kafka,但是我的问题出在处理部分。以下是我的代码.builder \.getOrCreate() .readStream \ .option(&
浏览 37
提问于2019-07-17
得票数 0
回答已采纳
1
回答
spark
流式传输到
pyspark
json文件中的数据帧
python
、
json
、
pyspark
、
spark-streaming
from __future__ import print_functionimport
csv
from
pyspark
import SparkContextfrom
pyspark
.
streaming
import StreamingContextfrom
pyspark
.sqlimport SparkSession fro
浏览 3
提问于2017-07-30
得票数 0
1
回答
Spark
streaming
一个接一个地处理RDDs?
apache-spark
、
pyspark
我用
pyspark
写了一个
Spark
Streaming
程序。这是
Spark
的默认行为吗?有什么
浏览 1
提问于2015-04-29
得票数 0
1
回答
如何在结构化查询中使用scikit学习模型?
apache-spark
、
scikit-learn
、
pyspark
、
spark-structured-streaming
AttributeError: 'numpy.ndarray' object has no attribute 'isnull'inputPath = "/FileStore/df_training/
streaming
_df_1_nh_nd/"from
pyspark
.sql.types import * data_schema = data_
浏览 4
提问于2019-11-20
得票数 1
回答已采纳
1
回答
如何加载已经从Kafka发布的所有记录?
pyspark
、
apache-kafka
、
spark-structured-streaming
我有一个
pyspark
结构的流媒体python应用程序,设置如下 from
pyspark
.sql import SparkSession .builder\ .getOrCreate() .format(":
Streaming
query made pr
浏览 7
提问于2019-03-05
得票数 2
回答已采纳
1
回答
PySpark
RDD与Scala的转换
apache-spark
、
pyspark
、
rdd
TL;DR -我在
PySpark
应用程序中有一个看起来像字符串的DStream。我想将它作为一个DStream[String] 发送到Scala库。但是,Py4j
不
转换字符串.。下面是我想出的最简单的Python代码:ssc = StreamingContext(sparkContext=sc, batchDuration=int(1)) from
pyspark
.
streaming
.kaf
浏览 4
提问于2016-09-12
得票数 5
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券