腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
在
不
停止
进程
的
情况下
刷新
Spark
实时
流
中
的
数据
帧
apache-spark
、
amazon-s3
、
spark-streaming
、
spark-dataframe
、
snappydata
在
我
的
应用程序
中
,我从Kafka队列
中
获得了一个帐户
流
(使用
Spark
streaming和kafka) 我需要从S3获取与这些帐户相关
的
属性,因此我计划缓存S3结果
数据
帧
,因为S3
数据
目前至少一天不会更新,它可能很快会更改为1小时或10分钟.So问题是如何在不
停止
进程
的
情况下
定期
刷新
缓存
的
数据</em
浏览 18
提问于2017-07-24
得票数 3
1
回答
星火
流
填充
的
Cassandra表上
的
星火SQL
apache-spark
、
cassandra
、
apache-spark-sql
、
spark-streaming
我有一个星火
流
的
过程,是
在
实时
填充卡桑德拉表。我想对Cassandra表进行查询,以访问底层
数据
。斯尔詹
浏览 1
提问于2016-02-24
得票数 3
回答已采纳
1
回答
如何在
spark
流
作业
中
查找
数据
帧
的
大小
python
、
scala
、
apache-spark
、
spark-structured-streaming
我正在尝试
在
每批
spark
streaming作业
中
查找
数据
帧
的
大小。我能够成功地
在
批处理作业中找到大小,但当涉及到
流
时,我无法做到这一点。我一直在
数据
库上开发
spark
应用程序,并尝试
在
流式作业中使用'df.queryExecution.optimizedPlan.stats.sizeInBytes‘。forEachBatch()函数
中
: data.writeStrea
浏览 26
提问于2019-01-18
得票数 0
1
回答
使用while循环中
的
Spark
处理日志文件
apache-spark
、
pyspark
我有一个服务器,每1秒生成一些日志文件,我想使用Apache
Spark
处理这个文件。我
的
问题是,对于这种无限运行并处理批量或一组生成文件
的
应用程序,最好
的
方法是什么。我应该使用一个无限
的
while循环,还是应该在cron job甚至像airflow这样
的
调度框架<
浏览 0
提问于2017-04-18
得票数 0
1
回答
Tableau
实时
连接操作筛选器
tableau-api
、
action-filter
我有一个仪表板,它使用
实时
数据
连接来提取
数据
,基于带有嵌入式参数
的
自定义SQL (完整
的
数据
太重,无法提取)。此控制面板包含操作筛选器。 当我加载仪表板时,由于
实时
连接,
数据
正在
刷新
。在此
刷新
之后,我希望
在
不
触发
实时
连接提取
的
情况下
与操作过滤器交互。尽管我选择了“暂停自动更新”,但
数据
源
在
每次
浏览 1
提问于2015-07-15
得票数 0
2
回答
DirectShow
停止
/恢复直播
c++
、
directshow
我使用DirectShow
在
我
的
应用程序
中
播放音频/视频文件。我使用构建过滤器图形,并使用接口播放/暂停/
停止
媒体。这适用于本地媒体文件,但会导致
实时
mms流出现问题。如果我
在
直播流上调用,该
流
将按预期
停止
播放。但是,如果我调用来恢复
流
,什么也不会发生。图形会生成一个EC_COMPLETE事件,但视频不再播放。
在
调用之后调用将从它
停止
的
地方恢复<em
浏览 0
提问于2009-06-26
得票数 1
回答已采纳
2
回答
将
数据
写入文件: fflush()需要很长时间
c
、
optimization
、
io
、
video-processing
、
buffering
我有一个要求,我必须缓冲大量
的
数据
(
在
GBs),以便将来使用。由于没有足够
的
RAM来缓冲如此庞大
的
数据
,所以我决定将
数据
存储
在
一个文件
中
。现在这里
的
缺陷是,当我将
数据
写入文件时,其他线程可能需要“缓冲”
数据
,所以每次向它写入什么东西时,我都必须
刷新
文件
流
。准确地说,
数据
是视频
帧
,作为预先记录
的
浏览 3
提问于2011-07-07
得票数 3
回答已采纳
1
回答
AWS SNS SDK
不
工作于火花
流
apache-spark
、
spark-streaming
、
amazon-sns
采用火花
流
的
实时
异常检测系统。
在
每个
流
间隔
中
,如果
数据
点异常,AWS SNS会发送一封电子邮件给订阅帐户。但是AWS SNS java sdk喜欢
在
火花
流
中
不
工作。下面是错误消息 Error StreamingContext:错误启动上下文,将其标记为已
停止
的
java.io.NotSerializableException: DStream检查点已启用,但具有其
浏览 1
提问于2016-01-04
得票数 0
回答已采纳
1
回答
如何在
不
阻塞
的
情况下
将
进程
的
stdout作为
流
使用?
java
、
processbuilder
在
Java (或clojure)
中
,我希望旋转一个外部
进程
,并将它
的
stdout作为一个
流
使用。理想
情况下
,每次外部
进程
刷新
它时,我都想使用
进程
的
输出
流
,但不确定如何实现,以及如何在
不
阻塞
的
情况下
完成输出
流
。
在
使用Java ProcessPipeInputStream作为输出
进程
(例如)时,我
浏览 4
提问于2017-07-03
得票数 3
1
回答
将星火
流
数据
流
加载到MongoDB
中
mongodb
、
apache-spark
、
pyspark
、
spark-structured-streaming
我正在从事一个项目,
在
该项目中,我拥有以下
数据
管道:我能够利用Tweepy获得推特流到卡夫卡制片人然后我使用卡夫卡消费者
的
Twitter Stream作为
数据
源,我
在
星火(PySpark)
中
创建了一个“
流
数据
框架”,进行了
实时
的
预处理和情感分析,由此产生
的</e
浏览 19
提问于2022-11-21
得票数 0
1
回答
数据
流
无法捕获来自源.csv azure
的
行更改
azure
、
csv
、
azure-data-factory
、
dataflow
我
的
想法是使用upsert将csv文件作为源& synapse表作为接收器。每当我在
数据
流
源预览
中
更改csv文件
的
行时,它都会显示旧
数据
。这是我
的
源文件,我将最后一个指示器更改为FALSE,并将其上传到blob。 我再次运行了源静态指示器
的
预览,它引用了旧
数据
我
的
源设置
数据
集设置-
浏览 0
提问于2021-07-07
得票数 0
2
回答
Python子
进程
从stdout块读取
数据
(
实时
读取输出)
python
、
subprocess
我正在尝试使用子
进程
与应用程序交互。我使用Popen创建了
进程
,但是
在
不
阻塞整个线程
的
情况下
,我无法访问输出
流
。但是,写入输入流似乎很好(使用通信测试它,但是我以后可能无法使用它,因为我需要
实时
数据
)。我注意到,有时如果
进程
终止,输出就会被
刷新
。我相信这个问题可能是因为没有发生冲厕事件(而且
在
关闭时,所有
数据
都是同
浏览 3
提问于2021-10-13
得票数 0
回答已采纳
1
回答
spark
structured streaming批量
数据
刷新
问题(partition by子句)
apache-spark
、
apache-spark-sql
、
spark-structured-streaming
我
在
连接
spark
结构化
流
数据
帧
和批
数据
帧
时遇到了一个问题,
在
我
的
场景
中
,我有一个S3
流
,它需要与历史
数据
进行左反连接,它返回历史
中
不存在
的
记录(计算出新
的
记录),并将这些记录作为新
的
追加写入历史(按列分区磁盘
数据
分区而不是内存当我
刷新
已分区
的
历史
数
浏览 14
提问于2021-04-02
得票数 0
回答已采纳
1
回答
如何通过
spark
streaming处理多个.gz文件?
spark-streaming
我一直
在
尝试通过火花
流
从hadoop文件系统
中
读取多个.gz文件。有可能做到这一点吗?如果是,你能给我一个解决方案吗?
浏览 1
提问于2016-12-26
得票数 0
3
回答
Apache如何在Hadoop MapReduce上实现100倍
的
加速,以及
在
什么
情况下
?
hadoop
、
apache-spark
、
bigdata
、
distributed-computing
它是如何实现这种惊人
的
加速
的
呢?这种加速比只适用于迭代机器学习算法,也适用于ETL (提取-转换-负载)任务,如联接和GROUPBY?
Spark
的
RDDs (弹性分布式
数据
集)和DataFrames都能提供这种加速吗?对于上述一些场景,星火社区是否获得了任何基准测试结果?
浏览 2
提问于2015-12-05
得票数 1
1
回答
用烧瓶
的
实时
数据
?
python
、
python-2.7
、
flask
、
real-time
你好,我正在尝试使用烧瓶和twitter
流
API构建一个应用程序。我最终想做
的
是根据附加
的
地理位置
数据
,用tweet
实时
更新地图。对于我来说,
在
不
刷新
页面的
情况下
向用户发送
实时
数据
的
最佳选择是什么?我还调查了现在似乎被贬值
的
神像。任何帮助引导我向正确
的
方向将不胜感激。
浏览 1
提问于2014-08-17
得票数 1
回答已采纳
1
回答
以Kafka为源
的
结构化
流
中
的
JSON模式推理
apache-spark
、
apache-kafka
我目前正在使用从Kafka主题中读取json
数据
。json作为字符串存储
在
主题中。为了实现这一点,我提供了一个硬编码
的
JSON模式作为StructType。我正在寻找一种
在
流过程
中
动态推断主题模式
的
好方法。这是我
的
代码:(这是Kotlin,而不是通常使用
的
Scala) .readStream() .option("kafka.boots
浏览 2
提问于2020-10-21
得票数 1
回答已采纳
1
回答
Windows网络插件
中
的
流
停止
javascript
、
plugins
、
safari
、
vlc
在
Windows
中
,vlc插件上
的
视频
流
有问题。我
在
嵌入标签
中
添加了windowless="true“属性,这样我就可以
在
vlc插件上显示透明
的
DIV,以便在视频上绘图。
在
添加此标签之后,
停止
视频,
不
接收视频
帧
。但是当我点击视频或在视频上画一些东西时,视频
帧
会
刷新
一段时间。即使当我删除windowless=“真”属性视频时也是有效<em
浏览 5
提问于2015-09-08
得票数 1
回答已采纳
1
回答
如何从超文本标记语言调用clearInterval()来
停止
setInterval(),它位于Google Chart JS图中,并保留当前
的
图和
数据
?
javascript
、
html
、
flask
、
google-visualization
、
clearinterval
原因是Google Chart JS使用Ajax从flask提供
的
API获取
数据
。函数setInterval()帮助我获得一个正在被flask
数据
更新
的
实时
图形。这样做
的
目的是另外增加一个按钮,该按钮可以
停止
这个
实时
进程
,但保留当前图形和当前
数据
(
不
刷新
页面)。到目前为止,我已经成功地完成了
实时
图形,但正在努力
停止
使用当前
数据
<
浏览 0
提问于2021-01-09
得票数 0
1
回答
使用InputStream - Java执行JAR并读取控制台输出。
java
、
logging
、
inputstream
我有一个myfile.jar文件,我正在通过另一个ProcessBuilder程序执行该文件,并尝试使用InputStream读取jar
的
控制台输出,如下所示:过去三天我都快疯了。解决这个问题<
浏览 3
提问于2014-12-29
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券