腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
HDFS的批量
分析
apache-spark
、
hadoop
、
hive
、
hdfs
、
batch-processing
我正在实时获取点击
流
数据
。所有发送给卡夫卡的
数据
都被吃掉了。 速度层:我们可以使用clickstream / Flink等实时
分析
点击
流
数据
中的会话。将
数据
发送到HDFS之后,假设使用Hive或Spark对其进行
分析
。我每隔30分钟配置一次作业。这份工作一般与
流
分析
相同。但是它每30分钟运行一次,并
分析
用户会话(用户行为)。Question2:如何才能从HDFS(上一
批
之
浏览 1
提问于2019-08-31
得票数 0
3
回答
火花
流
无法读取从hdfs中的水槽中创建的文件
hadoop
、
apache-spark
、
hdfs
、
spark-streaming
、
flume-ng
我创建了一个实时应用程序,在这个应用程序中,我使用flume从weblog中将
数据
流
写入hdfs,然后使用火花
流
处理该
数据
。但是,尽管flume正在hdfs中编写和创建新文件,但spark
流
无法处理这些文件。如果我使用put命令将这些文件放到hdfs目录中,火花
流
就能够读取和处理这些文件。
浏览 9
提问于2015-06-09
得票数 2
回答已采纳
1
回答
CUFFT计算多幅图像上二维FFT的策略
image
、
matlab
、
cuda
、
cufft
在MATLAB上,做一个2D FFT
需要
0.3毫秒,而对所有128幅图像做FFT
需要
大约128倍的毫秒数。cudaMemcpy( out_complex, *odata, 128 * 128 * sizeof(cufftDoubleComplex), cudaMemcpyDeviceToHost ); 在我的机器上大约
需要
浏览 2
提问于2016-04-06
得票数 1
回答已采纳
2
回答
Google BigQuery
流
-插入时间
json
、
ssis
、
google-bigquery
我首次在客户端项目上使用Google BigQuery,并使用SSIS插件(CData)在SSIS中创建包,将
数据
插入到表中(这是一个奇怪的组合,但我的客户
需要
这样的组合)。我希望将大约100 k行插入到BigQuery表中,但是,当我想对该表执行进一步的更新查询时,无法执行这些查询,因为
数据
仍然在缓冲区中。人们如何知道在BigQuery中
需要
多长时间,以及是否有方法来加快这一过程?
浏览 1
提问于2017-11-29
得票数 1
1
回答
Azure
流
分析
输入blob存储动态路径模式
azure
、
azure-blob-storage
、
azure-stream-analytics
我们在这个Blob存储中创建目录来标识批处理,如下所示:我尝试将“批处理-*”放在输入路径模式中,以便动态分配目录,但这是不允许的。这和
流
分析
有
什么
关系吗? 谢谢你提前帮助我。
浏览 3
提问于2020-04-10
得票数 2
回答已采纳
2
回答
制造业调度与工作
流
分析
中的图形
数据
库建模
database-design
、
neo4j
、
time-series
、
graph-databases
我们希望应用图形
数据
库来帮助我们理解制造生产线中与工作
流
相关的瓶颈、资源利用率、延迟问题和其他与时间相关的问题。 还有更多吗?
浏览 3
提问于2019-09-10
得票数 0
1
回答
WSO2物联网:如何使用事件存储存储设备历史记录
wso2
、
iot
、
wso2-cep
我想知道WSO2 CEP是如何工作的,Event Stream很简单,但是Event Store是
什么
呢?它可以存储设备历史,但在哪里?我想到的是Spark,它只在内存中存储
数据
,对吗?如果我想将设备历史记录存储在RDMS中,我能做
什么
?谢谢
浏览 1
提问于2016-06-07
得票数 0
回答已采纳
1
回答
最佳服装管理系统或库存软件系统
windows
、
inventory
报告选项(书面报告、
分析
、枢轴、视图、图表、查询)网络接口-第三方或内部开发销售/成本报告矩阵需求
分析
与规划多维定价模块,制造路径模板会计核算
一体
化每个用户可自定义工作
流
库存管理
浏览 0
提问于2014-05-02
得票数 3
1
回答
风暴式间歇加工
apache-kafka
、
apache-storm
、
trident
我是风暴的新手,几乎没有
什么
基本问题。我对风暴的用例是
流
处理和批处理。用例2:风暴拓扑应该将元组作为一
批
元组进行处理。问:有没有办法,我可以说,一个特定的元组是结束的溪流和风暴应该告诉我
什么
时候处理完所有的元组? 是否Storm不是这样做的正确框架,因为它是用于
流
处理的(用例1)。风暴三叉戟对用例#2有帮助吗?
浏览 3
提问于2015-09-22
得票数 0
1
回答
创建
需要
流
并提供批处理的Kapacitor UDF (Python)
user-defined-functions
、
influxdb
、
kapacitor
、
influxdb-python
我在创建一个
需要
流
并提供批处理的UDF方面遇到了困难。我在网络上搜索(foruns,documentation),但是所有的例子都是批处理BACH,流流或批处理
流
。
浏览 0
提问于2018-07-04
得票数 0
回答已采纳
1
回答
tensorflow验证监视器
流
auc
python
、
tensorflow
在tensorflow验证监视器
流
auc中,它对流意味着
什么
?案例1:每次调用验证监视器时,都会重置auc状态,因为在每个验证步骤中,对10个
批
进行
流
处理。案例2: auc状态没有重置,因此
流
auc是从验证监视器的第一次调用中计算出来的。即,第一输出( 100步)从10
批
计算
浏览 5
提问于2017-06-09
得票数 1
回答已采纳
1
回答
是否有一个变量来识别火花
流
中的每一
批
数据
?
apache-spark
、
spark-streaming
在火花
流
中,
数据
按
批
间隔进行处理。is first batch of data10s~15s is third batch of data是否有一个变量来识别火花
流
中的每一
批
数据
如果有这样的变量:我可以获得batchID的值来识别哪一
批
数据
,也可以通过batchID (如:window(……).filter(_.batchId == 1) )过滤<
浏览 6
提问于2016-02-02
得票数 3
回答已采纳
1
回答
将火花流连接到
流
集输入
streaming
、
spark-streaming
、
streamsets
我想知道是否有可能提供输入来激发来自StreamSets的
流
。我注意到在StreamSets连接器目的地中不支持火花
流
。 我将探讨是否有其他方法将它们连接到一个示例POC。
浏览 3
提问于2016-07-06
得票数 3
回答已采纳
1
回答
具有周期性更新静态
数据
集的结构化
流
scala
、
apache-spark
、
spark-structured-streaming
流
和静态
数据
集的合并是结构化
流
的一个很好的特点。但是每一
批
数据
集都会从
数据
源中刷新。由于这些源并不总是动态的,因此在指定的时间段(或
批
数)缓存静态
数据
集将是一种性能增益。在指定的批处理期间/
批
数之后,
数据
集将从源重新加载,否则将从缓存中检索。 在星火
流
中,我使用缓存的
数据
集来管理它,并在指定数量的批处理运行后取消它的持久化,但是由于某种原因,这不再适用于结构化
流<
浏览 1
提问于2017-12-13
得票数 9
1
回答
火花
流
-我如何通知消费者一旦生产者完成?
scala
、
apache-kafka
、
spark-streaming
、
kafka-producer-api
一旦notify Consumer将所有
数据
发布到Kafka topic,Producer是否有可能有
什么
有效的方法来解决这个问题吗?更新: 每隔十五分钟,生产者就会得到
数据
,并开始将
浏览 0
提问于2016-11-12
得票数 2
回答已采纳
2
回答
如何将
流
数据
与更新较慢的表连接起来(例如一天一次)?
apache-spark
、
spark-structured-streaming
在结构化
流
中,我
需要
将
流
数据
与一些变化缓慢的
数据
连接起来。变化缓慢的
数据
每天都会更新,并且可能不会在固定的时间更新。然而,
流
数据
是秒级别的。如果我不想加载每个微
批
中变化缓慢的
数据
,并且还希望在更新后获得变化缓慢的
数据
的最新版本,有
什么
方法可以做到这一点吗? 谢谢
浏览 0
提问于2019-12-05
得票数 0
1
回答
Azure服务织物路由
azure
、
azure-service-fabric
、
azureservicebus
、
azure-eventhub
我真的
需要
一个事件中心来使这个过程脱钩吗,或者说,将消息从“路由应用程序”直接发送到不同的“类型应用程序”有意义吗?你好,马库斯
浏览 0
提问于2017-05-23
得票数 2
回答已采纳
4
回答
在R中的方差和置信区间内和之间计算
r
、
statistics
作为开发一种新的
分析
化学方法的一部分,我
需要
计算一些
数据
的
批
内和
批
间方差。我还
需要
使用R语言从这个
数据
中获得置信区间> variance1 1 1 9.853 1 3 10.00 4 2 1 9.90
浏览 1
提问于2009-09-09
得票数 7
回答已采纳
1
回答
火花结构化
流
作业如何处理
流
-静态DataFrame连接?
apache-spark
、
pyspark
、
spark-streaming
、
spark-structured-streaming
我有一个火花结构化
流
作业,它从cassandra和deltalake读取映射表,并加入流df。我想了解这里的确切机制。星火是否击中了这些
数据
来源(卡桑德拉和德尔塔雷克)的每一个周期的微
批
?
浏览 2
提问于2020-12-02
得票数 1
回答已采纳
1
回答
如何在星火
流
中仅在新批次上重新训练模型(不使用以前的训练
数据
集)?
apache-spark
、
pyspark
、
spark-streaming
、
apache-spark-mllib
让我通过一个例子来解释: 当一个新元素到达时,第二
批
应该执行培训(在增量模式下?!)没有加载所有的200000元素之前,但只是与模型和一个新的元素。
浏览 6
提问于2016-11-25
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券