腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
无法
在
数据流
中
运行
pandas
、
、
、
我正在尝试理解如何在
数据流
上
运行
程序。我读到像
pandas
这样的库是内置在
数据流
中
的。我使用的数据集是常用的amazon数据集,带有评论和评级。我有以下程序: from google.cloud import storageimport
pandas
as pd from apache_beam.options.pipeline_options(文本数据)中提取一些样本数据,对其
运行
一些转换,然后以CSV文件的形式
浏览 18
提问于2021-07-24
得票数 0
1
回答
使用自定义源控制CoProcessFunction
中
处理元素的顺序
) } 像这样
在
我的测试中使用
在
processElement1和processElement2
中
,
在
MyProcessFunction
中
,我
在
接收元素时打印它们。
浏览 2
提问于2020-04-05
得票数 0
回答已采纳
1
回答
如何在google cloud
数据流
中使用
pandas
?
、
、
有没有什么方法可以使用
pandas
,numpy
在
google云
数据流
中进行转换? 在上面的链接
中
说它支持numpy、scipy和
pandas
,但没有可用的示例
浏览 2
提问于2017-06-12
得票数 1
1
回答
从
数据流
作业
中
删除Google存储
中
的文件
、
、
、
、
我有一个
在
python3.7
中
用apache创建的
数据流
,在这里我处理了一个文件,然后我不得不删除它。该文件来自google桶,问题是当我使用DataflowRunner
运行
程序时,我的工作
无法
工作,因为Google python3.7环境
中
没有安装Google云存储API。你们知道吗,不使用这个API,我怎么才能删除
数据流
中
的文件呢?我见过apache_beam模块,如,但我不知道如何使用它,也没有找到关于如何使用该模块的教程或示例。
浏览 4
提问于2020-07-15
得票数 1
回答已采纳
1
回答
不能将shell指向本地spring云
数据流
服务器?
、
我一直
在
尝试将shell指向我本地
运行
的服务器实例(
数据流
配置服务器http://localhost:9393)but我总是得到下面列出的错误。我能够导航到我的服务器并
运行
应用程序,所以我知道它在端口9393上工作,不确定为什么shell看不到它。我正在为shell
运行
1.0.0.M3版本。 我已经尝试了以下几种方法。服务器-未知:>
数据流
配置服务器http://localhost:9393
无法
联系位于‘http:
浏览 21
提问于2019-10-09
得票数 0
回答已采纳
2
回答
Azure数据工厂不使用
数据流
运行
时
、
、
、
我有一个Azure数据工厂,它有一个管道,用于从一个前提数据库
中
获取数据并复制到云中的CosmosDB。我
在
结束时使用
数据流
步骤从接收器
中
删除源
中
不存在的文档。我设置了3个集成
运行
时: Data流集成
运行
时(我将其设置为
数据流
步骤使用的TTL setting)
浏览 2
提问于2021-04-22
得票数 0
回答已采纳
1
回答
数据流
作业
无法
写入不同区域中的BigQuery数据集,即使区域设置为bigquery区域
、
、
我们正在编写一个
数据流
作业,将数据从存储桶
中
的JSON写入到BigQuery数据集。存储桶和BigQuery数据集都位于区域X
中
。但是,
在
区域X
中
无法
使用
数据流
端点。最近的区域是Y。因此,所有的计算实例都是
在
区域X
中
旋转的。但是,
数据流
作业仍然失败,错误如下: 临时位置和临时位置存储桶都被设置为区域x。我们正在创建
数据流</
浏览 4
提问于2020-03-05
得票数 0
1
回答
SSIS软件包的优化
、
我
运行
了很多,但执行时间很长。一些包裹
运行
在数千或毫升(2-15)的记录上。由于晚上的时间还不够,他们重叠,有时
运行
3-4,这使它更加困难。我做了些测试。我发现在SSIS里,vievs真的很糟糕.当我
运行
一个SQL查询时,它们
运行
得更快,然后选择到表
中
的视图中,然后执行OleDB源/目标工作。
在
执行过程
中
,源行是
在
5-10分钟内选择的,记录超过5milin,但是将数据插入目标表需要花费10倍的时间。据我所知我得到了这些信息。
浏览 4
提问于2021-05-28
得票数 0
回答已采纳
2
回答
SSIS
中
的行数转换
我正在使用“Row count”组件对
数据流
中
的行数进行计数。我已经取消了名为In_rec的新变量的代码。但它没有填充正确的行数。请让我知道该变量的输入列属性。
浏览 0
提问于2009-06-01
得票数 0
2
回答
在
SSIS
中
执行Python脚本,该脚本使用SSIS生成的数据
、
、
我希望使用python脚本来
运行
所有列标题,并将所有空白替换为'_‘。我理解我使用了'Execute Process Task‘,以及如何将它实现到SSIS
中
,但是如何引用Python SSIS包
中
包含的数据集呢?
浏览 6
提问于2020-10-28
得票数 1
回答已采纳
1
回答
使用google-api-php-client-services
在
google cloud ml引擎中进行预处理
我正在使用google-api- PHP -client-services
在
google云中训练我的PHP网站的数据。如何使用这个库
在
中进行预处理?
在
PHP中有没有替代google-api-php-client与ml_engine交互的方法?
浏览 2
提问于2017-07-21
得票数 0
1
回答
根据参数的值向SSIS输出添加其他列
我需要根据SSIS
中
参数的值向CSV添加额外的列。我当前的
数据流
是这样的:简而言之,我计算出需要
运行
它的哪些契约,然后将其传递给一个参数。然后循环遍历契约列表,并从针对契约参数
运行
的SQL查询
中
输出CSV。我的SQL查询
中
的每个契约都需要相同的列,只需要将值过滤到特定于契约的数据。我列表
中
的一个特定契约需要在每个CSV的开始
中
添加几个额外的列,作为其ETL过程的一部分。这些列将在CSV的每一行
中</
浏览 0
提问于2018-07-19
得票数 0
回答已采纳
1
回答
SSIS多表加载
、
我正在尝试将多个表从我的临时数据库加载到数据仓库
中
的多个表。我的临时数据库只是一个将所有源数据库
中
的所有表复制到其中的数据库。我发现每个
数据流
任务只允许将一个源表连接到一个目标表。我是否必须使用与我的源数据库
中
的表数一样多的
数据流
任务?有没有更简单、更有效的方法来做到这一点呢?根据我的理解,我需要一个空数据库,其中包含在SQL Server
中
创建的空Dim表和事实表,它将充当目标数据仓库,并从临时数据库接收数据。因此,我已经创建了这个空的数据仓库。请帮帮忙。
浏览 1
提问于2013-04-15
得票数 0
回答已采纳
2
回答
Google云
数据流
中
的Beam应用日志
、
、
我有一个使用directrunner
在
本地成功
运行
的Beam应用程序,它提供了我
在
本地控制台上代码
中
的所有日志信息。但是,当我尝试
在
google
数据流
环境
中
运行
它时,我只
在
本地控制台上看到这些日志信息,但是它们没有出现在Google控制台上,用于
数据流
作业,也没有出现在他们的StackDriver日志记录页面
中
。下面是我
在
本地控制台
运行
数据流
<e
浏览 1
提问于2017-09-16
得票数 7
回答已采纳
1
回答
为什么
在
Azure数据工厂
中
管道永远处于排队状态?
、
、
、
、
我有一个管道来执行Azure Data
中
的几个
数据流
,几周前它
运行
正常,持续了大约25分钟才完成,我不得不在一个过滤器
中
做一些调整(具体来说,这是最后一个也是唯一一个永远保持排队的
数据流
,这个
数据流
插入到SQL DB
中
)。
在
调整之后,每次管道
运行
时都不作任何解释,它只是
在
排队状态上保持静态,并且永远不会结束:我试图删除调整所在的筛选器,重新创建管道,正如您所看到的那样,管道
中
的最后<em
浏览 2
提问于2021-11-25
得票数 0
1
回答
如何强制数据库连接在
数据流
任务中途失败
在
连接到同一Oracle数据库的同时
运行
的序列容器中有四个
数据流
任务。也就是说,没有连接四个
数据流
任务的绿色小线,以强制它们按顺序执行。
在
执行这四个
数据流
任务时,与Oracle的obdc连接很少会失败。我可以处理这种情况,并优雅地失败。我希望能够
在
包正在
运行
并从Oracle数据库中提取数据时强制终止odbc连接。 我不能像在Sql Serv
浏览 1
提问于2012-11-07
得票数 0
2
回答
SSIS
中
的OData源组件不连接
、
、
、
在
我的
数据流
中
,我已经成功地创建了一个资源路径为4y5-998d的OData源,并且能够预览数据。一切看起来都很好,但是当我
在
Visual
中
运行
包时,会出现以下错误: 信息: 0x4004300A在
数据流
任务,SSIS.Pipeline:验证阶段已经开始。错误: 0xC020801F在
数据流
任务
中
,OData Source
浏览 11
提问于2018-01-19
得票数 5
2
回答
如何从GCP
中
的云函数调用用Go编写的
数据流
作业
、
、
、
、
我的目标是创建一种机制,当一个新文件上传到云存储
中
时,它将触发一个云函数。最终,这个云函数将触发一个云
数据流
作业。 我有一个限制,即云
数据流
作业应该用Go编写,云函数应该用Python编写。在用Go编写的Cloud
中
,问题是Apache
中
没有定义template-location变量。这就是我不能创建
数据流
模板的原因。而且,由于没有
数据流
模板,我从云函数调用Cloud作业的唯一方法是编写一个Python作业,它调用
运行
数据流
作业的ba
浏览 0
提问于2019-01-13
得票数 4
回答已采纳
2
回答
从多个R文件
中
采购
、
、
、
、
目前我
在
我的本地机器上使用R,在那里我可以有条件地获取多个R脚本(因为它们被放在我的本地驱动器
中
)。 然而,当我需要在Google
数据流
中
的RENJIN上使用相同的脚本来实现并行性时,我
无法
源文件。我需要读取主R脚本文件,并且需要在
运行
时传递到
数据流
中
,但是主R文件必须引用其他R脚本文件的源标记。当从java读取主R文件内容并将其传递给google
数据流
时,Jave
无法
解释R文件
中
引用其他R脚本文件
浏览 0
提问于2017-05-24
得票数 0
1
回答
Google Cloud Platform Dataflow未加载或下载
我正面临着一个即使
在
停留30分钟后也
无法
加载
数据流
的问题。如何完成实验,任务是:-通过
在
BigQuery上
运行
查询来制作
数据流
图表。
浏览 16
提问于2021-11-09
得票数 0
回答已采纳
点击加载更多
相关
资讯
在window下可正常运行、且在linux下手动执行也可正常运行的python脚本在crontab中无法运行的排查思路
PowerShell 中运行 maven 参数无法识别
解决VMware无法在Windows系统运行
Pandas库在Anaconda中的安装方法
在Jupyter Notebook中运行R代码
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券