腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
如何创建具有默认值的列/如何在Kusto上填充具有相同值的列
、
、
以下是我提出这个问题的用例,如果有帮助的话:要
摄取
的MyData.
csv
(Header将在
摄取
之前被移除)如下: Date ID
浏览 19
提问于2020-02-26
得票数 3
1
回答
Python
摄取
csv
文件
、
、
我正在尝试将日常
csv
数据注入
Python
。我每天都有不同的
文件
,如下所示。我需要帮助添加两列,其中来自列的值来自
文件
名,例如第一列应该获取'_‘之前的值,第二列获取
文件
名中的日期部分。board_2019-08-08.
csv
Summary_2019-08-08.
csv
path = "C:\xyz\Files\ETL\Dashboard" all_files =
浏览 8
提问于2019-11-08
得票数 0
回答已采纳
1
回答
H2OFrame将dict转换为全零
、
、
、
、
目前,我使用以下命令将我的输入从pandas (尝试在这里轻松地使用sklearn预处理)转换为: modelH2OFrame = h2o.H2OFrame(
python
_obj = model_data_frame.to_dict
浏览 3
提问于2016-03-25
得票数 0
2
回答
如何在DB2中读取excel工作表中的数据
、
也试过但是发明了。
浏览 3
提问于2013-01-11
得票数 1
1
回答
如何在加载到BigQuery之前清理.
CSV
文件
?
、
我有许多存储在gcs中的.
CSV
文件
,我希望通过使用以下命令将.
CSV
中的数据存储到创建的表中我试过了,但总是出错如何在导入.
CSV
之前删除不需要的值?
浏览 0
提问于2019-12-22
得票数 0
1
回答
使用数据库中的元数据丰富
CSV
、
、
、
我一直在寻找一种轻量级的、可伸缩的解决方案,用数据库中的其他元数据来丰富
CSV
文件
。
CSV
中的每一行表示一个数据项,列表示属于该数据项的元数据。基本上,我有一个
CSV
摘录,我需要从数据库中添加额外的元数据。元数据可以通过ODBC或REST API调用来访问。将
CSV
导入到数据库表中,通过使用SELECT语句查找所需的元数据,使用sql UPDATE语句应用附加元数据,然后将数据导出回
CSV
格式。我还考虑了一个基于NodeJS
浏览 4
提问于2015-10-01
得票数 1
1
回答
如何在数据工厂中解压缩包含TAR
文件
的压缩
文件
夹,其中每个
文件
都包含
CSV
文件
?
、
、
、
、
我尝试执行在
Python
脚本中执行的数据
摄取
和转换。现在我试着在Data Factory上做同样的事情,因为它应该更容易。 我有个拉链
文件
夹。它包含Tar
文件
。每个
文件
都包含压缩的cvs
文件
。通过将
csv
文件
直接
摄取
到blob中,这当然很容易,但如果我必须自动接收这样一个压缩
文件
夹,如果我甚至不知道如何解压缩、解压缩和再次解压缩,我如何能够在数据库中加载
csv
?
浏览 10
提问于2019-10-03
得票数 0
1
回答
Apache Nifi :我想将我的数据
CSV
摄取
到Elasticsearch,而不是使用apache nifi将其流式传输到其他处理器
、
、
、
我正在尝试设置一个简单的过程来修改我的
CSV
文件
,并使用Apache Nifi将其
摄取
到elasticsearch DB。我不想在将
文件
从一个处理器传递到另一个处理器时,在Stdout上流式传输我的
CSV
文件
。 我已经做了两个流程。我的第一个流程是使用
python
处理器获取我的
CSV
文件
,使用ExecuteStreamCommand对其进行定制,我在其中运行我的GetFile脚本来读取、修改和保存我的
CSV
文
浏览 2
提问于2019-08-06
得票数 0
1
回答
如何在将
csv
文件
加载到配置单元表时跳过页脚/尾部记录
、
、
、
该
文件
是逗号分隔的
CSV
格式。 存在用于
摄取
CSV
文件
的框架。通过以下方式跳过同一
文件
中的标题: Df.Option(“header”, “true”) 但是预告片记录在同样的火花包中,我无法跳过它同样的逻辑。 请帮助进行此数据
摄取
。
浏览 8
提问于2019-09-23
得票数 1
1
回答
Azure数据砖中的
CSV
摄取
错误.
文件
读取错误
、
我的任务是使用
python
执行
CSV
文件
的数据
摄取
。我正在使用下面的代码块,即使位置正确,也会得到file not found的错误。spark.read.format("Filelocation") \ .option("file.schemaLocation"
浏览 5
提问于2022-05-05
得票数 0
回答已采纳
2
回答
将数据注入zipline
、
、
现在,为了创建我自己的数据包,我通过以下链接:"zipline ingest -b /home/furqan/Desktop/
python
_data"Error: No bundle registered with the name'/home/furqan/Desktop
浏览 4
提问于2017-09-17
得票数 0
1
回答
在不知道列顺序的情况下通过Polybase
摄取
CSV
文件
、
、
、
我正在尝试使用Polybase将几个
CSV
文件
从Azure Data Lake
摄取
到Azure Synapse。每个
CSV
文件
中都有一组固定的列,列名称位于第一行。但是,列可以按不同的排序顺序出现。是否有其他方法可以
摄取
CSV
文件
?
浏览 12
提问于2020-05-07
得票数 0
回答已采纳
1
回答
ElasticSearch :纯文本
文件
,而不是JSON
、
、
、
、
感兴趣的elasticsearch和工作与txt
文件
,而不是json。elasticsearch能支持纯文本
文件
吗?
浏览 16
提问于2019-05-21
得票数 1
1
回答
使用查询将多个excel
文件
摄取
到MySQL
、
我正在尝试将excel
文件
中的数据加载到MySql中的表中。有400个.xlsx格式的excel
文件
。我已经成功地将一个
文件
摄取
到表中,但问题是需要手动将excel
文件
转换为
csv
文件
,将其保存在某个位置,然后运行查询以使用LOAD LOCAL INFILE加载。如何对其余的
文件
执行此操作。如何加载
文件
夹中的所有400个.xlsx
文件
,而不是手动将它们转换为.
csv
文件
,然后在th
浏览 29
提问于2020-06-23
得票数 0
1
回答
AWS雅典娜在GoogleCloud中的等价物
、
、
寻找一个等效的GoogleCloud工具,可以在解压前查询压缩的
CSV
。目前我们使用雅典娜来实现这一点,但正在寻求过渡到GoogleCloud。在GCP中,有没有等同于Athena查询压缩
CSV
的工具?
浏览 14
提问于2020-02-11
得票数 3
回答已采纳
2
回答
如何使用
python
将Kafka中的数据发送到ElasticSearch
、
、
、
我使用的是
Python
语言。我有
csv
文件
,我需要转换成json,然后发送到kafka,然后发送到ElasticSearch。 我能够将
Csv
转换为Json并发送给kafka消费者。
浏览 0
提问于2018-12-06
得票数 3
1
回答
使用Logstash将Geo_shape添加到Elasticsearch
、
、
我有一个
CSV
文件
,其中包含WKT格式的几何图形。我正在尝试使用
CSV
文件
摄取
geo_shape数据。我创建了一个映射,如
文件
"input_mapping.json“中所示 "mappings" : { "properties" : {下面是我尝试使用logstash插入的输入
CSV
文件
: WKT,Lot_plan,Tenur
浏览 2
提问于2019-03-05
得票数 0
1
回答
Spring XD读取多个网站数据
、
、
、
我需要创建一个网站,阅读不同网站的内容,并帮助他们进行比较。现在我需要知道: 1.如何从不同的网站读取数据。使用java,我可以读取和获取html数据。但问题来了,解析html内容以获取所需信息的最佳方式是什么?问候你,Jubin
浏览 4
提问于2015-02-03
得票数 2
1
回答
复制到:如何添加分区?
、
、
Databricks中的命令COPY INTO提供了一个
摄取
增量表的幂等
文件
,请参阅here。在文档中,示例命令如下所示: COPY INTO delta.target_path` FILEFORMAT =
CSV
PATTERN = 'folder1/file_[a-g].
csv
' FORMAT_OP
浏览 12
提问于2021-06-16
得票数 1
1
回答
我们什么时候应该使用SNOWPIPE?
我们在Sharepoint门户中有一些大小在500 MB 20 MB之间的
文件
。我们希望将这些
文件
转换为
CSV
,然后将它们转换到雪花。没有真正的实时摄入的必要。我正在考虑两个选择。哪一种选择更好?将
文件
(
CSV
)加载到云提供程序对象存储中。创造一个外部舞台。然后每小时安排一个
python
程序来
摄取
从舞台到雪花表的数据使用 我更倾向于#1,主要是因为我将控制仓库。此外,它将允许我堆
文件
,然后加载到雪花。
浏览 2
提问于2020-09-22
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
智聆口语评测
活动推荐
运营活动
广告
关闭
领券