腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(7540)
视频
沙龙
2
回答
我
能够
使用
Talend
job
创建
.
csv
文件
,
并且
我
想
使用
tSystem
组件
将
.
csv
转
换为
.
parquet
文件
?
我
有一个
创建
.
csv
文件
的
Talend
作业,现在
我
想
使用
Talend
v6.5.1
转
换.
parquet
格式。
我
能想到的唯一选择是,
tSystem
组件
从.
csv
临时登陆的本地或目录调用python脚本。
我
知道
我
可以
使用
pandas或pyspark很容易地将其转换,但我不确定同样
浏览 23
提问于2019-07-10
得票数 0
1
回答
如何
使用
talend
将
表中的数据从
CSV
文件
转
储到表中,方法是为
csv
中的每一行手动递增id为Max(id)+1
、
、
、
我
正在尝试执行ETL
Talend
Job
,其中
我
在
csv
文件
中有记录,
并且
必须将这些记录
转
储到表中。
我
的表有主键列,即Id。
CSV
文件
没有Id列。因此,
我
必须从表中获取max( id )+1,并
使用
增量id逐一插入
csv
行。 尝试
将
Max( id )设置为全局变量,并在Tmap中为每一行将此id递增为id+1。但它不会为<em
浏览 0
提问于2019-01-16
得票数 0
9
回答
如何
将
csv
文件
转
换为
拼接
、
我
刚接触BigData.I需要将
csv
/txt
文件
转
换为
Parquet
格式。
我
搜索了很多,但找不到任何直接的方法。有什么方法可以做到这一点吗?
浏览 3
提问于2014-09-30
得票数 40
5
回答
如何
使用
AWS胶
将
多个
CSV
文件
转
换为
Parquet
、
、
、
我
使用
AWS S3、Glue和Athena,设置如下:
我
的原始数据作为
CSV
文件
存储在S3上。
我
使用
Glue for ETL,
使用
Athena查询数据。由于我
使用
雅典娜,
我
想把
CSV
文件
转
换为
Parquet
。
我
现在用AWS胶来做这个。这是
我
正在
使用</e
浏览 1
提问于2018-04-23
得票数 16
回答已采纳
2
回答
使用
Dask - OOM的大
csv
到地板
我
有7个
csv
文件
,每个8GB,并需要转
换为
地板。 df.to_
parquet
() df
浏览 0
提问于2020-06-03
得票数 3
回答已采纳
2
回答
使用
Talend
遍历.
csv
文件
一般情况下,在此处完成新手到
Talend
/数据集成。
我
做了一些简单的事情,比如
使用
Talend
将
CSV
加载到Oracle表中。
我
必须
创建
一个
Talend
Job
,每天早上解析这些
csv
文件
,并将它们加载到oracle表中,以便
我
的BI/报告团队可以
使用
这些数据。此表将用作查找表,
并且
源确保不会在
csv
浏览 0
提问于2020-04-17
得票数 0
1
回答
如何在没有RLE_DICTIONARY编码的情况下
将
CSV
转换成拼花
文件
?
、
、
我
已经测试了三种
将
csv
文件
转
换为
拼板
文件
的方法。你可以在下面找到他们。这三个人都
创建
了拼花
文件
。
我
尝试
使用
Windows上的"APACHE查看器“查看
parquet
文件
的内容,
并且
始终收到以下错误消息:1
使用
熊猫: import pandas a
浏览 8
提问于2022-09-01
得票数 2
2
回答
TalendOpenStuido DI
将
.slx
文件
一列的内容替
换为
.
csv
文件
的另一列
我
有两个输入
文件
:
我
已经有了一个
将
.xlsx
文件
转
换为
.xml
文件
的
talend
作业。.在这种情况下,结果将是:
我
的
talend
工作看起来是这样的:
我
使用
一个tMap
组件
将
.
浏览 2
提问于2017-08-11
得票数 0
回答已采纳
1
回答
利用Avro/
Parquet
将
地理数据导入BigQuery
、
、
、
、
目前,
我
使用
拼图
文件
将
数据导入BigQuery (地理信息系统)。其中一个拼图
文件
包含几何列,
将
几何数据表示为WKT字符串(MultiPolygon),
我
想将该列作为GEOGRAPHY类型导入。文档提到不支持从WKT (string)到GEOGRAPHY的自动转换,那么
我
如何克服这个问题?
我
希望避免
使用
CSV
文件
,并手动提供模式定义。然而,即使
我
首先
创建<
浏览 29
提问于2018-09-18
得票数 3
回答已采纳
1
回答
dataframe..write - AttributeError:“NoneType”对象没有属性“模式”
、
、
、
、
我
正在尝试
将
csv
文件
转
换为
拼花
使用
火星雨。
parquet
_file = s3://bucket-name/prefix/
parquet
_df.write.format("
parquet
").option("compression", "gzip").save(
parquet
_file).mode(SaveMode
浏览 5
提问于2021-02-03
得票数 0
4
回答
Talend
:如何在tFileOutputExcel中
使用
相对路径或如何获得项目dir?
、
、
、
、
使用
talend
时,
我
希望保持项目的可移植性,因此
我
需要避免硬编码的绝对路径。现在,
我
需要将
文件
导出为XLSX。假设
我
的项目驻留在Windows "D:/MyLongAndFancyPathToProjects/MyCurrentProject/
talend
.project"下的本地硬盘上
我
在“
文件
名”(File)中
使用
了tFileOutputEx
浏览 2
提问于2015-02-27
得票数 3
1
回答
Apache :如何
使用
保存在"avro.schema“属性中的模式从
CSV
文件
创建
拼花
文件
、
、
我
正在尝试
使用
Apache从
CSV
文件
创建
一个
parquet
文件
。
我
能够
将
CSV
转
换为
parquet
文件
,但问题是,这个
parquet
文件
的模式包含struct类型(
我
需要克服这种结构类型),并将其转
换为
string类型。
我
在Windows 2016上<em
浏览 3
提问于2021-08-02
得票数 0
回答已采纳
1
回答
分区拼花
文件
需要更多的空间和更多的时间来查询。
理论上,
Parquet
文件
所占用的空间比
CSV
要小,
并且
应该能更快地提供结果。
我
的实验正好相反。这项活动需要700万英镑。
Parquet
文件
夹的大小为48 is,而
CSV
为2.5MB。
使用
“城市”过滤标准查询
Parqu
浏览 1
提问于2021-07-26
得票数 0
1
回答
复制到运行正常但不加载数据的gzip
文件
、
我
正在
使用
talend
bulk execution
将
数据从s3加载到snowflake。
Talend
tFileArchive
将
文件
转
换为
gzip格式,file.
csv
.gz并上传到s3存储桶。通过
talend
批量
组件
执行的副本如下所示。它不会抛出错误或其他东西,但也不会加载数据。如果
我
尝试在没有zip的情况下加载
csv
文件
,它可以正常工作。F
浏览 3
提问于2020-07-31
得票数 0
1
回答
塔伦德:如何在MySql DB中
创建
一个表并
使用
CSV
进行填充?
、
、
我
正在
Talend
工作,并试图
使用
csv
文件
中的数据
创建
一个表。数据库已经存在,但是它没有表,因为
我
需要
能够
使用
Talend
组件
创建
一个表。
我
正在
使用
MySQL。
我
真的很难找到这方面的教程。
浏览 5
提问于2014-03-06
得票数 3
回答已采纳
2
回答
从Oracle到Apache :如何处理最终的一致性?
、
、
、
、
我
有一个现有的生产Oracle数据库。但是,由于数据量或查询的复杂性,某些类型的操作存在性能问题。data (id, value, fk_metadata_types_id) metada
浏览 0
提问于2020-02-02
得票数 2
回答已采纳
1
回答
为什么
我
要将多个拼花
文件
合并成一个单独的拼花
文件
?
、
、
、
、
假设
我
有一个
CSV
文件
,有数以亿计的记录。然后,
我
希望
使用
Python和Pandas
将
CSV
转
换为
Parquet
文件
,以读取
CSV
并编写
Parquet
文件
。但由于
文件
太大,无法将其读入内存并写入单个
Parquet
文件
,所以我决定以500万条记录块的形式读取
CSV
,并为每个块
创建</em
浏览 2
提问于2022-02-14
得票数 2
1
回答
Talend
tRESTClient不工作
、
、
我
有一个
Talend
作业,它有一个输入
CSV
文件
,需要转
换为
JSON格式,然后
使用
tRESTclient/tREST,进行HTTP调用请求和post数据。在当前作业中,
我
在本地计算机上安装了Elasticsearch服务器,并提供了该URL。
我
可以
将
文件
转
换为
JSON格式,也可以
使用
tlogrow
组件
进行验证,但无法发布数据。(附注:
我</em
浏览 1
提问于2015-08-14
得票数 0
1
回答
Amazon
创建
单一Praquet
、
我
有
我
的数据源,它以
csv
格式生成每小时的
文件
,这些
文件
被推送到S3。然后
使用
Glue进行一些ETL,并将转换后的数据再次推回S3。
使用
此数据的另一个部门希望
将
文件
合并为昨天的单个
文件
。
我
编写了一个python程序,它将昨天的24个
文件
合并成一个
CSV
文件
。现在还需要在
Parquet
中提供单一的统一
文件
。<em
浏览 0
提问于2019-09-17
得票数 0
回答已采纳
1
回答
使用
talend
读取shapefile属性
、
、
我
使用
TOS的空间插件来执行以下任务:
我
有一个具有X和Y坐标的数据集。
我
还有一个包含多个多边形和两个元数据属性( name和Id )的shapefile。对于多边形中的一个点,
将
确定哪个多边形属于一个点。
我
正面临障碍:
我
无法从
文件
中检索名称和Id。
我
只能看到一个属性调用the_geom。如何读取元
浏览 3
提问于2017-03-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas 2.0正式版发布:Pandas 1.5,Polars,Pandas 2.0 速度对比测试
csv格式文件如何转换成excel文件
在Cloud ML Engine的TPU上从头训练ResNet
怎么把vcf转换成csv格式?这3个方法建议学起来
Python模块之CSV导出(一)
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券