如何使用Apache方解石对CSV文件执行UPSERT？

、

我尝试执行下面的查询 "INSERT INTO " + schema + "." + fileName+" '(' id,name ')' VALUES (3,'abc')") 我不确定方解石是否支持UPSERT。如果不能使用Apache方解石，请告诉我还可以使用哪些库将UPSERT转换为CSV文件</e

浏览 13提问于2020-04-02得票数 0

1回答

Apache方解石CSV适配器- SQL客户端

我从Apache方解石CSV适配器开始，作为测试方解石功能的第一步。我遵循了教程我的问题是如何在SQL客户机中使用JDBC连接器(以及哪种配置)，比如Dbeaver或松鼠.？

浏览 8提问于2022-02-22得票数 0

回答已采纳

1回答

Apache从CSV文件中获取唯一记录

、

我有两个csv文件和两个文件有记录。我想删除重复的记录。我想要独特的记录。我怎样才能用Apache做这件事？id,surname,name2,mert,tolgaid,surname,name3,ahmet,ozanoutput.csv；1,ali,veli3,ahmet,ozan

浏览 5提问于2021-12-19得票数 0

回答已采纳

1回答

方解石将sql解析为多个数据源的部分

、

在我的例子中，我是通过单个sql从多个数据源(如csv+mysql)查询数据。如何区分表的数据源，以及如何使用方解石检测表上查询的列？(可用数据源的元数据) 我的情况就像Apache(使用方解石)所做的那样，我试着阅读了钻取源代码，但我找不到如何通过钻取来决定关系。Stri

浏览 0提问于2019-05-25得票数 1

回答已采纳

1回答

如何避免方解石在内存中进行聚合

当我运行"select count(x)，y group by y“这样的查询时，calcite在内存中执行所有的计算。因此，有了足够的数据，它就可以在内存之外运行。有没有一种方法可以使用其他存储进行聚合？有一个spark选项，但当我启用它时，我得到一个nullptr异常。这是否意味着使用spark来计算结果，以及它是如何工作的？

浏览 0提问于2016-03-25得票数 3

1回答

分组多记录CSV到JSON的转换

我有下面的样本CSV数据在多记录格式。我想转换成如下所示的JSON格式。我使用的是Nifi 1.8。CSV：1,XXX,ABC,Active,USA1,XXX,XYZ,Active,USA ], "USA", ] 我尝试过FetchFile ->

浏览 0提问于2019-08-10得票数 0

2回答

Apache和Hudi:大量输出文件

、、、

我试图从许多不同的.csv文件中读取数据(所有文件都具有相同的“结构”)，使用Spark执行一些操作，最后以Hudi格式保存它们。要将数据存储在同一个Hudi表中，我认为最好的方法是在执行写操作时使用append方法。hudi_options = { 'hoodie.table.name'

浏览 2提问于2021-04-14得票数 2

回答已采纳

1回答

将SQL规范化为相同的格式

、、

我想编写一个包来管理mysql/pgsql视图，但为此，我需要检查代码中定义的视图是否与我使用show create table命令获得的数据库中的视图相同。现在，我使用创建tmp视图、获取定义和删除视图的方法。它很管用，但看起来不太好。

浏览 0提问于2020-06-13得票数 1

回答已采纳

3回答

如何提高DataTable.Load()的性能？

、、

我目前使用来自Codeproject的自定义CSV类来创建CSV对象。然后我使用它来填充一个DataTable。在概要分析下，这比我想要的花费了更多的时间，我想知道是否有更有效的方法来做这件事？CSV包含大约2,500行和500列。CSV阅读器来自：CsvReader csv = new CsvReader(s, true); DataTable dt = ne

浏览 1提问于2012-04-19得票数 2

1回答

不能将RexCall强制转换为Apache* Beam SQL中的RexInputRef异常*

、、

我正在尝试使用Beam SQL执行一个简单的连接，但在编译时遇到异常： Exception in thread "main" java.lang.ClassCastException: org.apache.beam.repackaged.beam_sdks_java_extensions_sql.org.apache.calcite.rex.RexCallcannot be cast to org.apache.beam.repackaged.beam_sdks_java_exten

浏览 81提问于2019-02-12得票数 0

2回答

Apache Phoenix -使用一条upsert语句插入多行

、、、

我正在使用Apache Phoenix，我正在尝试生成一系列测试数据，以便我可以测量性能。我想知道是否有一种方法可以使用一条UPSERT语句插入多行。dbms_random.value(1,10), dbms_random.value(1,10) connect by level <= 10; 如果没有，我还有更多的选择，比如使用csv文件，或者创建一个程序来为我做多个UPSERT。

浏览 28提问于2016-01-14得票数 0

1回答

如何修改RelNode树？

我正在根据对这些SQL查询设置某些限制的策略，使用Apache方解石来验证和重写SQL。我试图修改RelNode树，以便重写查询以强制执行这些限制。我希望能够从查询中删除某些部分(在经过验证之后)。例如，我希望能够删除投影字段(我成功地使用了RelBuilder.projectExcept)，并从查询中删除表扫描及其相应的列引用。b.index = c.indexSELECT a.foo, b.barWHERE a.

浏览 17提问于2021-12-27得票数 2

回答已采纳

1回答

Hudi分区和upsert不工作

、

这个配置中的错误是什么，分区键在HUDI中不起作用，并且在执行upsert时，hudi数据集中的所有记录都会更新。所以不能从表中提取增量。','hoodie.table.namehoodie.datasource.hive_sync.enable': 'true', 'pa

浏览 50提问于2021-08-29得票数 1

1回答

如何使用nodejs将csv数据插入mongodb

、、、

嗨，我开发了一个应用程序与nodeJS，快递和mongoDB，我需要采取用户数据从csv文件，并上传到我的数据库这个数据库有一个与mongoose设计的模式。但我不知道如何做到这一点，什么是最好的方法来读取csv文件检查重复的数据库，如果用户(csv中的一列)不在这里插入它？谢谢这个应用程序有一个角度前端，所以用户可以上传文件，也许我应该在前端读取csv

浏览 5提问于2014-07-21得票数 1

1回答

sfdx force: data :bulk:upsert请求包含无效数据

在使用bulk:upsert命令通过csv文件更新帐户对象时遇到一些问题。希望有人能帮我解决这个问题。下面是我正在做的事情：Id,Name0012F00000QjhkSQAR,LimTest2sfdx force:data:bulk:upsert -s Account -f account.csv

浏览 0提问于2019-04-25得票数 0

5回答

Mongoimport csv文件，其中包含字符串_id并重新插入

、

我试图使用mongoimport在_id中插入具有字符串值的数据。由于ids看起来像整数(即使它们在引号中)，mongoimport将它们视为整数，并创建新的记录，而不是在现有记录的上方。我正在执行命令：Mydata.csv中的示例数据： { &qu

浏览 8提问于2012-04-24得票数 5

回答已采纳

1回答

(kdb+/Q语言)从CSV导入解析器创建单独的表文件(编辑)

、、、、

我有一个包含一些数据的(大) CSV文件。("SDTISSISFISS";",") 0:x};`:C:/myDir/data.csv 5000000]我想从这些数据中创建两个独立的文件，假设区分的基础是"Condition“列中的值。对于每一行，如果条件列中的值是放入

浏览 1提问于2013-06-19得票数 1

回答已采纳

4回答

如何将两个CSV与Apache连接起来

、

我正在研究ETL工具(比如Talend)，并研究是否可以使用Apache。Nifi能否用于执行以下操作：看起来，可以用来<e

浏览 15提问于2017-03-20得票数 5

回答已采纳

2回答

SQLite中的上插/合并表

、、、、

每个新数据集都从服务器中提取，并作为pandas数据帧直接加载或存储为CSV文件。新数据包含与我的原始数据相同的十列。以下是我的问题：我在谷歌上做了一些搜索，看起来我应该使用，但是我似乎找不到任何例子来说明如何使用它。是否有一个实际的UPSERT命令，如果有，请有人提供一个示例(最好使用sqlite3 )，或者向我指出有用的资源？(我找到了这个，这表明这是可能的，但我对使用数据库并不熟悉，也不知道如何实际运行<

浏览 0提问于2020-02-14得票数 0

回答已采纳

1回答

Apache读取csv文件和groupbykey

、、、、

我有一个csv文件，我知道如何使用pandas实现这一点，基本上将csv作为一个df ->组按字段‘aaa’、‘bbb’读取数据，然后构造一个新的'id‘。我的问题是如何在Apache Beam中实现相同的功能，我以前从未使用过它，我试图使用Beam读取这个csv文件和分组多个记录，但是我对熊猫使用的相同功能不支持Beam，下面是我的当前代码： i

浏览 2提问于2021-08-16得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Apache方解石CSV适配器- SQL客户端

Apache从CSV文件中获取唯一记录

方解石将sql解析为多个数据源的部分

如何避免方解石在内存中进行聚合

分组多记录CSV到JSON的转换

Apache和Hudi:大量输出文件

将SQL规范化为相同的格式

如何提高DataTable.Load()的性能？

不能将RexCall强制转换为Apache* Beam SQL中的RexInputRef异常*

Apache Phoenix -使用一条upsert语句插入多行

如何修改RelNode树？

Hudi分区和upsert不工作

如何使用nodejs将csv数据插入mongodb

sfdx force: data :bulk:upsert请求包含无效数据

Mongoimport csv文件，其中包含字符串_id并重新插入

(kdb+/Q语言)从CSV导入解析器创建单独的表文件(编辑)

如何将两个CSV与Apache连接起来

SQLite中的上插/合并表

Apache读取csv文件和groupbykey

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐