SQL合并相似的行并连接某些列_SQL在连接一列时合并重复的行_在SQL中合并重复行并使用重复数据填充新列 - 腾讯云开发者社区

java、hibernate、jpa

有一种方法可以使用@jointable来映射多到多的关系，并避免可连接行的自动级联？ @ManyToMany注释的级联属性用于创建/合并/删除相关实体(而不是连接表的行)，当我持久化/合并拥有的关系实体时，忽略@JoinTable中的连接列/反式连接列属性的可插入/可更新属性。示例:在User (Owner) x Role (mappedby)关系中，当我将一个用户与角色空集合合并时，该用户的表USER_ROLE的所有行都会被删除。提前Tks。这就是我的观点：为了使问题变得简单，让我们假设我有一个具有三个属性的用户实体: id、email和一组角色(owner，@manytomany

浏览 3提问于2014-02-27得票数 0

1回答

将数据自动填充到现有Excel模板中

sql-server、excel、templates

我得到了一个Excel模板，必须自动填充它。它应该每月上传到我们公司的中央数据库。除包含该模板的Excel文件外，Grand central不接受任何其他文件。我尝试使用SSRS重现相同的内容，但看起来SSRS无法控制在Excel中呈现外观和数据(它总是隐藏列和行，这是不可接受的)。我已经在Excel上创建了一个SQL连接，以便将存储过程数据导入Excel。现在，我必须确保将数据放入模板的相应字段中。我认为它还需要分组和分页符。请帮帮我..

浏览 2提问于2011-04-25得票数 1

回答已采纳

1回答

git合并散列名冲突->行白名单可能吗？

git

我使用相对html生成的自动文件散列。散列文件名会产生持续的冲突。是否可以从git冲突检查中省略某些代码行？

浏览 3提问于2017-02-17得票数 0

回答已采纳

2回答

SQL -如何组合(UNION?) 3列，同时在另一列上使用WHERE子句

mysql、sql、merge、union、where-clause

我试图将同一个表中的3个电子邮件列连接到一个大的电子邮件列中，其中我可以使用这个SQL： SELECT email FROM ( SELECT email FROM accounts UNION SELECT email2 FROM accounts UNION SELECT email3 FROM accounts )accounts WHERE email LIKE '%@%' 但是，我还希望能够只返回来自同一个表(accountgroup)的不同列=特定值的行。例如，我认为有用的东西： SELECT email, accountgroup FROM ( SELEC

浏览 2提问于2013-11-08得票数 0

回答已采纳

3回答

如何从不同列中的三个或更多值相同的表中选择行？

sql、oracle、join

你好，我整个上午都在做这个。我认为这是一个简单的自连接，但是自连接实际上返回了太多的行。从本质上讲，我试图在表中查找某些列值逐行匹配的行。因此，如果第一行和第三行在三个特定列中具有相同的列值，则返回这两行。到目前为止，我已经用几种不同的方式尝试了自连接和半连接。 SELECT * FROM ATable a, ATable b Where a.colValue = b.colValue and a.colValue2 = b.colValue2 这会返回太多的行。这个查询甚至是一个连接吗？我是不是走错路了？关于self joins，我错过了什么，它返回的行比表本身多？ ATab

浏览 1提问于2012-02-28得票数 2

回答已采纳

1回答

谷歌BigQuery中的分区会提高连接性能吗？

google-bigquery

我有一张大约有800 K行的桌子(我认为这不是很多)。它是由一系列其他表创建的。然后，我将使用另一个约500万行的表(使用python客户端)连接这个表，但它似乎要花费很长时间。在NoSQL和SQL世界中，我将创建一个索引。在BQ中，我认为这是一个分区，或者我可以创建一个索引。我正在使用python和下面的代码创建一个表 query = """ CREATE OR REPLACE TABLE `{table_name}` AS WITH get_all_affiliate AS ( """.format(table_name=table_nam

浏览 11提问于2022-03-18得票数 -1

1回答

在现有的大型表上创建列存储索引的最有效方法是什么？

sql-server、columnstore、sql-server-2019

我的数据仓库中有一个表，其中包含300M+行，它非常适合于聚集列存储索引，但是我不确定如何应用它。我应该创建一个具有列存储索引的表的空副本，并在其中选择我的数据，还是应该删除现有表上的所有普通索引，并直接向其添加列存储索引？我有12个CPU核心和100 12专用于SQL Server 2019。我将在维护窗口期间进行更新，并将最大服务器资源分配给此任务。添加索引的哪种方法会更快？

浏览 21提问于2020-02-26得票数 0

3回答

基于sql创建视图用例

sql、view

我有一张三栏A、B、C栏的桌子最初，列C是完全空的，对于每一个条目，A有一个数字，B有一个数字(从来都不是在同一行) 我希望创建一个视图，检查每一行是否A=x和B为null或0，然后在col中写入A的值。例子：有人能帮我指导一下吗?我还不熟悉sql。

浏览 7提问于2022-07-07得票数 -1

1回答

如何基于两个键创建查询

java、sql、jdbc、upsert

我想根据2列预置一个新插入( update或create)：如果A列和B列存在于表中，那么update值将使用此键创建一个新行。 //pasdo code for my query if(table.key1 == firstKey && table.key2 == secKey){ //update values for the row with key1, key2 } else { //create a row with firstKey, secKey as keys } 我在后端有一个oracle sql服务器。

浏览 5提问于2016-03-06得票数 1

回答已采纳

1回答

为什么星火规划师更喜欢排序合并连接而不是杂乱散列连接？

apache-spark、join、apache-spark-sql

为什么Spark2.3中的星火规划师更喜欢一种类型的合并连接而不是混搭的散列连接？换句话说，为什么spark.sql.join.preferSortMergeJoin配置属性是？杂乱的散列连接有什么问题？这是特定于星火，它是以分布式的方式进行计算，还是其他一些在联接算法中固有的东西？您可以找到JoinSelection执行规划策略和中使用的属性，如下所示： case ... if !conf.preferSortMergeJoin && ... => Seq(joins.ShuffledHashJoinExec(...))

浏览 0提问于2018-04-25得票数 18

回答已采纳

1回答

SSIS -循环访问多个数据源数据

ssis

我是SSIS的新手。我有以下场景，我通过一个执行SQL任务从SourceA接收数据集-each行有3列- ColumnA，列b，列C 我有第二个数据源(源3)，它将为前一个数据集中的每个列C返回列D。一旦我收到这些数据，我需要映射/存储列A和列D，以存储到out本地DB(源3)。你能给我一个关于如何进行的高层次的想法吗？

浏览 4提问于2015-08-07得票数 0

1回答

SSRS报告根据参数值连接数据集

reporting-services、ssrs-2008

我有不同的数据集。每个代表一个国家(美国、法国、英国等)。此外，我有一个报告多值参数来选择国家，所以报告将只显示来自选定国家的数据。几个问题: 1.我如何像下面描述的那样连接(合并)不同的数据集? 2.我需要在报告中有一个包含Country列的表。

浏览 0提问于2015-10-24得票数 0

1回答

根据python中的多个条件合并变化的行数

python-3.x、dataframe、validation、merge、pandas-groupby

Problem：由多个条件合并不同数目的行下面是一个关于数据集外观的文体示例 "index" "connector" "type" "q_text" "a_text" "varx" ... 1 1111 1 aa NA xx 2 9999 2 NA tt NA 3 1111 2 NA uu NA 4

浏览 1提问于2021-03-13得票数 1

回答已采纳

1回答

如何从Mysql中的三个或四个表中检索交

mysql、sql

我有包含公共列的表。 A:汽车，香蕉，猴子香蕉，龙，蜗牛 C:鞋子，袜子，香蕉如您所见，香蕉列是常见列。同名，相同数据类型，(int)。我想在这张桌子上做些搜索工作。例如, 在A表中，我希望找到列“car”中包含关键字“Toyota”的行。在B表中，关键字‘邪恶蜗牛’列‘蜗牛’ …… 就像这样。然后，我想通过两个方法检索香蕉字段的值：从所有表中找到的行中香蕉，可以在所有表中找到的行中找到。所以，尽管我甚至不能勾勒出解决方案，但需要两行sql . 为了解决这个问题，我一直思考了将近八个小时，但只有头痛才会恶化。我不知道有

浏览 1提问于2016-06-23得票数 0

回答已采纳

2回答

合并数据帧中的额外行

python、pandas

我试图合并两个数据帧。框架不共享列(除了键)。因此，合并应该只在左边添加右边的列。然而，我也得到了额外的行。我不明白这两行是从哪里来的。如果我使用left_index和right_index，那么它就会工作得很好。但是，我不明白如何在键上进行正常的合并，结果会有两个额外的行。谢谢 dat1 = np.array([['Afghanistan', 2007, 'new_ep_m1524', 0],['Afghanistan', 2007, 'new_sn_m65', 0], ['Afghanis

浏览 2提问于2017-10-02得票数 0

回答已采纳

1回答

SSIS合并连接组件编写了0行

join、ssis、merge、metadata

首先，感谢社区在网站上提供的大量信息，帮助了我大量使用C#和SSIS。第二件事是我英语不太好，所以请耐心点，如果你不明白什么，请问，我会努力使它更好。我从不同的数据库获得了2个OLEDB连接源，两个表都有一个ID列，我将其用作连接键。在RUT CRUZADOS中，ID是浮动数据类型，而在另一个源(CTACTE A open )中，我不知道它是哪种类型的数据(我不能用sql server打开数据库，只能执行选择操作)。当我在合并中组合它们时，它不会返回任何错误，但是当我运行程序时，就会发生这种情况。 SSIS.Pipeline信息：“组件”“货物”(239)“写0行”。在

浏览 4提问于2013-01-22得票数 2

回答已采纳

1回答

R中两个不同大小矩阵的合并

r、matrix、merge

我见过一些关于这方面的问题，但我无法理解其中的任何一个答案，它们似乎都是封闭的。我想要做的是合并两个矩阵，它们有一个公共列，但其他列不同，行号也有很大的不同。通过检查任何一行是否有公共列的匹配列值，我应该将这两个矩阵合并在一起。例如:矩阵1 Matrix 1 Col1 Col2 Col3 Col4 a b c d e f g h i j k l Matrix 2 Col1 Col5 a e g f 在上面的示例中，矩阵1和矩阵2中的第一行在Col1和Col3中具有相同的条目，而第2行和第3行则不同。我希望输出结果如

浏览 1提问于2016-02-16得票数 1

回答已采纳

2回答

Hibernate对单表数据库的可行性

java、hibernate、jdbc

我必须设计一个web应用程序来从一个巨大的表中检索数据，该表有40列和数千行用于select查询，少数行/列用于更新。你能建议我，为了更快的性能，使用Hibernate是可行的还是不可行的，因为我只有一个表，没有任何连接？或者我应该使用jdbc dao？数据库: sql server 2008 java 7

浏览 4提问于2012-04-12得票数 1

回答已采纳

1回答

我对wrds数据库的内部连接含义有什么误解？

python、mysql、pandas、wrds

我在sql中学习了join方法，并且我知道内部联接意味着只返回我们想要设置的两个不同表的交叉点。我认为python的概念是一样的。但我很难理解特定的密码。 crsp1=pd.merge(crsp, crsp_maxme, how='inner', on=['jdate','permco','me']) crsp1=crsp1.drop(['me'], axis=1) crsp2=pd.merge(crsp1, crsp_summe, how='inner', on=['jdate'

浏览 3提问于2021-02-02得票数 0

回答已采纳

2回答

在Where子句中使用日期

oracle、sql-update

我正在尝试将日期放在where子句中。我想要更新日期列在某个日期之前或之后的所有行。如何指定只更新这些列。以下是我到目前为止的代码(不包括特定的列名)： update table1 set column1 = value where (select date from table2) < date; 我在正确的轨道上吗？每当我在这个论坛上发布问题时，我说我有一个PL/SQL问题，但回答我问题的人说，某个函数- update/if/case/etc -是一个SQL语句，而不是PL/SQL语句。有什么关系？ -Neil

浏览 0提问于2014-02-03得票数 0

1回答

熊猫-合并文档-默认键是什么？

pandas、merge

试图理解pandas.merge方法的行为。它似乎使用了术语key而没有定义它。将DataFrame或命名系列对象与数据库样式的联接合并. 命名系列对象被视为具有单个命名列的DataFrame。连接是在列或索引上完成的。如果在列上联接列，则将忽略DataFrame索引。否则，如果将索引或列上的索引连接起来，则会传递索引。在执行交叉合并时，不允许进行合并的列规范。如果两个键列都包含键为空值的行，则这些行将相互匹配。这与通常的SQL行为不同，可能导致意外的结果。合并方法使用的默认键是什么？文件记录在哪里？上面还写着The join is done on column

浏览 6提问于2022-02-23得票数 0

2回答

SQL:什么是“哪里不存在”实际检查？

sql-server、not-exists

东安SQL INSERT INTO ... SELECT FROM ... WHERE NOT EXISTS 那个条款到底是什么？我希望将col1的结果从一个表中插入到另一个表的“col1”中，在这个表中它已经不在了(也就是说，col1是一个主键) INSERT INTO <table> (<col1>) SELECT DISTINCT N.<col1> FROM N WHERE NOT EXISTS ( SELECT 1 FROM <table> C WHERE N.<col1> = C.&l

浏览 5提问于2016-10-19得票数 0

回答已采纳

1回答

在SQLAlchemy中连接列时移除空值

python、sql、postgresql、sqlalchemy

我正在尝试实现一个基于用户提供的输入连接列的函数。我使用SQLAlchemy update语句实现了它： update_statement = table.update().values({ new_column_name: assignable }) 其中assignable是： assignable = column_1 + column_2 其中column_1和column_2是sqlalchemy.sql.column的实例。它工作得很好，但是如果列中的一个行是空的，即有一个None值，则作为连接的结果返回None。我理解这是合乎逻辑的，但是有什么方法可以

浏览 5提问于2015-06-09得票数 2

回答已采纳

2回答

T-SQL SUM()，用于没有最后2列的每一行

sql、sql-server、tsql

我正在处理SQL中的一个表，它看起来像这样： NAME stage 1 stage 2 stage 3 stage 4 stage 5 PersonA 3 1 4 6 7 PersonB 1 1 6 2 9 PersonC 0 0 1 0 10 对于每一行，我需要计算不包括最后两列的总和(即阶段1到阶段3的总和)，并使其显示为单独的列

浏览 1提问于2016-08-25得票数 0

回答已采纳

1回答

Pentaho spoon指定不带数据库名的mysql连接(用于多个数据库访问)

mysql、pentaho、pentaho-spoon、pentaho-data-integration

在创建连接时，我不能将数据库列留空，因此我不能同时访问数据库(和连接表)。答案中建议的一种解决方案是将变量放在kettle.properties中。但是我不确定如何在SQL查询中访问这些变量(像${}这样的语法在SQL中可以工作吗？)

浏览 5提问于2019-12-01得票数 0

1回答

对超大型目标表的查找转换

ssis

我正在创建一个SSIS包，它实质上试图查找表A中没有在表B中的所有行。连接列是表A中的标识列，它是聚集索引，表B中的列不是标识，而是索引。我一次要分批做一万行。表A和表B都有大约350米行。我最初认为查找转换是合适的，但我不能使用完整的缓存，因为它试图在缓存中加载350 m行！如果我使用No，那么只查找10,000行的过程非常缓慢(即使表B中的查找列是索引的)。此外，表A和表B位于两个不同服务器上的两个不同的数据库中。还有更适合我想做的事情的转变吗？使用Server 2014。

浏览 5提问于2016-02-08得票数 0

回答已采纳

1回答

Libreoffice行列宽度比前面的行大

libreoffice

如何可能有跨多个列的特定列的行，或者具有比前几行中的列更大的列？在下面的屏幕截图第8行中，A列跨越到E列，而B、C、D、E列隐藏在列A后面，而前一行7的A、B、C、D、E列都是可见的，与第9行的宽度不同。怎么做的？ 📷

浏览 0提问于2015-10-12得票数 1

回答已采纳

2回答

在Ubuntu 20.04上找不到JDBC驱动程序

20.04、java、mysql

我最近更新了Ubuntu，现在我无法让Java程序连接到MySQL数据库。发生下列错误： java.sql.SQLException: No suitable driver found for jdbc:mysql://localhost:3306/PTAX?useSSL=false 我搜索了网络，唯一找到的就是安装libmysql-java。但是，当我试图安装它时，会出现下面的消息。 Unable to locate package libmysql-java

浏览 0提问于2020-10-20得票数 9

2回答

如何使PyMySQL在UPDATE语句中影响行？

python、mysql、pymysql

我需要通过MySQL更新PyMYSQL数据库中的一些行，并且我想知道已经更改了多少行。 import pymysql db = pymysql.connect(xxxx) cur = db.cursor() sql = "update TABLE set A = 'abc' where B = 'def'" cur.execute(sql, params) db.commit()

浏览 1提问于2016-08-26得票数 15

1回答

将合并单元格的Excel范围复制到Word表--这是一个错误吗?如何解决？

ms-word、vsto、comaddin

在我的话外接程序(VSTO，vb.net)中，我构建了一个从/导出到Excel的导入，合并的单元格让我很难过。我目前的环境是bit 11/64位Office365。我还不能在任何其他环境上进行测试。导入函数基本上在Word中在Excel和PasteExcelTable中复制，如下所示： excelRange.Copy wordRange.PasteExcelTable (false, false, false) 问题:当Excel区域垂直合并单元格时，一个接一个的粘贴包含表右侧的流氓单元格，如下图中列所示(第一列是Excel中的源表，中间列是Word中的结果)。我构建了一个表解析器例程来告

浏览 3提问于2022-04-14得票数 0

1回答

DocumentApp表格:如何合并列中的单元格？[w/解决方法]

google-apps-script、google-docs

我正在尝试使用GAS来构建一个文档，该文档将包含一个表格，该表格的第一列有一个单元格，第二列有多个单元格。我知道表的结构是Table > Rows > Cells，merge()方法只合并同级的单元格，即同一行中的单元格。有没有一种方法可以合并两个兄弟行中的文档表格单元格，或者实现类似的效果？

浏览 0提问于2015-07-30得票数 3

1回答

Panda's left merge:结果表有更多行，防止重复

python、pandas、merge

我有两个数据帧。df1有39780行，df2有8900454行我要合并的后缀的列：['postalcode','housenumber', 'suffix']‘df1’列包含一些NAN。 df2列： ['postalcode_right','housenumber_right', 'suffix_right', 'index_right'] (名为“index_right”的列不是该数据帧的索引。) df2 = pd.merge(df1, df2, how='left&#

浏览 1提问于2018-08-29得票数 1

回答已采纳

2回答

列出在联接(SQL或Pandas)中丢失的内容的表？

python、mysql、join

我正在比较两个表，并在一列字符串上执行连接。但是，我还想创建一个表，该表显示由于匹配无效而在联接中丢失的任何行。见下面的例子。 Input: Table 1 Table 2 A B C A B C '..' '..' 'c' '..' '..' 'c' '..' '..' 'd'

浏览 5提问于2016-02-29得票数 0

回答已采纳

1回答

MS Access在比较2个链接表时挂起

sql-server、ms-access、compare、sybase

其中一个链接表链接到Sybase数据库中的表，另一个链接到SQL Server数据库。除了几行之外，这些表的结构是相同的，数据也是相同的。我尝试使用“查找不匹配的行”查询向导来比较这两个表，找出相同(和不同)的行数。但问题是，这会使MS Access对大型表(10个million+行)挂起。是否有可以调整的设置，使访问不会挂起？我使用ODBC连接到Sybase和SQL Server。我注意到的另一件事是，当我右键单击SQL Server链接表并单击打开时，它将显示表中的所有行。当我对Sybase one执行同样的操作时，它挂起了，我必须通过任务管理器关闭访问。一些详细信息: Syba

浏览 0提问于2010-11-09得票数 1

1回答

使用PySpark有效地将多个小的csv文件(130,000个，每个列有2列)合并成一个大框架

python、csv、apache-spark、memory、pyspark

这是我之前在上发布的一个问题的又一次跟进我有以下数据集其中有一个文件列表(约13万份)。在主目录中列出了它们的子目录，因此第一个单元可能是A/AAAAA，文件位于/data/A/AAA.csv。这些文件都具有类似的格式，第一列称为日期，第二列是一系列都命名为值的列。因此，首先，值列名需要重命名为每个csv文件中的文件名。第二，帧需要完全外部连接，以日期为主要索引。第三，我希望保存文件并能够加载和操作它。文件大约在N行(日期数)X 130,001左右。我正在尝试将所有文件完全连接到一个数据文件中，我以前尝试过使用熊猫，但是当我试图连接文件列表时内存不足，有人建议我尝试使用PySpark。

浏览 4提问于2020-02-18得票数 0

回答已采纳

1回答

Synapse突然出现了在合并中使用散列分布列的问题。

merge、azure-synapse

我在事实表流中从06-25-2022开始获取错误。在此之前，没有任何问题，也没有什么改变。错误是:对目标Fact_XX的操作失败:对目标Merge_XX的操作失败:针对server的执行失败。Sql错误号: 100090。错误消息:不支持更新合并语句中的分发键列。

浏览 8提问于2022-06-30得票数 0

1回答

如何将熊猫的数据按同一数据中的其他行进行过滤？

python、sql、pandas

两只熊猫的问题：如何在未将该列添加到dataframe的情况下加入修改后的列？如何实现“左联接ZZ on.其中ZZ.ID为null”的等效操作下面有一个在SQL中具有这两个特性的示例。假设我抛一个硬币100次，注意到它是哪一个翻转。每次它落在头上时，我都会在一个名为"coin_flips“的表中添加一行，并加上”flipNumber“。这张桌子看起来像这样 flipNumber 4 5 7 12 13 14 16 我想拉出每一个"flipNumber“之前，在统计的差距。从上面的例子中，我想要拉动5,7,14，16。使用SQL，我可以这样做： selec

浏览 2提问于2016-05-24得票数 1

回答已采纳

2回答

Tablix:添加新的子列组时的空白单元格

reporting-services、ssrs-tablix

我有一个包含以下字段的数据集： SampleHour 价值 MeasureType 线路标题 AggregationON 我已经在SampleHour上创建了一个带有行组的tablix，并且我希望有两个相邻的列组，每个列组具有相同的分组层次结构，如下所示(从父到子)： AggregationON > Line > Header > MeasureType 当我定义第一个列分组结构时，一切正常:我在AggregationON上添加了一个父列组，然后在Line上添加了一个子组，指向AggregationON组等等。然后，我尝试创建第二列分组结构

浏览 1提问于2012-10-11得票数 1

1回答

如何在SSMS中合并具有不同数量和列顺序的两个表？

sql、tsql、ssms

我有一个很大的表，其中包含大约10,000行数据和100列，我希望不断更新它。问题是我用来更新(.csv)的文件通常顺序不同，或者包含额外的/缺少的列。如果update中有多余的列，我可以丢弃它们，但我希望剩余的列完全匹配，即使有些列丢失或顺序混乱。我知道有一个解决方案是创建一个select并简单地列出所有列，但我正在寻找更优雅/万无一失的东西。我见过的许多使用合并、联合或连接的示例都能很好地工作，但我不能让它们在这个更大的数据集上工作，这就是为什么它给我带来了这么多麻烦。我不是很有经验的SQL，所以我会感谢一些额外的填充解释。其中，is是列，1是数据:这里是主表 a b c d 1 1

浏览 10提问于2019-07-13得票数 1

3回答

设置数据网格中自动生成的列的最大自动生成宽度

c#、wpf、wpfdatagrid

我有一个绑定到DataTable的DataGrid，它由一个SQL查询填充。我希望这个网格的列是自动生成的，宽度高达一定数量的像素，但如果用户想要更宽的话，仍然可以扩展。目前，数据网格上的ColumnWidth属性被设置为SizeToHeader (无论如何，它似乎并不像描述的那样工作，因为它仍然根据单元格内容调整大小)。有没有办法设置最大世代宽度？设置MaxColumnWidth可防止用户将列的大小调整为大于该宽度。我也尝试过连接到AutoGeneratedColumns，但是因为行还没有加载，所以ActualWidth属性只表示我设置的MinWidth。有没有一个事件会在datagr

浏览 0提问于2011-09-01得票数 1

回答已采纳

2回答

SQL Server ORDER BY性能异常

sql-server、performance

在Windows Server Enterprise(?)上运行的SQL Server 20082008版我有一个针对二十多个表的查询连接(大多数是左外部连接)。未筛选的查询返回的完整数据集在不到1秒的时间内返回的行数少于1,000。当我应用WHERE子句来过滤查询时，它在不到1秒的时间内返回不到300行。当我将ORDER BY子句应用于查询时，它返回90秒。我检查了查询的结果，并注意到用于排序的列中返回了许多NULL结果。我修改了查询，在不改变查询性能的情况下将空值合并为有效的搜索值。然后我做了一个 SELECT * FROM ( my query goes here ) qry O

浏览 5提问于2010-10-05得票数 2

2回答

非常特殊的表的Azure表存储性能

azure、azure-table-storage

对于ATS (Azure Table Storage)是否有大约500个实体/秒/分区的方法？好的，看脏兮兮的。如果insert不能立即用于读取，则可以。希望将一些大型表从SQL移动到ATS。 Scale:由于这些表，SQL的大小超出了150 GB的限制。插入速度:查询速度的倒排索引。无法按照表聚集索引对插入顺序进行排序，这会导致SQL表迅速碎裂。与SQL相比，自动测试组(ATS)很可能具有插入优势。成本:安非他明类兴奋剂的月成本较低。但是ATS作为数百万行具有较高的负载成本，并且不能批处理，因为负载的顺序不是按分区进行的。查询速度:搜索几乎从不在一个partition

浏览 6提问于2012-07-10得票数 1

回答已采纳

1回答

Server、C#和iTextSharp。加入pdfs的最佳方式是什么？

c#、sql-server、pdf、itext

我有一个sql服务器数据库。里面有很多，很多行。每一行都有一个列，其中包含一个存储的pdf。分贝的尺寸是零碎的。因此，我们可以预计大约一半的大小是由pdfs造成的。现在我有了加入所有pdf的要求..。变成1pdf。别问为什么。你能提出最好的前进方式和哪一个组成部分最适合这项工作。有许多可用的答案：关于如何连接两个(或更多的pdfs)。但我想要的是表现。我们确实处理了大约50,000个pdfs，需要合并成一个全能pdf。编辑解决方案将1000个pdfs从4m30s合并到21s。 public void MergePDFs(string targetPDF, string sourc

浏览 2提问于2016-08-11得票数 0

回答已采纳

4回答

如何在Spark中压缩两个数组列

python、pandas、apache-spark、pyspark、apache-spark-sql

我有潘达的数据。我尝试将包含字符串值的两个列连接到一个列表中，然后使用zip将列表中的每个元素都用'_‘连接起来。我的数据集如下： df['column_1']: 'abc, def, ghi' df['column_2']: '1.0, 2.0, 3.0' 我想将这两列连接到第三列中，如下所示，我的每一行数据都是这样的。 df['column_3']: [abc_1.0, def_2.0, ghi_3.0] 我已经在python中成功地使用了下面的代码，但是dataframe相当大，运行整个datafra

浏览 2提问于2019-01-21得票数 9

回答已采纳

1回答

SQL合并行和属性

sql、sql-server、merge

我对SQL很陌生，并试图找到一个简单的语句，用于合并两个表(从两个具有不同来源的文件中导入)，基于唯一的键。合并需要同时包含行和属性，同时有效地合并两个模式。我要找的确切行为是：合并两个表中具有相同键的行。不包括在两个表中的带有键的行，未作更改。合并两个表中具有相同属性名的属性。如果同一键在两个表中都定义了一个属性，那么表2将覆盖表1。我知道前2可以在一个标准的完全外部连接中实现，但是您最终会得到重复的列。我还了解到，前3可以通过完全的外部连接加上管道/连接来实现，但只有在一个或另一个表中填充属性时才能实现，而不是同时填充两个属性。我知道T有一个合并函数

浏览 3提问于2014-12-09得票数 0

2回答

excel在excel中联接预筛选的表

excel、excel-formula、textjoin

假设我们在excel中有一个表。并且有人使用ui (从一列中的箭头)将过滤器应用于整个表。因此，在这个过滤表中，我想通过文本连接一列(过滤行)。假设我们有table1，我想要text join列语言。如果我使用函数 =TEXTJOIN(",";1;Table1[[#Data];[Language]]) 如果对列进行了过滤，结果将连接不相关的列的所有行，并且小计我认为在这里不能工作。我该怎么做才能连接筛选表中的所有行，这样每次筛选器更改时，文本连接的结果就会更改？假设这是我想要文本连接的列，有人过滤掉了第一行和第三行。所以我希望textjoin忽略这些行

浏览 2提问于2020-01-10得票数 0

1回答

SSIS任务返回多个结果

ssis

我需要在SSIS中创建一个任务，为我带来一些重复一定次数的记录(例如，分配了多个特性的标识符)。我在其中查询的表有数百万条记录，SSIS查找只返回一条记录我，即当它找到第一个匹配时。其他人都抛弃了。合并连接是不可行的，因为它可能需要几个小时。我不能过滤我希望的结果。我必须从Oracle中的表中提取记录，并将标识符与SQL server进行比较，并让满足条件的记录全部满足(全部)，而不是部分地(只有一个)。连接(内部连接)必须位于两个表之间，第一个表有10行，第二个表有8400万行。结果应该插入到一个完全为空的表中。

浏览 2提问于2015-03-30得票数 0

回答已采纳

1回答

是否横向连接星火中的其他列？

apache-spark、apache-spark-sql、spark-dataframe

我有一个大约240万行的数据集，每一行都有一个唯一的键。我在其他一些表上执行了一些复杂的SQL查询，生成了一个包含两个列(键和值true )的数据集。此数据集大约为500行。现在，我想(外部)将这个数据集与我的原始表连接起来。这会产生一个新表，其值集非常稀疏(在大约500行中为true，在其他地方为null )。最后，我想做大约200次，给出一个大约201列的最后一个表(键，加上200个稀疏列)。当我运行它时，我注意到当它运行时，它会变得相当慢。第一次加入需要2秒，然后是4秒，然后是6秒，然后是10秒，然后是20秒，在大约30次加入之后，系统永远不会恢复。当然，实际数字与我运行的集群无关

浏览 2提问于2017-11-29得票数 0

回答已采纳

2回答

如何对不同的表使用相同的存储过程，并避免使用动态sql

sql-server、stored-procedures、dynamic-sql

我有相当多的表，其中包含一些常见的列(相同的名称和数据类型)。在这些列中，我需要执行相同的操作，我希望通过存储过程来执行这些操作。不过，目前唯一能使它工作的方法是使用动态sql，我宁愿避免使用动态sql。对于不同的表(表名以参数形式传递)是否有任何方法可以使用存储过程而不使用动态sql？

浏览 0提问于2014-08-22得票数 0

回答已采纳

2回答

如何提示排序合并联接或随机散列联接(并跳过广播散列联接)？

scala、apache-spark、apache-spark-sql

我对Spark2.1中的join有一个问题。Spark (错误的？)选择广播散列join，尽管该表非常大(1400万行)。然后作业崩溃，因为没有足够的内存，Spark以某种方式尝试将广播片段持久存储到磁盘，这将导致超时。所以，我知道有一个查询提示可以强制广播连接(org.apache.spark.sql.functions.broadcast)，但是有没有办法强制另一个连接算法呢？我通过设置spark.sql.autoBroadcastJoinThreshold=0解决了我的问题，但我更喜欢另一种更细粒度的解决方案，即不全局禁用广播加入。

浏览 32提问于2018-01-08得票数 7