在具有不同行数的数据集上应用transform_lookup_如何在具有不同类的数据集上微调模型？_检查具有不同行数的两个不同数据帧，然后应用操作 - 腾讯云开发者社区

maps、transform、altair

我目前正在学习Altair的地图功能，在查看其中一个示例(https://altair-viz.github.io/gallery/airport_connections.html)时，我注意到数据集(airports.csv和flights Airport.csv)具有不同的行数。即使是这样，也可以应用transform_lookup吗？

浏览 9提问于2020-10-11得票数 2

回答已采纳

1回答

`transform_lookup`是否节省空间？

python、altair

我正在尝试链接几个牛郎星图表，它们共享相同数据的各个方面。我可以通过将所有数据合并到一个数据帧中来做到这一点，但由于数据的性质，合并后的数据帧比两个图表中的每个图表都有两个单独的数据帧所需的数据帧大得多。这是因为对于共享列中的每个条目，每个图表唯一的列都有许多重复的行。使用transform_lookup会比仅仅使用合并的数据帧节省空间吗，还是transform_lookup最终会在内部完成整个合并？

浏览 20提问于2021-03-23得票数 2

2回答

字符集和排序规则是否影响MySQL/MariaDB中的查询性能？

php、mysql、mariadb、query-performance

在MariaDB中，我一直在开发一个具有大型扩展数据库的数据库。数据库由PHP应用程序访问。我将DB字符集和排序规则设置为utf8mb4和utf8mb4_unicode_ci 但并不是所有的表都有文本(varchar、text等)列。有些表只保存关系，因此所有列都是数字类型(int、bigint等)或日期/时间等，而不是文本类型。在表中，我只保留数字，是需要保留unicode多字节字符集/排序规则，还是可以选择其他内容？最重要的是，此是否会影响查询性能？

浏览 3提问于2020-03-10得票数 2

回答已采纳

1回答

为什么我的新数据会得到相同的预测？

r、machine-learning、random-forest

这是一个r中的随机森林模型。这是一个基于拉德布鲁克赔率的足球预测模型。它预测比赛的全时结果(FTR)。 zmodel <- randomForest(traindata$FTR ~ traindata$LBH + traindata$LBD + traindata$LBA) 我尝试使用以下命令对列车数据本身进行预测 predict(zmodel,newdata = traindata) 然后，我对一个新的测试数据进行了预测。 predict(zmodel,newdata = testdata) 虽然测试数据和训练数据不同，但我得到了相同的预测结果。我做错了什么？是否有可能对与列车数

浏览 9提问于2018-01-01得票数 1

回答已采纳

1回答

每列具有不同行数的工作表的行数

我有一个包含2列不同数据量的csv文件，这个数据被称为Belasting，它看起来像： a b 1 3 3 6 2 6 4 7 8 8 9 可以看出，"a“的行数是4，而b的行数是"7”。问题是，当我使用命令nrow时，它会给出零结果，例如： nrow(belasting$a) NULL 我应该使用哪个函数以及如何编写它？

浏览 3提问于2015-04-23得票数 3

1回答

处理Altair choropleth地图中的缺失值/空值

python、data-visualization、choropleth、altair

我已经用美国州级数据在牛郎星创建了一张全息图。但是，我没有一些州的数据。默认情况下，这些状态根本不会出现在地图上。下面是一个示例图片： ? 我希望空状态在地图上显示为灰色。Altair文档显示了另一个符合此描述的地图： ? 我的问题是，如何才能使第一张地图中带有空值的州看起来像第二张地图中的州。我试过一些方法。以下是我为原始地图编写的代码： states = alt.topo_feature(data.us_10m.url, 'states') source = df alt.Chart(states).mark_geoshape().encode(

浏览 14提问于2019-03-19得票数 2

回答已采纳

1回答

为什么n层在.NET中与其他语言不同

.net、asp.net-mvc、asp.net-mvc-4、n-tier-architecture

我所做的所有项目都有ui层和域数据访问层。例如，ruby项目将数据访问存储在模型项目文件夹中。ASP.MVC具有与ruby相同的mvc结构，但我们仍然使用单独的程序集进行数据访问，而对视图模型使用模型。为什么会这样呢？为什么.net开发人员总是为dal创建单独的程序集，把dal放在项目的模型文件夹中是错误的吗？

浏览 1提问于2014-06-22得票数 0

回答已采纳

1回答

良好的预处理数据集

preprocessor、machine-learning、data-mining

我注册了一门数据挖掘的研究生课程，我的任务是编写数据挖掘预处理器的代码。我可以自由选择编程语言和数据集。我想知道是否有人能提出一个很好的数据集供使用。我一直在浏览，我找到了更多这样的资源。但作为一个初学者，我不确定哪一组数据会是一个好的选择。预处理程序应该处理以下内容：数据清洗缺失值错误离群值非归化去重复数据约简抽样技术降维在选择数据集时，我应该考虑哪些属性？你认为有什么具体的数据吗？

浏览 2提问于2011-10-31得票数 3

回答已采纳

1回答

BSSID可以用作唯一标识符吗？

android、networking

我正在开发一个Android应用程序，其中列出了围绕用户的所有wifi网络。当用户尝试使用特定服务时，我的应用程序需要有关用户网络的信息。当我的应用程序从用户的网络中获取所有信息时，它会自动在我的数据库表中插入一个新行，并包含所有这些必要的信息。我遇到的问题是，我不知道是否所有的Wifi网络都有唯一的标识符。我将保存我的数据库中的所有东西，有些Wifi信息并不是唯一的，比如SSID 因此，我想知道BSSID是否可以用作唯一的ID，因为我需要比较每个网络。我将检查网络是否在我的数据库上，检查BSSID值是否在我的数据库上。谢谢。

浏览 3提问于2015-07-20得票数 2

回答已采纳

1回答

MS Access比较两个表中的所有字段

ms-access

我正在做一个项目，有明确的开始和结束日期，每天都会产生数据。每天我都会收到一个数据集，其中包含从项目开始到前一天的所有数据(例如，第10天我将收到从第1天到第9天的数据，第11天我将收到从第1天到第10天的数据，依此类推)。每行数据将有大约15个字段，我需要能够突出显示是否有任何追溯更改，在每行数据的任何字段。有没有办法做到这一点？非常感谢您的任何建议！

浏览 0提问于2015-08-06得票数 0

3回答

如果我有多个SQL语句，是否必须包含"SELECT @@RowCount“？

sql、sql-server、tsql、rowcount

我知道，如果我执行一个更新或删除某些数据的SQL语句，它将返回受影响的行数。但是，如果我在一个SQL脚本中有多个sql语句，并且我想知道上次执行的语句中受影响的行数，它仍然会自动返回这个语句，还是需要一个 SELECT @@RowCount 在剧本的结尾？所述代码不是存储过程。相反，它是存储在任意位置的参数化SQL脚本，使用实体框架中的ExecuteStoreCommand函数执行，如下所示： var numberOfRowsAffected = context.ExecuteStoreCommand<int>(mySqlScript, parameters);

浏览 10提问于2016-05-24得票数 0

回答已采纳

1回答

在哪里可以进行多变量孤立点检测？

outlier、kaggle

有人能为我提供一个数据集，希望是在Kaggle上，在那里我可以练习我的离群点分析技巧吗？我研究这个话题已经有一段时间了，但是我找不到一个案例来应用我的知识。加分:如果它有一些分类变量，我可以练习各种技术来处理分类变量及其相关性，这将是令人惊奇的。如果在同一个数据集中不可能，也可以引导我使用两个数据集。

浏览 0提问于2022-02-20得票数 0

1回答

SSRS Report Builder 2012 -如何根据字段值隐藏列表？

reporting-services、ssrs-2012

我正在使用report Builder 2012创建报告。我在列表框中插入了多个文本框和其他控件，这样只需隐藏列表框，就可以一次隐藏所有控件。我正在使用SQL Server存储过程来提取数据行。我使用下面的表达式来隐藏/显示列表框。 =iif(Fields!certificateType.Value = "CT", False, True) 它工作得很好，但它只检查第一行数据。如果第一行数据中的certificateType字段是"CT“，它会显示列表框，但不会隐藏certificateType不是"CT”的下一行数据的列表框。似乎列表框可见性只检查第一行数据，

浏览 0提问于2017-05-29得票数 0

1回答

HuggingFace:使用自定义data_loader和data_collator从本地目录流式传输数据集

nlp、pytorch、huggingface-transformers、huggingface-datasets

我有自定义的data_loader和data_collator，我正在使用HuggingFace应用程序接口进行变压器模型的训练。它还执行数据集的映射，其中还执行了标记化。我的data_loader脚本是一个继承了datasets.GeneratorBasedBuilder的类，所以包含了生成样本的_generate_examples函数。在开始训练时，它缓存整个数据集(仅在系统上缓存一次)，然后开始训练。我可以在本地系统上重用该缓存，但不能在任何其他系统上使用该缓存的.arrow文件，因此缓存过程重新启动。我想通过使用流媒体功能来避免缓存。我当前的代码如下所示： from dataset

浏览 303提问于2021-10-08得票数 0

3回答

Netezza使用元/系统表获取大表的行数

netezza

我在Netezza中有几个大表(几十of的数据)。我正在尝试找到一种使用系统/元表计算这些表中的行数的方法。我知道我可以使用： SELECT COUNT(*) FROM tablename; 但这很慢，而且给Netezza设备带来了大量负载。我需要定期计算这些大表中的行数，所以我不想影响正在运行的其他重要查询的性能。我找到了这个查询： SELECT RELNAME TABLE_NAME, CASE WHEN RELTUPLES < 0 THEN ((2^32) * RELREFS) + ((2^32) + RELTUPLES ) ELSE ((2^32) * RELREFS) +

浏览 1提问于2014-10-21得票数 1

3回答

使用在应用程序中获取列表和导出计数的过程与单独的计数存储过程相比是否要昂贵得多？

sql-server-2008、performance

我想知道，在处理性能方面，返回计数是否比返回数据集要昂贵得多？我假设向应用程序逻辑的传输会增加带宽。基本上，我试图确定是否更值得我花时间创建单独的过程来获取计数，或者仅仅利用返回数据集的过程，并计算应用程序逻辑中的数据集中有多少行。

浏览 0提问于2011-11-02得票数 4

3回答

COUNT()和COUNT() OVER()之间有什么区别？

sql-server、t-sql、window-functions

以以下代码为例： SELECT MaritalStatus, COUNT(*) AS CountResult COUNT(*) OVER() AS CountOverResult FROM (schema).(table) GROUP BY Marital Status COUNT(*)返回忽略空的所有行，对吗？ COUNT(*) OVER()是做什么的？这个问题是在一次实习考试中提出的，所以我没有数据可查询。我一直在使用冒险作品和这个网站的http://www.sqlishard.com/Exercise实践。如果我输入一个查询，如

浏览 0提问于2013-08-24得票数 18

回答已采纳

1回答

R错误消息:变量的无效类型(列表)

r、debugging

基本上，我已经用我的数据集进行了线性回归，现在我还必须添加一个新的数据集，这样我就可以添加一个额外的变量。我想回答另一个我的研究假设。我认为我没有正确地添加数据集，因为这是我得到的错误代码:model.frame.default中的错误(公式= mh_w3 ~ malaise_50 + CW3_FRTVEGSP +：变量malaise_50的无效类型(列表)) 这是使用的代码: malaise_50<- read.csv(file.choose()) malaise_50<- unlist(malaise_50) malaise_50<-na.omit(malaise_50)

浏览 0提问于2022-05-05得票数 0

1回答

用torchvision.transforms实现火炬手的数据增强

pytorch、data-augmentation

我发现在PyTorch中可以使用torchvision.transforms进行数据增强。我还读到，每个时代都有转换。因此，我想知道，多次复制每个样本，然后对其应用随机转换的效果是否等同于对原始数据集(唯一图像)使用torchvision.transforms，并将其训练更长时间(更多的时代)。提前谢谢。

浏览 1提问于2019-03-03得票数 0

1回答

如果在vs中的项目属性下设置com-interop，则无法注册用于db迁移的.Net程序集。

c#、dll、entity-framework-core、nuget-package、com-interop

我想在Visual中创建一个C# .Net dll作为企业架构师的外接程序.这个dll必须注册为com-interop才能被Enterprise使用. 在这个dll中，我还想使用代码优先和nuget包microsoft.entityframework.core进行数据库迁移。如果未选中项目属性生成中的com-interop复选框，则此数据库迁移可以在visual studio中的paket管理器控制台中正常工作。如果检查过，我的dll无法编译。错误信息是：程序集“.dll”不能注册。程序集“DisposeAsync，Version3.1.8.”中"Microsoft.EntityFr

浏览 2提问于2020-09-10得票数 0

1回答

在运行脚本之前等待加载google sheets数据

google-apps-script

我有多个用户谁提交每日进度信息通过谷歌表单在不同的工作地点。所有数据都被转储到单个工作表->中，称为主表我已经创建了单独的工作表，这些工作表使用query函数过滤与每个站点->相关的数据，称之为单站点工作表每个月，我都有一个谷歌应用程序脚本，为每个站点的回复创建一个按月的pdf摘要。这已经很好地工作了一段时间，但是最近，脚本运行并创建了一个没有任何数据的pdf。当我尝试解决这个问题时，我想我看到了问题所在。现在主工作表已经收集了超过1000行数据，每个站点工作表的查询功能需要几秒钟才能加载。在加载期间，脚本在单个站点中运行时没有任何数据。有没有办法确保在应用程序脚本在该

浏览 12提问于2019-06-12得票数 0

1回答

在从一台服务器导出并导入到另一台服务器之后，我看到了表数据中的inconsisntecies，这是为什么？

mysql、restore、mariadb、import、export

我对导入/导出数据库的过程非常陌生。我使用Maria和HeidiSQL来运行查询等等。我从我们的dev服务器导出了整个数据库，并将其加载到我们的活动服务器中。剧本写得很顺利。没有错误，一切似乎都按计划进行。但是，当我打开两个HeidiSQL实例并并排比较表的细节时，会发现一些奇怪的差异。例如，在某些情况下，新迁移版本上的表表示它们比从数据库导出的数据更多。这怎麽可能？HeidiSQL只是“估计”行的数量吗？例如，根据HeidiSQL，开发服务器上的表1包含177个数据行，总大小为64.0 KiB。其中，与活动数据库上相同的表1一样，包含219行数据，总大小为64.0 KiB。更奇

浏览 0提问于2016-06-08得票数 1

回答已采纳

3回答

MYSQL -返回的行数与连接的数目？

mysql

我的查询是被发送到数据库一次，然后在一个镜头中得到所有结果的列表，然后循环通过，还是每次都必须从DB请求下一行？实际上，减少预期返回的行数是否意味着对DB的连接/调用减少，这意味着我的DB能够同时处理更多的连接，还是数据库连接的数量不取决于返回的行数？

浏览 3提问于2015-05-25得票数 0

回答已采纳

1回答

添加列指定测试集和培训集是一个好做法吗？

r、training-data、test-data

我在一段时间前发现了一个教程，但无法再次找到它，它在训练集和测试集中都创建了一个额外的列，该列为训练集指定了true或false。我有密码，但找不到找到它的地方。 titanic.train$IsTrainingSet <- TRUE titanic.test$IsTrainingSet <- FALSE 这是好的做法还是不好的做法？我只是好奇，因为我喜欢在执行数据清理和操作之后，按照下面的方式分割数据是多么容易。 titanic.train <- titanic.full[titanic.full$IsTrainingSet == TRUE,] titanic.test &

浏览 2提问于2018-04-12得票数 0

回答已采纳

3回答

通过降低数据的准确性对大数据进行聚类？

r、clustering、bigdata

我有100万行，有20个属性要进行分层聚类。当我想用R中的dist()在这个数据上建立一个距离矩阵时，它说它需要5 TB内存。我有以下几种方法：通过抽样减少行数改变聚类方法？现在，你建议另一种方法吗？我有一个想法，我想如果我降低了值的准确性，然后做“分组”，那么我可以删除重复的行，并有一个新的列，每一行的重复计数。是否有任何R包可以对这些数据进行分层聚类？ "group by"：计数重复的行数，并添加一个列，说明此行在源中被复制了多少次。

浏览 0提问于2016-08-30得票数 2

3回答

Firebird JDBC驱动程序连接字符编码

java、jdbc、firebird、fedora

我有一个在Fedora17的tomcat6上运行的JSF应用程序，使用firebird作为数据库，所有从数据库到应用程序的注册都有一个编码问题。语言是巴西葡萄牙语，所以我需要é和ãs和ç，这里所有这些特殊的字符都有问题。来自原始源代码的é和ã是可以的，只有直接来自数据库的那些才会给我带来麻烦…… 知道这是怎么回事吗？这是一张图片，那个奇怪的角色应该在哪里当它从数据库中恢复时，问题就发生了。

浏览 0提问于2012-10-31得票数 11

回答已采纳

1回答

是否有一种方法可以将所有现有的表数据转换为UTF8排序规则？

mysql

我正在协助将数据库从MySQL 4升级到MySQL 5.5。我的客户的应用服务器也已经从JDK5升级到JDK7。应用程序运行时，在执行数据库操作时抛出了许多异常。我发现升级后的数据库在表排序和/或表列排序中混合使用了Latin1 generic、Latin1瑞典和UTF8 generic，因此大多数连接查询都会失败。有数百个表和数千个表字段，手动转换它们将是非常困难的。是否有更方便的方法将所有数据表和所有列转换为相同的排序规则？谢谢。 Edit:显示联接查询失败的SQLException消息示例： “操作‘=’的排序规则(latin1_general_ci，隐式)和(utf8_gene

浏览 3提问于2013-03-19得票数 2

回答已采纳

2回答

如何使用大型数据库构建本地环境

postgresql、mongodb、backup

我有两个存储器(PostgreSQL，MongoDB)，由于我需要在我的计算机上本地开发应用程序(理想情况下是离线)，我需要将这些存储器中的数据复制到我的硬盘上。无论如何，这些都是海量的数据库，大约有几百千兆字节的数据。我不需要所有的数据都存储在那里，只需要其中的一些样本就可以在本地启动我的应用程序。这两个存储都有一些功能强大的数据导出工具(pg_dump、mongodump、mongoexport等)。但我不知道如何轻松有效地导出小样本数据。即使我使用所有表/集合的列表并构建一些白名单，这将定义应该限制行数的表，但在触发器、函数、索引等方面也会出现问题。

浏览 1提问于2011-10-07得票数 3

1回答

如何在企业信息系统中体现语义web的效益？

semantic-web

我正在开发一个基于语义网络的信息系统演示，它只是使用SPARQL而不是传统的SQL来操纵数据集。应用程序如何展示语义Web的好处。我采取了以下步骤：客户端从web获取参数。请求web服务。服务根据给定的参数生成SPARQL命令。该服务使用Jena/SDB执行SPARQL command.Retrieves，或将数据从MySQL.Parsing返回的结果集保存到。向客户端响应JSON对象。客户机使用Javascript + html显示数据。目前，应用程序只有CRUD操作。传统IS只有一个不同之处，那就是使用SPARQL而不是SQL。似乎看不出明显的语义特征。我只想说两点：演示通过SPA

浏览 3提问于2011-08-03得票数 2

1回答

“牛郎星”中合唱团的叠加状态轮廓

python-3.x、vega、altair、vega-lite

我无法在牛尾的县级合唱团上覆盖州的轮廓。我正在使用牛郎星的图层方法来实现这一点。但是，它采用的是州大纲图的笔画颜色，并用该颜色绘制县轮廓。这是我的密码： import altair as alt from vega_datasets import data us_states = alt.topo_feature(data.us_10m.url, 'states') us_counties = alt.topo_feature(data.us_10m.url, 'counties') unemp_data = data.unemployment(sep=

浏览 3提问于2019-12-07得票数 2

回答已采纳

2回答

核心数据-数据源方法在viewDidLoad之前调用

iphone、objective-c、cocoa-touch、core-data

我注意到我的应用程序中出现了一个问题，因为在viewDidLoad之前调用了UITableView的数据源方法。问题是UITableView没有正确的行数，它从NSFetchedResultsController获取行数，但是在viewDidLoad方法中调用了performFetch“函数”，由于某种原因，该方法在Datasource方法之后调用。下面是两个重要方法的来源： - (void)viewDidLoad { [super viewDidLoad]; self.tableView.allowsSelectionDuringEditing = NO; self.tab

浏览 3提问于2010-08-14得票数 4

回答已采纳

1回答

添加新的GCP对象检测数据集

google-cloud-platform、object-detection、google-vision

我在Google (对象检测)上生成了一个模型，我想知道我是否能够随着时间的推移添加新的数据集，而不必重新处理已经建模的数据集。我以谷歌为例：我有一组玫瑰郁金香. 我已经用花创造了一个模特儿我想添加一个只有向日葵的新数据集，而不删除以前花的模型。我怎么添加向日葵？

浏览 2提问于2021-04-27得票数 0

1回答

RedGate SQL比较SDK授权问题

redgate、sqlcompare、installshield-2014

首先，很抱歉，我不得不写这个冗长的问题，但为了更好地解释我的问题，有必要写这些东西。我们有一个安装程序来安装我们的应用程序。我想通过安装程序升级数据库。因此，我创建了最新结构数据库的快照，并将其放在应用程序的包中。我使用了RedGate来比较两个数据库的结构，然后将客户数据库与最新的快照(我提供的快照)同步。我正在使用自定义操作类库项目来编写方法，这些方法将被称为安装程序本身。我购买了RedGate许可证密钥，RedGate工具也安装在一台机器上。在同一台机器上，我有安装屏蔽许可证，所以我只在那台机器上编写自定义操作代码。我们需要将'licenses.licx‘文件添加到我们使

浏览 4提问于2015-07-31得票数 2

2回答

在Azure数据工厂的数据流中传递数据映射活动中的数据集参数

azure-data-factory

我有一个参数化的数据集，我将它用于复制数据活动，它工作得很好。我正在尝试使用映射数据流来复制它，但是我找不到在哪里输入dataset参数的值……

浏览 0提问于2020-06-05得票数 0

1回答

使用同一行中的数据时的MySql更新

php、mysql

我需要使用php更新一个列c，但是在update语句中使用相同的行数据是错误的吗？这是因为用户可以更新他的first或second名称，而我不能收费。这样做会不会有问题呢？这会因为某种原因而失败吗？在任何时候，c会在a之前更新吗？ "update names set a = 'Jim', c = concat(a,' ',b); 首先更新a，然后使用a更新c。安全吗？ "id" "a" "b" "c" "1" "Jim"

浏览 3提问于2014-01-25得票数 0

1回答

用于RDD对象的pyspark中的方法

python、numpy、apache-spark、pyspark

我是个皮斯喀特的初学者。我正在使用它，因为我必须在大数据上运行我的算法，并得到实时的结果。因此，我从python numpy数组中创建了一个RDD对象，例如， from pyspark import SparkContext , SparkConf sc = SparkContext.getOrCreate() X = sc.parallelize(X) 现在，如果我使用numpy say shape的方法，就会得到错误，然后通过显示"'RDD‘对象没有属性’‘来显示错误信息。在numpy数组中还有其他方法，我不能在这里应用。因此，我认为在RDD中应该有类似于numpy数组

浏览 0提问于2020-09-21得票数 0

3回答

如何在cURL中设置记录长度？

dataset、file-transfer、mainframe、ftps

我想要将测试文件传输到mainframe，但测试文件的行数超过80个字符，这是FTP的默认设置。因为创建的数据集的记录长度为80，所以我得到 451-File transfer failed. File contains records that are longer than the LRECL of the new file. 错误。我试过了； curl --ftp-ssl -k -v -B -T BBBBB -u USERNAME:PASS ftp://HOST_NAME:PORT/'DATASET_NAME(BBBBB)' 为了解决这个问题，我添加了-Q "si

浏览 4提问于2013-04-22得票数 1

回答已采纳

1回答

只有1行的数据栅格

asp.net、.net

我有一个只有1行数据的DataGrid。它当前使用数据显示第一行，然后显示4行空行。我没有看到像最大行数这样的属性。如何将DataGrid限制为一行？

浏览 5提问于2013-04-26得票数 0

回答已采纳

3回答

如何将数据绑定到桌面应用程序，就像基于web的应用程序一样

c#、.net

我有一个表单，我在“表单加载”事件中对我的datagridview进行数据绑定，问题是，表单需要一点时间(或者很大程度上取决于信息的大小)来加载，因为我的数据有很多二进制信息(照片)要绑定在那里。在一些网站上，我们可以看到一张图片，上面写着“正在加载”，这很酷，对用户也很好，因为我知道这是在加载，而不是停止。所以，当我对表进行数据绑定时，我想要模拟桌面应用程序，你能帮我吗？

浏览 2提问于2008-11-17得票数 1

回答已采纳

1回答

(JasperReports)将来自不同数据源的数据合并为同一报表行的列

jasper-reports

我正在评估JasperReports (CE)作为我的客户的报告解决方案。至于现在，我非常喜欢它，它看起来像一个相当坚实的平台。有一件事我找不到信息，那就是有可能将子查询的结果合并到一个报表中的不同数据源(不是作为向下钻取的子报表，而是作为同一行的不同列)。例如:一个数据库(Firebird)中有一些产品信息，但是销售信息、实际库存和购买价格存储在不同的系统中，该系统使用不同的数据库(Microsoft的SQL Server )。在两个数据库中，产品都是用相同的产品唯一代码表示的。因此，我需要查询第一个数据库以获得用于实现某些报表列的“主记录集”，然后查询每个产品以获得其他信息，该信息存储

浏览 0提问于2013-10-24得票数 3

1回答

PowerBI分页报告和SSAS，我们能避免数据集吗？

powerbi、ssas、ssas-tabular、powerbi-paginated-reports

我们有一个用户友好的前端，提供嵌入PowerBI和来自分析服务的表格立方体，以支持与数据的超高速交互。这是完美无缺的。 PowerBI嵌入具有许多限制，例如自定义表达式和格式化表/矩阵可视化的限制，因此我们希望通过PowerBI分页报告为一些用户提供强大的用户功能。然而，我们遇到了一个惊喜。在PowerBI分页报告中，我们将数据源连接添加到分析服务中，然后很好地加载模型。我们可以选择所有字段，但不知何故，我们需要创建一个数据集；最初，我们希望这是一个完整模型的虚拟模式，但实际上它从多维数据集中检索整个数据。数以百万计的行，你可以想象这种结构的可用性. 是否有一种方法可以简单地使用PowerB

浏览 4提问于2022-03-16得票数 0

回答已采纳

2回答

用于仪表板后端的BigQuery与Cloud

google-bigquery、google-cloud-sql

我有点搞不懂比云SQL用例。我没有多少BQ中的Gbs行数据，需要在这些数据上构建web仪表板(SQL与多个表的联接)。从BQ查询数据是否有很大的缺点(例如延迟或并发)，我应该将数据转移到Cloud (PSQL)并进行查询吗？数据不是实时的。我预计最多有几百个并发请求。因此，查询速度和可靠性是主要目标。谢谢!

浏览 8提问于2020-08-23得票数 18

回答已采纳

1回答

NestJs体系结构问题:将供应商http请求与用户驱动的http请求分离

architecture、nestjs

TLDR:我想确保供应商的请求没有阻塞应该用于面向用户的请求的way服务器进程，并且想知道最好的方法。详细信息:我正在构建一个票务应用程序，它从几个不同的第三方票务提要中聚合数据，并在我们的网站上向最终用户显示这些数据。这些第三方提要相当大，更改频繁，响应非常慢，需要经过一些后端处理才能将相关数据显示给最终用户。因此，我们并不是直接按每个用户请求的提要，而是不断地运行数据同步作业，这些作业从提要中获取数据，并试图使本地数据库与它们保持同步。这些提要通过http进行通信，需要大量请求(每小时100k+)。同时，我们有一个面向用户的应用程序，每天接收大约100 k的请求。我希望架构这个应用程

浏览 3提问于2021-08-10得票数 0

回答已采纳

1回答

有没有办法对Azure数据工厂中的数据进行分区以填充文件，直到达到最大行数？

java、azure、apache-spark、azure-data-factory

我尝试将数据分成组，将数据写入csv文件，优先达到每个文件的最大行数，而不是将行均匀分布在多个文件中。例如，如果我有5001条记录，每个文件的最大行大小是1000，我想要6个分区，其中5个有1000个文件，第6个文件有1条记录。这在Azure中是可能的吗？我已经尝试在我的Java代码中手动完成，但似乎手动分区来自azure的查询数据是不确定的，并且会出现文件之间的重复。

浏览 0提问于2021-08-03得票数 0

3回答

在C#中模拟本地文件访问的用户

c#、impersonation

我试图解决的情况是这样的:我正在编写一个多用户都可以访问的应用程序。根据文件夹的Windows权限限制访问-如果需要，将授予用户对包含应用程序的文件夹的访问权限。不管是好是坏，应用程序将其数据存储在与应用程序相同的网络上的文件中。我不希望用户能够直接编辑数据，因此我计划限制对数据文件的访问。我一直在尝试使用的方法是让一个对数据具有读/写访问权限的“服务用户”，并在应用程序中使用模拟来“登录”为服务用户，执行所需的读/写操作，然后返回给原始用户。我在这方面做了几次不同的尝试，但都没有成功。也许最简单/最有希望的是基于Mark Johnson的答案：我的用法如下：

浏览 0提问于2013-11-20得票数 3

回答已采纳

3回答

Sql Server聚合连接CLR根据记录数返回不同的字符串序列

sql-server、clr

我有一个类似于的clr聚合连接函数。当行数较小时，连接字符串的序列紧跟在输入数据集之后。当行数更大(几十或更多)时，序列似乎是不确定的。执行计划有所不同，但我对优化器和要应用的提示不是很熟悉(我已经尝试过MAXDOP 1，但没有成功)。与下面的结果相似的测试不同，下面是计划的不同之处--分别排序，然后合并连接。在这里倾倒的行数是60。产生预期结果：产生了意外的结果：下面的查询演示了使用上述clr (已重命名为TestConcatenate)的AdventureWorks2014示例数据库中的问题。预期的结果是一个数据集，其中行对应于每个订单，列包含该订单的产品的分隔列表(按数

浏览 1提问于2016-01-24得票数 0

1回答

加性高斯噪声对脑电信号分类影响的研究--增广数据与原始数据的关系分析

deep-learning、time-series、data-augmentation、gaussian、noise

定义:我对脑电信号分类进行了研究，重点是利用原始脑电信号区分两个不同类别的脑电信号。数据的可获得性在脑电领域提出了一个重大的挑战，这就需要实施数据增强技术。在我的例子中，我将零均值和可变标准差的加性高斯噪声(σ∈{0.1,0.01,0.001})应用于原始脑电信号进行数据增强。此外，我还考虑了加性噪声的放大系数(m∈{1,2,3})。通过使用m和σ的不同组合来增强我的训练数据，我观察到在大多数情况下，测试集的准确性有所提高。问题:以训练数据为X_train，增强数据为X_train_aug，测试数据为X_test，我想确定(X_train，X_test)与(X_train_aug，X_tes

浏览 0提问于2023-06-03得票数 0

1回答

如何基于布尔条件改变属性

python、altair

我试图根据它的名字是否存在于列表中来改变点的大小，我尝试过许多不同的方法，但是我一直在产生这个错误。代码： graph = alt.Chart(df).mark_point( filled = False).encode( x=alt.X(axe_x), y=alt.Y(axe_y), size=alt.condition( (alt.datum.name) in (some_list), alt.value(150), alt.value(50)) )

浏览 5提问于2022-11-16得票数 1

回答已采纳

2回答

是否有等同于UniQuery SAMPLE关键字的UniData SQL？

sql、unidata

我使用的是SQL6。有没有等同于UniQuery示例关键字的UniData UniData？使用UniQuery，我总是能够做到： SELECT CUST BY NAME SAMPLE 1 它会为我提供按字母顺序排列的记录。在UniData SQL中，我希望能够执行以下操作： SELECT NAME FROM CUST ORDER BY NAME SAMPLE 1; 就像在其他...or数据库中一样... SELECT TOP 1 NAME FROM CUST ORDER BY NAME; 并且只获取按字母顺序列出的客户的姓名。有这样的关键词吗？

浏览 5提问于2011-09-01得票数 1

回答已采纳

1回答

使用transform_lookup处理牵牛星的花纹

python、altair

在我的生活中，我不知道如何使用transform_lookup方法来处理牛郎星中的合唱人物。我给出了一个例子。我只是试着根据州首府的纬度给各州上色。这是我的代码。 import pandas as pd import altair as alt from vega_datasets import data states = alt.topo_feature(data.us_10m.url, feature='states') state_abbr = pd.read_csv('https://worldpopulationreview.com/static/stat

浏览 1提问于2021-04-01得票数 1