大数据的存储与管理_数据存储管理大促_数据存储与管理 - 腾讯云开发者社区

、、

我正在为一些项目评估Kentico，需求如下：“我们在Kentico中有文件管理系统吗?如果有，如何集成？” 还需要在文件管理上传的文件上有大的权限。当我需要将它集成到我的ASP.MVC项目中时，请告诉我

浏览 29提问于2019-02-27得票数 0

2回答

为什么在从HFS+复制到Ext4时存在大小差异？

、、

我正在将一堆文件从HFS+卷复制到我的Ext4 Ubuntu文件系统。都是电影文件。当我复制一个，它几乎总是得到4K大。复制的文件比原始文件大4,096字节。我假设这是因为某些元数据正在被添加，但它到底是什么呢？另外，在600个文件中，有两个文件的大小没有增长。他们完全一样。为什么会这样？

浏览 0提问于2011-05-18得票数 3

回答已采纳

2回答

用于大数据的SQL？-Android

、、、

我需要一个大的数据库来存储，我想用SQL来做，我知道它的一些缺点，我不希望我的数据被用户清除。我不想完成我的项目，并后悔以后使用SQL，如果有任何建议在这种情况下，我会真的很感激。

浏览 2提问于2017-04-08得票数 0

回答已采纳

1回答

我想在我的游戏中添加多人游戏( XNA C#中的2D平台)我的世界相当大(最多3000万块，平均2000万块)。(2000×10000)。你可以说这个游戏很像Terraria。我一直在使用Player.IO，它有我可能需要的所有东西，除了我将很容易地耗尽如此大的世界的带宽。因此，我一直在尝试Lidgren网络图书馆，这是可以的，但不用为用户转发也不错，但我的世界和泰拉里亚仍然可以逃脱。所以如果我有服务器端代码(Lidgren)。现在我只需要唯一的用户名，可能还需要一个数据库(就像player.io有PlayerObjects一样)，创建服务器列表的方法也会更好。几乎像“我的世界”这样的

浏览 0提问于2012-07-31得票数 1

回答已采纳

1回答

在Google上存储备份(免费/低成本如何存储?)

、

我已经使用了一个不同的第三方服务器提供商多年来，我的备份每晚完成，网站是压缩和张贴到AWS桶。我最近搬到了Google，我看到我每天晚上的客流量都是从屋顶上冒出来的，而且要花一大笔钱。所以现在我需要一个新的解决方案，人们是如何在Google上备份服务器的？

浏览 0提问于2020-10-26得票数 1

回答已采纳

2回答

多个iSCSI目标还是共享的1？

、、、

在我的网络中，我有几种类型的文件想要保存在SAN上，比如： SQL db和日志交换数据随机文件现在，我想知道是否应该创建一个大容量的iSCSI目标，并从其中一个服务器启动它。(并共享它，以便其他服务器也可以使用它) 或者我应该创建单独的目标，让每个服务器使用自己的存储空间。对于记录，存储可以分离，因为服务器没有使用共享数据。因为一个原因，我认为一个存储是容易的备份。(但也许性能会有问题吗？) 对于这些类型的数据，什么是明智的配置？

浏览 0提问于2012-06-15得票数 3

回答已采纳

1回答

在asp.net用户之间共享大型字节数组

、、

我的ASP.Net应用程序中有相当大的原始字节数据数组(1MB* 100)。它们需要非常频繁地向多个用户广播。线程在后台处理数据，并不时地更新它们。你能给我一些建议吗?在他们之间共享缓冲区的最佳选择？

浏览 5提问于2014-03-26得票数 0

3回答

我应该选择什么备份方法来备份高负载服务器上的数据库？

、、

我有一个mysql (MyISAM)数据库，大小约为30。它有单一的大桌子(和一些小的，但它没有区别)。它执行大约2000次选择(按主键排列的单行)/second、300个更新/秒和50个插入/秒。我们有大约10个独立的服务器与类似的数据库。我想备份数据库(增量首选)，而不让它离线，如何做到这一点？

浏览 0提问于2012-03-19得票数 3

回答已采纳

4回答

如何查询Azure数据湖？

、

来自数据库世界，当我们有与数据相关的东西时，我们使用ui工具来查询数据。不管是大还是小。有没有类似SSMS、SQL WorkBench (用于大数据红移)、雅典娜(查询大数据S3)的Azure数据湖？我看到只是查询数据并将其存储在文件中。是否有通过UI工具或WebBased工具查询Azure数据湖上的数据？

浏览 6提问于2017-11-17得票数 9

回答已采纳

1回答

MSSQL通过数据库选项？

、

是否存在创建MSSQL数据库的选项，该数据库是一种类型的传递？为了给出我们所处的场景，我们有一个中央大型数据库，它是一个生产的副本，用于几个不同的团队进行开发。我希望创建一个本地数据库，该数据库链接到开发服务器，在该数据库中，我可以将更新的procs版本保存到它们准备好进入共享服务器之前。我知道我必须完全限定任何表查询等等，但是我想知道我是否可以设置一些东西，这样如果一个proc在本地不存在，它就会通过开发服务器在那里执行proc？这样，我就可以将开发代码指向本地DB实例，并在本地执行我所拥有的、远程没有的内容，并且不必复制/克隆每天从prod快照刷新的非常大的数据库。

浏览 0提问于2020-01-07得票数 0

2回答

存储过程选择VS从外部连接中选择

、、、

我试图找出使用存储过程代替来自外部连接的SQL查询的利弊，但我无法找到任何直接的比较。使用存储过程而不是来自外部连接的SQL查询有什么好处？对于小容量和大容量的输出，它们之间是否有执行速度的差异？数据库管理也有什么好处吗？

浏览 8提问于2021-12-29得票数 -2

2回答

测试装置是否应该添加到代码存储库中？

、

我正在对一些处理外部API数据的代码进行单元测试。该外部API提供大量JSON数据。当然，这里正确的做法是在单元测试中使用补丁，这样我就不会每次运行测试时都执行真正的API调用。这些装置可以是相当大的，甚至数千条线。我不确定我是否应该把它们放进吉特。这似乎是个坏主意，因为它们看起来像静态文件。另一方面，编写单元测试确实需要特定的安装，所以我确实希望与项目工作人员共享它们(并与我们的构建机器共享)。大型固定装置是否应该投入回购？

浏览 0提问于2013-12-12得票数 6

回答已采纳

2回答

在C#中执行大型SQL查询的最整洁方法

、

我有一个大约50行长的SQL查询。我想知道什么是执行此操作的最可维护和最易读的方法，因为它看起来相当大。到目前为止，我想出了以下几种选择：在数据库中创建存储过程 SQL查询是内联的，在方法中。将查询存储为项目中的SQL文件，并在需要时加载(我也不确定是否应该在其中编译这些查询)。

浏览 0提问于2016-12-20得票数 3

回答已采纳

1回答

App Engine数据存储区- devserver限制

、

我正在尝试测试Google App Engine Datastore数据库的效率。我想知道它在大型数据集上的查询速度有多快。我所说的“大”，指的是同类型的500-1000万个实体。 devserver只允许我输入1000个相同类型的实体。有没有办法提高这个限制？谢谢

浏览 0提问于2010-03-01得票数 2

回答已采纳

1回答

CAS修改(共享数据)

我想修改CAS 3.5，以便在身份验证正确后立即在会话中存储一些数据。(不确定这是否是正确的方法) 我的CAS服务器链接到Kerberos服务器，Kerberos服务器连接到我的Active Directory。当身份验证成功完成时，我希望从AD检索数据。然后将此数据存储在会话属性中，以便在控制器中轻松使用。有人知道在这个非常大的CAS服务器项目中该在哪里做事情吗？谢谢,

浏览 1提问于2013-05-13得票数 0

3回答

如何在PHP中计算时间戳？

、、

有一段时间，我一直在使用一个原始的MySQL NOW()函数在我的MySQL数据库中记录时间/日期，直到我意识到主机的时区变量比太平洋标准时间早三个小时。我已经用DATE_SUB(NOW(), INTERVAL 3 HOUR)修复了这个问题，但是现在我有了一大堆提前三个小时的时间戳，以及显示正确时间的所有未来的时间戳。有没有一个PHP函数可以评估我在修复之前记录的时间戳，这样当它们显示在我的管理实用程序中时，我就可以对它们进行偏移？例如： if($timestamp < 2012-02-16 21:57:18) { $timestamp - 3 hours; }

浏览 0提问于2012-02-19得票数 0

回答已采纳

2回答

如何测试Azure存储生命周期？

我目前正在使用Azure气泡。我希望Azure自动删除一些旧的数据，这些数据比X的天数还要大，前缀为wildcard.Such 我的容器/*/xxx.mp4 我只看到这个文档

浏览 2提问于2021-01-25得票数 1

回答已采纳

1回答

如何备份和恢复AWS中的Cassandra节点？

、、、、

我们有两个要备份的m3大型实例。怎么做呢？数据在SSD驱动器中。nodetool快照将导致将数据写回相同的SSD驱动器。应遵循的正确程序是什么？

浏览 2提问于2016-04-13得票数 2

1回答

MySQL‘复制到tmp表’同时扩展VARCHAR

、、

一位用户今天打电话来，是因为他试图将一个稍微大的表中的VARCHAR列(从20列扩大到100列)，从而形成一个写锁的表。我看着PROCESSLIST，看到ALTER TABLE的句子在“复制到tmp表”状态下被锁了5分钟。我想知道为什么MySQL需要将表复制到tmp表来放大VARCHAR。我的意思是，难道不认为VARCHAR的好处之一是，每一行只使用此列所需的字节，而不是使用所有可用字节的CHAR？来自http://dev.mysql.com/doc/refman/5.1/en/char.html： VARCHAR值存储为1字节或2字节长度前缀加数据.长度前缀表示值中的字节数。我理

浏览 0提问于2014-06-10得票数 0

1回答

如何在windows 2008 server中备份firebird数据库？

、、、

你好，我正在为我的应用程序使用firebird数据库。在注意到的同时，我发现数据库在不断增加，即使数据库包含的数据量很少，数据文件也非常大。我找到的解决方案是备份和恢复，但问题是我不知道我的sysdba密码，我也尝试使用其他用户，但它显示访问被拒绝。请提出一些富有成效的解决方案。

浏览 4提问于2014-10-20得票数 3

1回答

构建gwas阵列数据库

、、

我有超过20K个样本的gwas微阵列实验数据结果。每个样本具有大约1.000.000个标记的数值输出值。所以我有一个20000 x 1000000的理论表。最终目标是创建一个web服务，以便显示少量样本的输出值。我有几十个变量来构建查询。我的问题是如何以一种有效的方式创建这种数据库。对于这么大的数据量，MySQL是最好的选择，还是只依赖于服务器硬件？提前谢谢。

浏览 0提问于2018-02-05得票数 0

2回答

源数据和目标数据巨大时的ssis查找转换

我正在用源数据更新目标表。源文件是excel，目标文件是sql server表。在源文件中，我确实有一个特定的项目相关数据，而在目标表中，我确实有几个项目。数据在每个项目中包含数百万行。所以源和目标的大小是非常大的。我正在使用查找转换来比较数据并进行相应的更新。问题是，由于目标表的大小非常大，将整个数据加载到查找缓存中需要花费很多时间。那么有没有办法只加载源文件的项目数据，比如(select * from table where projectid=sourcetable.projectid) 请指教谢谢

浏览 2提问于2018-08-03得票数 0

1回答

Azure MSSQL缓慢摄入

、、、、

我试图在一个有6个Vcore的弹性池数据库中摄取900万行数据。使用python (pyodbc)摄取数据。由于数据很大，所以我会以块的形式摄取数据。吃了第九大块之后，我就会有奇怪的行为。进程消失，一个小时后随机出现。有什么解决办法吗？

浏览 2提问于2022-08-09得票数 0

2回答

亚马逊网络服务数据库结构- MySQL和DynamoDB

、、、

我希望为我的转换数据运行一个DynamoDB数据库，为需要SQL Join查询的数据运行一个mysql数据库。为了尽量将大容量/大型表排除在MySQL之外(保持更好的性能)，我将把一些数据移到DynamoDB中，这些数据有时需要在MySQL中引用数据。在DynamoDB中查询某些数据并查询MySQL，然后在PHP语言(或另一种服务器端语言)中执行最终的数据比较，从而将所需的数据返回给客户端/浏览器，这是不是很糟糕的编程/查询？我猜最基本的问题是:必须查询NoSQL和SQL数据库，然后用php (或服务器端语言)查询结果……这是正常的还是不好的主意？ thx 注意:这样做的主要目的是进行数

浏览 4提问于2012-12-21得票数 0

回答已采纳

2回答

LINQ to SQL更新

、、

有人知道如何用LINQ运行下面的语句吗？ UPDATE FileEntity SET DateDeleted = GETDATE() WHERE ID IN (1,2,3) 我对LINQ既爱又恨，但到目前为止，几乎没有什么不好的地方。我想要避免的明显的解决方案是枚举所有文件实体并手动设置它们。 foreach (var file in db.FileEntities.Where(x => ids.Contains(x.ID))) { file.DateDeleted = DateTime.Now; } db.SubmitChanges(); 上面的代码存在问题，除了相当大的开销之

浏览 2提问于2009-05-23得票数 0

回答已采纳

1回答

在数据流gcp上使用org.apache.hadoop.hbase.client Vs com.google.cloud.bigtable.data.v2有什么区别？

、、、、

稳定性或长期支持可能有不同的表现。我的意思是，需要将hbase迁移到大表连接器apache梁上。

浏览 7提问于2022-10-18得票数 1

2回答

nuodb如何管理存储大小的增加

、

假设我的数据存储将增加大小，如果数据增加，存储管理器将如何管理数据。存储管理器是否将数据拆分到不同的域机器上(肯定不是这样)？这个过程到底是如何工作的？这方面的建议是什么，键值存储？

浏览 2提问于2013-01-19得票数 1

回答已采纳

4回答

在何处保存设置的简单建议

、、、、

我是编程C# WinForm应用程序，其中有大的SQL Server数据库。我需要做个布景。我不知道如何保存应用程序设置。添加我的解决方案.setting文件和保存在数据库表中哪个更好？

浏览 10提问于2011-03-04得票数 2

回答已采纳

1回答

如何将大型nt/rdf转储加载到Jena/PostgreSQL模型(TDB/RDB?)

、、、、

我在我的项目中使用了DBpedia。到目前为止，我一直在使用SPARQL客户端，但是性能远远不能接受(更不用说端点频繁的停机时间了)。因此，我想将上可用的大NT文件加载到本地数据库管理系统(我有一台安装了PostgreSQL的服务器)。在我的应用程序(基于Java和Groovy构建)中，我使用以下命令打开了一个与Jena持久化图的连接： def jenaConnection = new DBConnection( ... ) def maker = ModelFactory.createModelRDBMaker( jenaConnection ) def globalModel = ma

浏览 0提问于2011-05-21得票数 2

回答已采纳

2回答

如何保护AWS的密钥值

、、、

我的android应用程序可以在AWS S3上运行。我正在做这种无服务器架构，这意味着我的应用程序包含了访问AWS S3资源所需的所有信息，包括访问密钥和密钥。显然，这会导致安全问题，而且对于保护String格式的数据，Proguard没有那么大的帮助。如果你能为此分享你的智慧，那就太好了。我相信有一些通用的方法来解决这个问题，因为我一定不是唯一一个使用无服务器架构的人。

浏览 29提问于2018-07-29得票数 1

回答已采纳

5回答

大文件的版本控制

、、

我们很高兴在工作中使用SVN for SCM。目前，我将我们的二进制资产放在与我们的代码相同的SVN存储库中。SVN支持非常大的文件(它以“流”方式传输这些文件，以保持内存使用正常)，但它是SLOOWWWWW。对于价值约为1 GB (并且还在不断增长)的资产，您推荐哪种资产管理软件？我们更喜欢分支和合并(不同的资产和配置文件分配给不同的客户)。

浏览 0提问于2008-11-08得票数 13

1回答

在WordPress安装临时中存储大型数据集

、

我的WordPress插件依赖于一个大的数据集(大约一兆字节)。数据集通过REST下载，然后解码到PHP数组中。现在，数据集将在每个页面加载上下载，然后用于计算等。这将使页面加载时间在1分钟左右。但是，没有必要在每个页面加载上下载数据--它不会经常更新。我的想法是存储数据，每天或每周只收到一份新的数据副本。我在类似的情况下使用过瞬变，但瞬变有172个字符限制。每天(或每周)第一页加载时间较长才能收到数据的新副本，这并不是一个问题。我只是不知道WordPress-存储大数据集的方式，当瞬态不是一种选择。我的问题是:什么是WordPress-存储数据的临时方式？

浏览 0提问于2022-12-09得票数 1

回答已采纳

2回答

是否有Adobe应用程序的框架？

、、

我想在我的应用程序中使用Adobe和SQLite (本地数据库)。我的应用程序有点大，所以我想为此使用一些框架。是Adobe应用程序的任何框架? 应用程序不使用服务器站点代码，只对客户端站点进行处理，并在本地机器上使用SQLite数据库。或任何其他最适合大空气应用程序开发的方式

浏览 4提问于2011-05-12得票数 0

回答已采纳

1回答

学习/教学存储过程数据库

、、

什么是最好的数据库开始学习存储过程。考虑到每个数据库都有自己的语法。就像Postgresql有函数，SyBase，Oracle，MS SQL，DB2有一些复杂的过程。是否有一些数据库，你认为是一个好的使用，比方说，学生演示的原则，知道哪一个，学生可以跳到一些特定的数据库，没有大的问题？处于流行星展集中间的东西。

浏览 2提问于2013-02-16得票数 0

1回答

Windows移动和存储位置

、、

在Windows桌面系统上，设置应该保存在AppData文件夹中，原因有很多，包括没有管理员的写访问，以及为不同用户设置不同设置的可能性。但是，Windows (.NET CF)应用程序推荐的方法是什么？据我所知，只有一个用户，所以这个论点不适用。在安装过程中，您还可以选择选择SD卡或设备，我猜您可能希望在您所选择的位置设置大多数文件？我的应用程序包含以下类型的文件： ~200KB/skin)Voices (用户可以添加自己的、~1MB/voice)Log文件(用户可以添加自己的、大小从小到大的文件，取决于日志记录级别) XML文件，在这里存储应用程序生成的实际数据和设置。上述哪一项应该

浏览 4提问于2009-07-14得票数 0

回答已采纳

1回答

在项目中维护大型资产的最佳实践是什么？

、

我们有一个项目，其中涉及一些非常大的(多gig)视频文件。在源代码管理中保持这一点会减慢一切，特别是在执行构建时。在我看来，源代码控制并不适合这些资产，因为它们更类似于数据库中的数据，而不是代码。尽管如此，它们仍然是IP，需要适当地维护。有没有人有管理这些资产的经验，可以提供我们需要的安全性，但又不会搞砸源代码控制/构建？

浏览 1提问于2015-03-05得票数 0

1回答

Data报表中大查询的SESSION_USER等效

、、

我们正在使用data为客户创建仪表板。每个客户端都应该根据他们的登录凭据在仪表板上看到他们的数据。在Big中创建一个authorized_view很简单，可以让某些用户看到底层共享表的某些行。但是，如何才能将其移动到可以与每个客户端共享的仪表板中，而只显示仪表板中的个人客户端，而不是报表创建者可以看到的数据？因此，假设我们有一个大表，其中有一堆列和一个列email，其中包含用户的电子邮件。现在，我们希望仪表板根据这个电子邮件列显示每个用户的指标。

浏览 0提问于2019-10-03得票数 0

回答已采纳

1回答

blobs的托管本地存储

、、

如今的普遍共识似乎是，你不会在你的关系数据库中存储二进制大对象，因为它并没有真正针对这类事情进行优化，而是将其放入专用的存储引擎中。有没有人可以为.Net平台提出一个解决方案，就像微软Azure Blob存储引擎那样，但只在组织本地使用？

浏览 2提问于2009-10-28得票数 0

回答已采纳

2回答

postgresql des加密

、、

我有oracle数据库要转移到新的postgresql服务器。有些表有sesitive字段，这些都是通过DBMS_OBFUSCATION_TOOLKIT.DESENCRYPT/DESDECRYPT.加密的问题就在这里。postgresql的加密数据大小(bytea类型)应该与oracle的相同。我试图用aes (加密/解密)来实现，它比原始数据大近三倍(oracle使用des算法需要16byte，postgresql使用aes需要33byte，原始数据是13byte)。我也尝试过postgresql加密，但手册中没有提到如何解密它，限制了8字节的原始数据大小。现在我真的需要加密方法，

浏览 2提问于2012-09-27得票数 0

回答已采纳

2回答

检索const数据的最佳方法

、、

我的游戏使用大的const数据，当所需的数据安全性非常重要时，需要检索它才能使用在每个级别上使用的数据。我脑子里有两个选择哪一个更好？注意，数据是const，在游戏期间它永远不会改变，只有我可以在编码时更改它，以便在某些级别上使用它，在构建之后，它总是相同的数据。 1:使用返回“数据” 这意味着存储在脚本中的数据和查找脚本将公开数据。 if(level_number < 10) { switch level_number case 1: return data_1; . . . } if(10<level_number <20) { . . . } 2:在二进制文件

浏览 0提问于2019-08-04得票数 0

5回答

我应该只在数据库中存储固定大小的数据元素吗？

如果存储在数据库的给定字段中的数据量是未知的，并且可能非常大，我是否应该将其存储在外部文件中，而不是存储在数据库的字段中？

浏览 0提问于2008-10-13得票数 0

回答已采纳

1回答

总是在大于数据库文件的日志文件上

、、、、

我们有SQL，并收到警告:事务日志文件比数据库文件要大。他们建议我从“始终打开”中删除数据库，将恢复模式更改为SIMPLE，然后收缩日志文件并将其重新打开。改变维修计划。日志备份每小时运行一次。但是，第二天，事务日志文件比数据库文件还要大。由于这是运行SharePoint 2013数据库，他们说，这可能是对迁移到2013年的SharePoint 2010数据库，但我有相同的行为在另一个总是在集群上，而不是SharePoint。我还尝试实现Ola Hallengren的维护脚本，并取得了同样的效果。在其他没有AO的机器上，没有这样的问题。所以，我不知道为什么会发生这种情况，这与一直以来都有

浏览 0提问于2017-04-27得票数 1

2回答

用于合并数据库脚本的工具

、、、、

大家好，我想知道有没有人用过这样的工具，它可以获取一系列.sql脚本和某种类型的清单文件，并根据清单中定义的顺序将它们合并成一个大的.sql文件？我正在尝试将数据库更改打包集成到我们的自动化构建中，我可以为此编写一个工具，但我认为它可能已经存在。如果有任何特定于此的解决方案，我们将使用Nant和CruiseControl.NET。谢谢。

浏览 0提问于2009-11-04得票数 0

回答已采纳

2回答

约定和检查文件是否存在与数据库存储

、、

我正在为一个门户构建数据库结构，并且我对我决定不会存储在数据库中的元素有一些疑问，通常是媒体，特别是图像。假设我们有内容，并且每个内容都可以有一个主图像。此外，还有一个幻灯片放映与特色内容，需要从内容的大图像。一个直观的想法是让DB不执行此任务，并使用命名约定存储图像。然后，在代码(php)中，我可以检查文件是否存在，然后按预期操作(要求上传幻灯片的图像，显示默认图像或地图，而不是所需的主图像...)。另一个极端是将文件名存储在数据库中，另一个选项是使用文件名约定，但在数据库中存储一个布尔值，而不是检查代码中是否存在。我对主观观点很感兴趣，但我真的很想知道是否有基于技术和客观原因的这种情况

浏览 0提问于2012-10-03得票数 1

回答已采纳

1回答

二进制文件和BLOB的区别

、、

观看的时候，在06:50的时候，关于文件和BLOBS的问题正在进行讨论。我想知道大二进制文件和BLOB (二进制大对象)之间有什么区别。他们有区别吗？存取方法备份方法切分？差异的根源是什么？他们听起来跟我很像。

浏览 1提问于2019-03-10得票数 3

回答已采纳

3回答

单个git存储库有多个用户

、、

我们有一个由多个用户使用的单一服务器。磁盘空间是一个相当大的限制，因为我们的git代码库非常大，每次有人克隆它时，它都会消耗130G的空间。我知道git不是被设计成集中化的工作流程，但这是一个非常特殊的情况。我们考虑过升级硬件，但这是一条相当长的路，因为它不是云实例。我试着摆弄git worktree，但很快就遇到了权限问题。我的理想设置是一个单一的存储库，多个用户可以通过它进行推送和拉取。我查看了之前的相关帖子，但不幸的是没有可靠的建议，而且它们都是相当老的帖子。因此，任何新的建议都将受到高度赞赏。

浏览 6提问于2020-11-22得票数 6

5回答

数据库如何处理内存无法容纳的数据表？

假设您有一个非常大的表，比方说有几十亿无序的行，现在您想要为它建立索引以进行快速查找。或者，您可能要大容量加载它，并使用聚集索引在磁盘上对其进行排序。显然，当您处理这么大的数据量时，您必须停止假设您可以在内存中进行排序之类的事情(当然，在不使用虚拟内存的情况下，这会对性能造成很大的影响)。有人能给我一些关于数据库如何在幕后处理这样大量数据的线索吗？我猜有一些算法使用某种形式的智能磁盘缓存来处理所有数据，但我不知道从哪里开始。参考资料将特别受欢迎。也许是一本高级数据库的教科书？

浏览 3提问于2009-11-13得票数 4

回答已采纳

3回答

Server的FILETABLE是否适合存储大型文件(大于10 GB)？

、、、

有一个实验室的项目。将实验室数据(原始数据和相关信息)保存多年以供研究的要求。所以数据必须保存几年，但是数据太大了，每个原始数据都超过10 GB。如果将原始数据存储在Server的FILETABLE中，并将相关信息存储在标准Server表中，则在数月或数年后，数据库大小将非常大，因此必须将一些历史数据从数据库中移出。也许我们可以将文件(在不同的硬盘上)添加到FILESTREAM文件组中(用于存储原始数据)，但我觉得这不适合维护Server。我们必须保持原始数据和相关信息的一致性。我们已考虑使用磁带保存历史原始数据。我们希望使用硬盘保存最新的原始数据，使用磁带保存历史原始数据。当我们将历史

浏览 0提问于2013-10-28得票数 6

回答已采纳

1回答

Django中用于基于文档的字段的混合sql/nosql数据存储？

、、、、

我正在创建一个需要允许用户创建自定义字段的应用程序，我认为最好将其存储在基于文档(基本上是序列化字典)的模型字段中。我担心在SQL数据库中存储这些潜在的非常大的文档会遇到性能问题，所以我想我应该在SQL数据库中存储指向文档的指针，而不是将文档存储在SQL数据库中。然后，文档本身将存储在单独的NoSQL数据库中。假设这种结构是有意义的，那么以这种方式构造存储自定义数据字段的字段的最佳方式是什么？最理想的情况是，这些自定义字段可以作为属性在对象上访问，并将表示为custom，并在名称后附加一个"_c“。例如，created_date将成为django模型对象上的created_date

浏览 0提问于2013-11-05得票数 0

1回答

在Emgu+OpenCV中处理包含多个子图像的图像的最佳方法？

、、

我正在开发一个使用Emgu和OpenCV的C#应用程序，它们都是2.9.0版本。我是OpenCV/Emgu的初学者，我需要一些帮助才能开始。我有一个包含多个子图像的大图像。每个子图像包含多个区域，需要使用OpenCV以不同的方式进行处理。大图像每秒更新几次。我计划使用pInvoke和memcpy来更新大图的位图。为了避免多次复制操作，我希望子图像与大图像共享像素数据，这样当大图像更新时，它们会自动获得新的像素数据。子图像将在多个并行线程中同时处理。我需要知道的是组织大图像对子图像和要处理的区域的最佳方法，这样我就可以通过一次调用memcpy来更新像素，然后在不同的线程上处理子图像中的区

浏览 1提问于2014-03-08得票数 1