首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

SQL索引基础

一、深入浅出理解索引结构    实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚集索引的区别:    其实,我们的汉语字典的正文本身就是一个聚集索引。比如,我们要查“安”字,就会很自然地翻开字典的前几页,因为“安”的拼音是“an”,而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的,那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a”开头的部分仍然找不到这个字,那么就说明您的字典中没有这个字;同样的,如果查“张”字,那您也会将您的字典翻到最后部分,因为“张”的拼音是“zhang”。也就是说,字典的正文部分本身就是一个目录,您不需要再去查其他目录来找到您需要找的内容。我们把这种正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。    如果您认识某个字,您可以快速地从自动中查到这个字。但您也可能会遇到您不认识的字,不知道它的发音,这时候,您就不能按照刚才的方法找到您要查的字,而需要去根据“偏旁部首”查到您要找的字,然后根据这个字后的页码直接翻到某页来找到您要找的字。但您结合“部首目录”和“检字表”而查到的字的排序并不是真正的正文的排序方法,比如您查“张”字,我们可以看到在查部首之后的检字表中“张”的页码是672页,检字表中“张”的上面是“驰”字,但页码却是63页,“张”的下面是“弩”字,页面是390页。很显然,这些字并不是真正的分别位于“张”字的上下方,现在您看到的连续的“驰、张、弩”三字实际上就是他们在非聚集索引中的排序,是字典正文中的字在非聚集索引中的映射。我们可以通过这种方式来找到您所需要的字,但它需要两个过程,先找到目录中的结果,然后再翻到您所需要的页码。我们把这种目录纯粹是目录,正文纯粹是正文的排序方式称为“非聚集索引”。    通过以上例子,我们可以理解到什么是“聚集索引”和“非聚集索引”。进一步引申一下,我们可以很容易的理解:每个表只能有一个聚集索引,因为目录只能按照一种方法进行排序。  二、何时使用聚集索引或非聚集索引   下面的表总结了何时使用聚集索引或非聚集索引(很重要)。 动作描述使用聚集索引  使用非聚集索引 外键列 应  应 主键列 应 应 列经常被分组排序(order by) 应 应 返回某范围内的数据 应 不应 小数目的不同值 应 不应 大数目的不同值 不应 应 频繁更新的列不应  应 频繁修改索引列 不应 应 一个或极少不同值 不应 不应

02

矩阵分解就能击败深度学习!MIT发布时序数据库tspDB:用SQL做机器学习

---- 新智元报道   编辑:LRS 【新智元导读】时间序列预测问题通常比普通机器学习更棘手,不仅需要维持一个增量数据库,还需要实时预测的性能。最近MIT的研究人员发布了一个可以通过SQL创建机器学习模型的数据库,不用再发愁时序数据管理了! 人类从历史中学到的唯一教训,就是人类无法从历史中学到任何教训。 「但机器可以学到。」 ——沃兹基硕德 无论是预测明天的天气,预测未来的股票价格,识别合适的机会,还是估计病人的患病风险,都可能对时间序列数据进行解释,数据的收集则是在一段时间内对观察结果的记录。

04

从诱发反应中解码动态脑模式:应用于时间序列神经成像数据的多元模式分析教程

多变量模式分析(MVPA)或大脑解码方法已经成为分析功能磁共振数据的标准做法。虽然解码方法已广泛应用于脑机接口,但其应用于时间序列神经成像数据(如脑磁图、脑电图)以解决认知神经科学中的实验问题是最近的事。在本教程中,我们描述了从认知神经科学的角度来告知未来时间序列解码研究的广泛选择。使用脑磁图数据的例子,我们说明了解码分析流程中的不同选项对实验结果的影响,目的是解码不同的知觉刺激或认知状态随时间的动态大脑激活模式。我们展示了在预处理(如降维、降采样、试次平均)和解码(如分类器选择、交叉验证设计)时所做的决策。除了标准解码外,我们还描述了对时变神经成像数据的MVPA的扩展,包括表征相似性分析、时间泛化和分类器权重图的解释。最后,我们概述了时间序列解码实验设计和解释中的重要注意事项。本文发表在Journal of Cognitive Neuroscience杂志。

01
领券