首页
学习
活动
专区
工具
TVP
发布

数据分析

数据清洗,数据预处理,特征提取,特征选择,数据分析,机器学习,深度学习
专栏作者
41
文章
57047
阅读量
47
订阅数
[SQLServer大对象]——FileTable从文件系统迁移文件
阅读导航 从文件系统中迁移文件到FileTable 批量加载文件到FileTable 如何批量加载文件到FileTable 通过博文[SQLServer大对象]——FileTable初体验,已经可以将文件加载到数据库中,并查看和访问这些文件。 将文件加载到 FileTable,可以使用工具xcopy或robocopy,也可以自己编写脚本(如PowerShell)或者应用程序,复制文件到FileTable中。 现在说一说文件的迁移。 从文件系统中迁移文件到FileTable 迁移文件条件     文件存储在文
数据分析
2018-03-01
1.3K0
[数据库基础]——快速浏览日期时间转换
阅读导航 数据库日期和时间类型 相互转换     time ⇌ date time ⇌ smalldatetime time ⇌ datetime time ⇌ datetime2 time ⇌ datetimeoffset date ⇌ smalldatetime date ⇌ datetime date ⇌ datetime2 date ⇌ datetimeoffset smalldatetime ⇌ datetime smalldatetime ⇌ datetime2 small
数据分析
2018-03-01
1K0
[数据库基础]——索引
一、引言 对数据库索引的关注从未淡出我的们的讨论,那么数据库索引是什么样的?聚集索引与非聚集索引有什么不同?希望本文对各位同仁有一定的帮助。有不少存疑的地方,诚心希望各位不吝赐教指正,共同进步。[最近首页之争沸沸扬扬,也不知道这个放在这合适么,苦劳?功劳?……] 二、 B-Tree 我们常见的数据库系统,其索引使用的数据结构多是 B-Tree 或者 B+Tree 。例如, MsSql 使用的是 B+Tree , Oracle 及 Sysbase 使用的是 B-Tree 。所以在最开始,简单地介绍一
数据分析
2018-03-01
1.1K0
[数据库基础]——索引详解
索引对于接触过数据库的人,都不会很陌生,但是说实话,也不一定很熟悉。先来介绍下索引的优点。 提高性能 现在有一个数据库表[Words],有[WordID],[WordPage],[[WordName],[WordPronunciation] ,[WordMeaning],[WordSentence]五个列,假设有上万条记录。 现在,使用查询语句找到“boyce”的详细信息,使用语句 1: SELECT * FROM [Words] 2: WHERE [WordName] = 'boyce
数据分析
2018-03-01
7340
SQL Server 性能优化之——T-SQL TVF和标量函数
上一篇介绍了关于“临时表、表变量和Union优化”这次转向关注定义函数——也就是表-值函数、标量函数。 UDF(用户定义函数,User defined Function)对于集中精力处理业务逻辑很方便,因为可以在UDF中指定一组业务逻辑,其中可以设计多个存储过程和一些特定的查询语句。但是,由于UDF对CPU的大量请求可能导致性能下降 1. TVF(表-值行数Table-Valued Functions) 一般情况,当使用TVF与一个对象内联接,如果该对象没有索引将会导致TVF像索引扫描或表扫描一样做扫描操作
数据分析
2018-03-01
1.5K0
SQL Server 性能优化之——T-SQL 临时表、表变量、UNION
这次看一下临时表,表变量和Union命令方面是否可以被优化呢? 一、临时表和表变量 很多数据库开发者使用临时表和表变量将代码分解成小块代码来简化复杂的逻辑。但是使用这个的后果就是可能带来性能的损害 1. 对I/O子系统的影响 (存储区域网络SAN 或逻辑存储),这是由于增加了页和页I/O闩锁等待,这样等待被认为是最差的等待,这也可能会增加临时数据库的密集竞争进而导致高分配请求,最后可能出现全局分配映射页(GAM)、共享全局映射页(SGAM)或可用空间(PFS)瘫痪。 全局分配映射页(Global Alloc
数据分析
2018-03-01
3K0
[数据库基础]——图解JOIN
一、概要 JOIN对于接触过数据库的人,这个词都不陌生,而且很多人很清楚各种JOIN,还有很多人对这个理解也不是很透彻,这次就说说JOIN操作。 图片是很容易被接受和理解,所以尝试使用图片来说明一下。
数据分析
2018-03-01
9970
[数据库基础]——编码标准之命名
一个语句写十遍,居然大部分时候都是不一样的。上网找了一些SQL的开发标准文档,结合项目中的使用,写一些关于自己SQL的开发标准文档。 解编码标准就是一套写代码的指南、规则、约定的集合。编码标准应该足够灵活并且不会给开发造成负担。作为一个开发者来说,新接触一个项目,个人认为最重要的是熟悉当前项目的开发标准。这样不仅有利于快速熟悉已有代码和添加新代码,而且对以后的维护也很重要。 表 Tables、视图 Views 规则:使用Pascal命名法,并以‘s’ 或者‘es’ 结尾的复数形式。 例子: 表:Produc
数据分析
2018-03-01
7770
[数据库基础]——编码标准之结构
数据库是由若干表构成,表是由数据行构成,数据行由若干列组成。由于数据库这样的结构,这就要求我们在构成数据库表时,需要注意一些问题。现在提出一些注意的问题。 1. 主键 每一个表必须有一个主键列。大多数情况,存在一个命名为ID的列作为主键列 直接创建 1: CREATE TABLE Products 2: { 3: [ID] int NOT NULL PRIMARY KEY, 4: [Name] varchar(255) NOT NULL 5: } 添加主键约束
数据分析
2018-03-01
8000
[数据库基础]——编码标准之格式
代码就像家里的各种物品,格式化就好比对家中物品的排放。家中的物品随便怎么放,物品都不会反对,房子也不会介意,但是物品的排放合理、规整,会让家里变得更具有美感。代码也是一样,代码写成什么样子,代码不会反对,计算机也不会介意(除非不能运行),但是毕竟还是会有人来欣赏、维护这些代码,这时候具有很好格式的代码就显得尤为重要了。 SQL关键字 所有的SQL关键字大写。 SELECT,UPDATE,DELETE,INSERT INTO,CRETAE DATABASE,ALTER DATABASE,CREATE TABL
数据分析
2018-03-01
1.4K0
[数据库基础]——编码标准之编码注意事项(持续更新)
前面已经介绍三篇关于数据库编码规范的博文,现在来一个收尾篇,在说一下代码时候应该注意的东西 1. 不要使用SELECT *,使用SELECT时一定要指定所需要的列。 2. 尽量避免使用<>,如果能够使用 IN 操作代替就使用他代替。 3. 尽量避免使用 > 或 <,最好使用 <= 或 >= 语句代替。 4. 插入大量数据时,不要使用游标或者应用程序循环,最好使用 INSERT INTO 代替。 5. 像到多数流行的开发语言一样,不要使用 GOTO 语句。 6. 在使用 ORDER BY 时,要使用列名,不要
数据分析
2018-03-01
7440
[SQLServer大对象]——FileTable初体验
在我接触FileTable之前,存储文件都是存储文件的链接和扩展名到数据,其实并没有实际的把文件存储到数据库。 FileTable不同于一般的表,他可以存储非结构数据和元数据(如:文件、文档),存储的文件可以像普通的文件一样通过一个路径被访问,而且不必对客户端程序修改。 FileTable 不支持内存映射文件。 “记事本”和“画图”是两个常见的使用内存映射文件的示例应用程序。 不能在 SQL Server 所在的计算机上使用这些应用程序来打开存储在 FileTable 中的文件。 但是,可以从远程计算机使用
数据分析
2018-03-01
1.6K0
Database、Table的所有约束
列出Database或Table的所有约束 很多时候我们想使用像 INSERT、UPDATE、DELETE 这样的DML命令。有时候因为某个表被设置约束,导致我们操作该表出现错。拿到一个新的数据库,如果不知道哪些表被设置约束,一定让人很痛苦。 如果我们能够列出所有的约束,很多错误就可以避免。下面有两个方法列出约束。 方法 一 使用 sys.objects 获得约束信息。 — 显示数据库中所有约束 SELECT * FROM sys.objects WHERE type_desc LIKE ‘%CONSTRA
数据分析
2018-03-01
6030
SQL Server 性能优化之——系统化方法提高性能
1. 概述 在比较大的范围内找出能够大幅提高性能的区域,并且专注于分析这个区域,这是最有效的优化SQL Server性能的方式。否则,大量的时间和精力可能被浪费在不能提高很大性能的区域。在这里并没有讨论关于多用户并发所带来的性能问题。 能获得最大性能提高的区域一般是:逻辑数据库设计,索引设计,查询设计。然而,最大的性能问题经常由于缺乏这些方面研究的原因造成。如果性能是被列为一个需要关注的问题,聪明的做法是首先专注于这些方面, 因为性能的大幅提高经常是用相对较小的时间精力完成。 下面开始进入正题。 2. 规范
数据分析
2018-03-01
2.3K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档