首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

珍藏 | Java 岗位 【数据库】 面试题及答案详解

· 存储过程存在于大型数据库系统中,是一个预编译的SQL语句(为了完成特定功能的SQL 语句),经过第一次编译后再次调用不需要再次编译。...· 主键在本表中是唯一的、不可空的,外键可以重复可以空; · 外键和另一张表的主键关联,不能创建对应表中不存在的外键。 12:在数据库中查询语句速度很慢,如何优化?...这样,如果返回的两个结果集中有重复数据,那么返回的结果就会包含重复数据了。...· 效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复数据的话,那么就使用UNION ALL。...21:表和视图的关系 · 视图其实就是一查询sql语句,用于显示一个或多个表或其他视图中的相关数据。 · 表就是关系数据库中实际存储数据用的。

3.4K20

MySQL 慢查询、 索引、 事务隔离级别

# 按照时间排序的前 10 里面含有左连接的查询语句 mysqldumpslow -s t -t 10 -g “left join” slow_query_log_file # 返回记录最多的...(列名 1,列名 2,...) ); -- 创建表时指定索 引  主键索引 主 键 是 特 殊 的 一 索 引 , 同 样 支 持 单 列 和 多 列 , 但 是 必 须 被 指 定 为 P...B+ 树 B+树是 B 树的一种变体,同样是多路平衡查找树,它与 B 树主要的不同是  非叶子节点不存储数据,只存储索引   叶子节点包含了全部的关键字信息,且叶子节点按照关键字顺序相互连接...尽量选择区分度高的列作为索引,区分度的公式是 count(distinct col)/count(*),表示字段不重复的比例,比例越大我们 扫描的记录数越少,唯一键的区分度是 1,而一些状态、性别字段可能在大数据面前区分度就是...  不可重复读(Non-repeatableread): 在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新 的原有的数据

2.8K50

数据查找神器!100个大型机器学习数据都汇总在这了 | 资源

太方便了 这个网站上,共收集到了100多个业界最大型数据。 根据任务类别,这些数据集中又分为三大类:计算机视觉(CV)、自然语言处理(NLP)和音频数据。 ?...此外,DeepMind的Q&A问答数据、微软的MS MARCO机器阅读理解数据、三名中国学生推出的HotpotQA新型问答数据等,都可以在这份清单中一键直达。...谷歌的大规模音频数据AudioSet,包含632类的音频类别以及2084320 人工标记的每段10秒的声音剪辑片段,覆盖大范围人类与动物、乐器与音乐流派、日常环境声音。 ?...谷歌NSynth数据,收录了1000种乐器中采集的大量注释的音符,包括不同的音高和速率,比同类的公共数据大了一个数量级。...还有LibriSpeech ASR corpus语音数据,包括1000小时的英文发音和对应文字,数据来自LibriVox项目的有声读物,是一个大型的语料数据库。

85510

MySQL数据库选择题

B、VAR C、TIME D、CHAR 10.下列描述正确的是(B) A、一个数据只能包含一个数据表 B、一个数据库可以包含多个数据表 C、一个数据库只能包含两个数据表 D、一个数据表可以包含多个数据表...where子句,因此不删除任何数据 D、删除当前数据库中employee表内的当前行 23.为数据创建索引的目的是(A) A、提高查询的检索性能 B、归类 C、创建唯一索引 D、创建主键 24...、INT B、VAR C、TIME D、CHAR 77.下列描述正确的是(B) A、一个数据只能包含一个数据表 B、一个数据库可以包含多个数据表 C、一个数据库只能包含两个数据表 D、一个数据表可以包含多个数据表...where子句,因此不删除任何数据 D、删除当前数据库中employee表内的当前行 90.为数据创建索引的目的是(A) A、提高查询的检索性能 B、归类 C、创建唯一索引 D、创建主键 91...B、一个数据库服务器只能管理多个数据库,一个数据库可以包含多个表 C、一个数据库服务器只能管理一个数据库,一个数据库可以包含多个表 D、一个数据库服务器只能管理多个数据库,一个数据库只能包含一个表

2.6K20

合并多个Excel文件,Python相当轻松

在过去,我只会使用Excel和VLOOKUP公式,或者Power Query的合并数据函数。这些工具工作得很好,然而,当我们需要处理大型数据时,它们就成了一种负担。 此时,Python可以上场了。...图5:pandas数据框架,看起来就像Excel电子表格一样 pandas有一个方法.merge()来高效地合并多个数据。...注意,在第一个Excel文件中,“保险ID”列包含保险编号,而在第二个Excel文件中,“ID”列包含保险编号,因此我们必须指定,对于左侧数据框架(df_1),希望使用“保险ID”列作为唯一键;而对于右侧的数据框架...放在一起 import pandas as pd # Excel文件装载数据 df_1 = pd.read_excel('D:\投保基本信息.xlsx') df_2 = pd.read_excel(...df_combine.to_excel('D:\combine_df.xlsx') 合并操作的性能:Excel与Python 你可能已经熟悉Excel,并且知道如果有数千个查找公式,它会有多慢,而此时Python合并两个大型数据的速度会飞快

3.7K20

ISWC 2018概览:知识图谱与机器学习

爱思尔提出了一个数据网络,允许内部开发人员利用关联数据(Linked Data)原则从不同的系统获取医疗数据。...在 Kade 中,作者为文档和三元组创建一个共同的嵌入空间,目的是在不丢失原始嵌入特征的情况下,实现可以对接不同模型(图节点嵌入和文档嵌入)的嵌入策略。...例如,facebook 需要在特定目的下使用用户数据时,要从他们的用户那里获得许可。语义网技术允许聚合用户的大型数据图——当然是在获得许可的情况下。...当需要将查询联合到其他系统或者数据要回答的问题存储在多个位置(商业防火墙内部或外部)时,基于 SPARQL 的系统就很合适了。...等人在《IMPACT ANALYSIS OF DATA PLACEMENT STRATEGIES ON QUERY EFFORTS IN DISTRIBUTED RDF STORES》中提出了一种在多个计算节点上分配大型

1.3K50

数据库常见面试题及答案(数据库面试常见问题)

游标可以定在该单元中的特定行,结果的当前行检索一行或多行。可以对结果当前行做修改。一般不使用游标,但是需要逐条处理数据的时候,游标显得十分重要。...主键在本表中是唯一的、不可空的,外键可以重复可以空;外键和另一张表的主键关联,不能创建对应表中不存在的外键。 13、在数据库中查询语句速度很慢,如何优化?...这样,如果返回的两个结果集中有重复数据,那么返回的结果就会包含重复数据了。...效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复数据的话,那么就使用UNION ALL。 16、Varchar2和varchar有什么区别?...26、表和视图的关系 视图其实就是一查询sql语句,用于显示一个或多个表或其他视图中的相关数据。 表就是关系数据库中实际存储数据用的。

3.5K10

ChatGPT开源平替来了,开箱即用!前OpenAI团队打造,GitHub刚发布就揽获800+星

OpenChatKit,你的平替ChatGPT 据介绍,OpenChatKit一共包含4个基本组件: 1、一个指令调优的大型语言模型。...用来帮助微调模型使其能够为特定任务提供高精度的结果,只需要准备自己的数据。 3、一个可扩展的检索系统。 可以让你在推理时文档存储库、API或其他实时更新信息源添加信息。...数据方面,OpenChatKit模型是在LAION、Together和Ontocord.ai共同构建的OIG数据上训练的。...同样,Huggingface下载数据,然后在repo的根目录运行以下命令就行: python data/OIG/prepare.py。...但它还不太擅长创意写作(尤其是编长故事)、写代码,以及有时可能会重复响应你的请求、在切换话题时表现迟钝…… 不过,正如Together在博客中说的那样: 这个模型不是发布完就完了,它是一个开源项目的开始

93590

数据清洗概念,方法及流程等等要点初探

“脏数据”产生的源头对数据进行剖析,对数据进行全盘考察,进而提取数据清洗规则,最终,利用所提取的清洗规则发现数据集中的“脏数据”,然后对该类数据进行清洗。...聚类是在不考虑类标号的前提下,寻求类间的相似性,目的也是在海量的数据聚集的基础上,构建较小的代表性的数据,并基于该集合进一步分析和研究。...(3)验证:验证数据清洗转换规则的正确性,并对其效率进行评估。数据源中提取数据样本,在所提取的数据样本中执行数据清洗转换规则,目的是对其进行验证。...当多个数据源对数据进行提取的时候,由于数据源表结构布局设计的不同,多个数据源中将数据迁移到数据仓库的过程当中,就会出现一些冗余数据或错误信息。...大数据分析不能结果论,避免因结果论而产生的问题, 数据清洗应有相应的方法论调整。首先要树立以人为本的价值理念。对企业来说, 在维护人的权利与维护企业利润方面,应首先维护人的权利。

71910

Mybatis深入了解(六)----关联查询(高级映射)

-- id:指定查询列中的 一标识,订单信息的中的 一标识,如果有多个列组成唯一标识,配置多个id column:订单信息的 一标识 列 property...这么做的目的是为了防止信息的重复 //订单明细 private List orderdetails; Mapper.xml–定义resultMap <!...多对多查询 ---- 映射思路 将用户信息映射到user中 在user类中添加订单列表属性List orderslist,将用户创建的订单映射到orderslist 在Orders中添加订单明细列表属性...使用resultType无法将查询结果映射到pojo对象的pojo属性中,根据对结果查询遍历的需要选择使用resultType还是resultMap。...collection将关联信息映射到list集合中,比如:查询用户权限范围模块及模块下的菜单,可使用collection将模块映射到模块list中,将菜单列表映射到模块对象的菜单list属性中,这样的作的目的也是方便对查询结果进行遍历查询

61130

数据库常见的面试题大全

索引就一种特殊的查询表,数据库的搜索可以利用它加速对数据的检索。它很类似与现实生活中书的目录,不需要查询整本书内容就可以找到想要的数据。索引可以是唯一的,创建索引允许指定单个列或者是多个列。...游标可以定在该单元中的特定行,结果的当前行检索一行或多行。可以对结果当前行做修改。一般不使用游标,但是需要逐条处理数据的时候,游标显得十分重要。...主键在本表中是唯一的、不可空的,外键可以重复可以空;外键和另一张表的主键关联,不能创建对应表中不存在的外键。 13、在数据库中查询语句速度很慢,如何优化?...这样,如果返回的两个结果集中有重复数据,那么返回的结果就会包含重复数据了。...效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复数据的话,那么就使用UNION ALL。 16、Varchar2和varchar有什么区别?

1.4K40

Java面试之数据库面试题

索引就一种特殊的查询表,数据库的搜索可以利用它加速对数据的检索。它很类似与现实生活中书的目录,不需要查询整本书内容就可以找到想要的数据。索引可以是唯一的,创建索引允许指定单个列或者是多个列。...游标可以定在该单元中的特定行,结果的当前行检索一行或多行。可以对结果当前行做修改。一般不使用游标,但是需要逐条处理数据的时候,游标显得十分重要。...主键在本表中是唯一的、不可空的,外键可以重复可以空;外键和另一张表的主键关联,不能创建对应表中不存在的外键。 13、在数据库中查询语句速度很慢,如何优化?...这样,如果返回的两个结果集中有重复数据,那么返回的结果就会包含重复数据了。...效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复数据的话,那么就使用UNION ALL。 16、Varchar2和varchar有什么区别?

1.5K20

数据库经典面试题,都给你收集好了!!!

索引就一种特殊的查询表,数据库的搜索可以利用它加速对数据的检索。它很类似与现实生活中书的目录,不需要查询整本书内容就可以找到想要的数据。索引可以是唯一的,创建索引允许指定单个列或者是多个列。...游标可以定在该单元中的特定行,结果的当前行检索一行或多行。可以对结果当前行做修改。一般不使用游标,但是需要逐条处理数据的时候,游标显得十分重要。...主键在本表中是唯一的、不可空的,外键可以重复可以空;外键和另一张表的主键关联,不能创建对应表中不存在的外键。 13、在数据库中查询语句速度很慢,如何优化?...这样,如果返回的两个结果集中有重复数据,那么返回的结果就会包含重复数据了。...效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复数据的话,那么就使用UNION ALL。 16、Varchar2和varchar有什么区别?

1.5K30

Java面试之数据库面试题

索引就一种特殊的查询表,数据库的搜索可以利用它加速对数据的检索。它很类似与现实生活中书的目录,不需要查询整本书内容就可以找到想要的数据。索引可以是唯一的,创建索引允许指定单个列或者是多个列。...游标可以定在该单元中的特定行,结果的当前行检索一行或多行。可以对结果当前行做修改。一般不使用游标,但是需要逐条处理数据的时候,游标显得十分重要。...主键在本表中是唯一的、不可空的,外键可以重复可以空;外键和另一张表的主键关联,不能创建对应表中不存在的外键。 13、在数据库中查询语句速度很慢,如何优化?...这样,如果返回的两个结果集中有重复数据,那么返回的结果就会包含重复数据了。...效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复数据的话,那么就使用UNION ALL。 16、Varchar2和varchar有什么区别?

1.4K41

【笔记】Mysql 数据库操作规范

禁⽌在数据库中存储图片、文件等大数据。 每张表数据量建议控制在 5000W 以内。 禁⽌在线上做数据库压力测试。 禁止测试、开发环境直连线上数据库。 3. 库表设计: 禁⽌使用分区表。...[FAQ-5-01] 唯一键由 3 个以下字段组成,并且字段都是整型时,可使⽤⼀键作为主键。其他情况下,建议使⽤⾃增列或发号器作主键。 禁⽌冗余索引。[FAQ-5-02] 禁止重复索引。...[FAQ-6-03] 获取⼤量数据时,建议分批次获取数据,每次获取数据少于 5000 ,结果应⼩于 1M。 ⽤ UNION ALL 代替 UNION。...禁⽌单 SQL 语句同时更新多个表。 避免使⽤存储过程、触发器、视图、⾃定义函数等。[FAQ-6-07] 建议使用合理的分页方式以提⾼分页效率。...可以利⽤前缀索引来达到加速目的,减轻维护负担。 【FAQ-5-03】 禁⽌重复索引。 primary key a;uniq index a; 重复索引增加维护负担、占⽤磁盘空间,同时没有任何益处。

1.4K20

数据科学家必用的25个深度学习的开放数据

为了管理这个数据20个不同的新闻组中获取了1000篇Usenet文章。这些文章具有典型特征,如主题行,签名和引号。 大小:20 MB 记录数量:来自20个新闻组的20,000消息。...它是一个开放数据,用于评估MIR中的几个任务。以下是数据连同其包含的csv文件列表: tracks.csv:106,574首曲目的每首曲目元数据,如ID,标题,艺术家,流派,标签和播放次数。...其目的是: 鼓励对扩大到商业规模的算法进行研究; 为评估研究提供参考数据; 作为使用API创建大型数据的捷径(例如Echo Nest的); 帮助新研究人员在MIR领域开始工作; 数据的核心是一百万首歌曲的特征分析和元数据...该数据包含任何音频,只包含派生的功能。示例音频可以通过使用哥伦比亚大学提供的代码7digital等服务中获取。 大小: 280 GB 记录数量:一百万首歌曲!...SOTA:百万歌曲数据挑战推荐系统的初步研究 21.LibriSpeech http://www.openslr.org/12/ 该数据包含大约1000小时的英语语音的大型语料库。

1.6K140

机器学习数据统计系列一

所有数据已经过审查,以符合雅虎的数据保护标准,包括严格的隐私控制。数据集中包含多个主题数据:广告和市场营销、自然语言数据、科学数据、图形和社会化数据、图像数据等7个主题。...数据包含网络收集的13000多张图像。每张脸都贴上了所画的人的名字,图片中的1680人在数据集中有两个或更多不同的照片。...数据由超过40万行的潜在问题的问答组成。每行数据包含问题ID、问题全文以及指示该行是否真正包含重复对的二进制值。...该数据包含了训练、开发机、测试三部分,每份里面包括了多个扬声器在不同噪音环境下的数据。...,包含1495个录音和音频会议、159848发音词典和部分WMT12公开的语料库。

1.1K20

【干货】二十五个深度学习相关公开数据

图像处理到语音识别,每一个细分领域都有着独特的细微差别和解决方法。 然而,你可以哪里获得这些数据呢?现在大家所看到的大部分研究论文都用的是专有数据,这些专有数据又通常不会公开。...,WordNet是一个包含英文synsets的大型数据库。...它由数百万用户评论、商业类型和来自多个大型城市的超过20万张照片组成。这在全球都是一个非常常用的NLP挑战级数据。...它是一个公开数据,用来评估MIR中的多项任务。以下是其包含的csv文件列表: tracks.csv:包含所有(106,574首)曲目的基本信息--ID,标题,艺术家,流派,标签和播放次数。...百万歌曲数据是由一百万首当代流行音乐曲目的音频特征和元数据组成。其目的是: 鼓励对扩展到商业规模的算法进行研究 为评估研究提供参考数据 作为使用API创建大型数据的替代方法(e.g.

1.6K50
领券