Oracle 12.2新特性掌上手册 - 第三卷 Core Improvements

编辑手记:Oracle 12.2 在内核上有许多创造性的改进,这些改进让数据库的操作更加高效便捷,同时一些面向智能运维和大数据的改进,则迈出了云和大数据时代的重要一步。在今年的DB-Engines的评选中,Oracle位居榜首,而我们从12.2的这些更新中便知道,Oracle是DBMS当之无愧的领导者。

注:文章内容来自官方文档翻译。若需要了解更多,请查阅官方文档

1、Partition-Specific Near Real-Time Indexes(近实时索引的配置)

12.2中可以在分区级别指定使用近实时索引的选项(STAGE_ITAB设置),频繁更新的分区可以启用接近实时的索引,而较少频繁更新的表可以关闭它。

当使用STAGE_ITAB索引选项创建CONTEXT索引时,将创建一个空的$ G表,其中包含$ H btree索引。 将g_index_clause子句与STAGE_ITAB索引选项结合使用可改善广泛用于DML操作的CONTEXT索引的SQL查询的性能。

并且在12.2中可以指定近实时$ G索引表的最大大小,若调整最大大小,会将更新写入主$ I表,指定最大大小可防止近实时$ G索引表过大而无法容纳到内存中。

2、Partitioning: Auto-List Partitioning(自动列表分区)

数据库会自动为表的每个不同分区键值创建一个单独的(新)分区。自动列表分区减少了DBA管理分区的负担,为需要单独分区的大量不同键值手动维护分区表列表。 它还自动处理未计划的分区键值,而不需要DEFAULT分区。

3、Adding New Document Formats(添加新的文档格式)

在12.2版本中,Oracle Outside-In Technology支持的格式可以使用AUTO_FILTER编制索引,新添加的格式也可以索引。

4、Structured/Sort Data (SDATA) Section Improvements

对SDATA节进行了以下改进:

  • B树支持的SDATA部分可进行范围搜索,以获得更好的性能。
  • SDATA可以针对SEARCH或SORT操作进行优化
  • 多值SDATA节 - 组数在结果集接口中的SDATA节上可用。
  • 这些SDATA改进在Oracle Text索引环境中提供更好的性能和更灵活的混合查询。

5、Availability of Updated Documents in Index(更新文档在索引中的可用性)

在早期版本中,当文档更新时,在索引同步之前,无法搜索它们。

在12.2中,可以选择保留旧的甚至过期的索引条目,以便仍然可以从其原始内容中找到文档。

若对文档做小的改动,不必立即执行索引同步,仍然可以进行索引。

6、Read-Only MDATA Sections(只读MDATA段)

普通的MDATA段可以在不需要重新索引整个文档的情况下呗更新,但这样做会产生性能成本。

在12.2中,可以选择将MDATA段指定为read-only,这意味着它们只能在文档更新和索引同步时被更改。

此功能为查询提供更好的性能,因为不需要额外的游标来处理read-only MDATA段。 减少所需的光标数量也可以防止超过OPEN_CURSORS系统参数的限制。

7、 Sentiment Analysis and Collocates(情绪分析和搭配)

情绪分析?!

介个好像听起来很神奇的样子,是否很多人跟我一样第一次听说数据库还能实现这功能,一种被打脸的感觉。

Oracle文本支持情感分析和搭配。 情绪分析提供与搜索词相关联的积极和消极趋势的识别。与搜索术语相关联的积极或消极趋势的识别允许构建更丰富的搜索应用。

想了解更多的朋友看这里:

Oracle文本能够通过训练以识别情感元数据的情感分类器来对主题或文档执行情绪分析。

随着数据量的增加,如果组织能够获得对其数据的更多洞察,而不仅仅是响应于搜索查询获得“命中”,这将会产生很大的价值。洞察可以是回答某些基本类型的查询(例如天气查询或关于最近事件的查询)或提供关于用户指定的主题的意见的形式。关键字搜索提供包含搜索字词的结果列表。但是,要识别关于搜索术语的情感或意见,则需要通过浏览所有结果,然后手动查找所需的情绪信息,进行进一步的数据分析。情绪分析提供一个一步过程来识别一组文档内的情感信息。

情感分析是从一组文档中识别和提取与指定主题或实体相关的情感元数据的过程。使用训练的情绪分类器来识别情绪。当使用情绪分析运行查询时,除了搜索结果之外,还标识和显示情绪元数据。情绪分析提供诸如“产品评论是肯定的还是否定的”或“客户满意还是不满意”的问题的答案。例如,从由针对特定产品的多个评论组成的文档集中,可以确定指示产品是好还是坏的整体情绪。

8、 Extracting Synonyms of Words in Documents(提取文档中单词的同义词)

CTX_DOC PL / SQL包中的TOKENS和POLICY_TOKENS函数现在允许指定同义词库名称,执行该操作,返回的结果包括文档中的实际词以及由指定的词库定义的那些词的所有同义词。

此功能为数据分析和数据挖掘软件提供了优势,因为可以处理文档中找到的单词的所有变体。

9、Changes to NDATA, NEAR2, and NESTED NEAR Query Operators(对NDATA,NEAR2和NESTED NEAR查询运算符的更改)

新的Oracle Text BESTMATCH查询运算符可以找到文档中的术语集合,即使这些术语不存在或以变体形式存在也是如此。

此功能可在未知精确查询字词时提高召回率。

10、Materialized Views: Refresh Statistics History(物化视图:刷新统计历史信息)

物化视图刷新统计信息可以以不同的粒度进行收集,以提供用于分析和报告的历史数据。

存储历史物化视图刷新统计信息可以深入了解物化视图生态系统(或单个特定物化视图)是如何演进的, 这些数据为历史分析和诊断提供了独特的见解。

11、Process Management(进程管理)

此功能通过预先创建过程资源来提高连接时间和并行处理时间。 管理员可以控制预先创建多少进程,以便新连接不必等待。 相反,进程可以使用预创建的进程资源,从而减少连接和并行处理时间。

此功能可提高用户连接的连接和故障转移时间,以及后台进程的进程生成时间。

12、Partitioning: Read-Only Partitions(只读分区)

分区和子分区可以单独设置为只读状态,这样将禁用这些只读分区和子分区上的DML操作,这是对现有只读表功能的扩展。

只读分区和子分区启用对DML活动的精细控制,这增强了分区表的数据管理功能。

13、Partitioning: Multi-Column List Partitioning(多列列表分区)

列表分区功能已扩展为启用多个分区键列。

使用多个列来定义列表分区表的分区标准,可使新类应用程序从分区中受益。

在Oracle12.2中,内核设计方面有很多重要的创新性改进,这些改进使得Oracle数据库的运维能够更好地应对大数据分析和各种智能管理。

原文发布于微信公众号 - 数据和云(OraNews)

原文发表时间:2016-12-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏逸鹏说道

03.SQLServer性能优化之---存储优化系列

汇总篇:http://www.cnblogs.com/dunitian/p/4822808.html#tsql 概 述:http://www.cnblogs....

2795
来自专栏CSDN技术头条

大型数据集的MySQL优化

诸多知名大公司都在使用MySQL,其中包括Google、Yahoo、NASA和Walmart。此外,其中部分公司的表囊括数十亿行,却又性能极佳。虽然很难保持My...

2006
来自专栏杨建荣的学习笔记

多套Oracle 10g整合迁移到11g的方案

在数据迁移中,除了跨平台,全量,增量数据迁移之外,还有一类会把已有的难度升级,那就是整合式迁移,比如原来有两个数据,迁移后是一个,类似这样的需求,如果再加...

3613
来自专栏数据库新发现

数据库恢复:Oracle 18c 通用版本 18.3 抢先下载

如同 Oracle 此前预告的那样,Oracle Database 18c 已经正式发布,初始发布的 Linux X86 版本,版本号 18.3 :

1812
来自专栏UML

什么是实体关系图(ERD)?

实体 - 关系(ER)图(也称为ERD或ER模型)是Peter最初在1976年提出的经典且流行的概念数据模型。它是系统内不同实体的视觉表示以及它们如何相互关联。...

2775
来自专栏腾讯技术工程官方号的专栏

腾讯数据库内核团队资深架构师:TXSQL Internals @2018

? 在ODF2018开源数据库论坛暨首届MariaDB中国用户者大会上,来自腾讯技术工程事业群TEG基础架构部数据库内核团队资深架构师王少华,做了主题为「TX...

1572
来自专栏申龙斌的程序人生

零基础学编程034:解决一个pandas问题

昨天一位朋友问了一个程序问题:一个csv电子表格文件,里面有不规范数据,如何用pandas的dataframe,将某一列是空值的记录行删掉。 收到了CSV文件,...

3457
来自专栏杨建荣的学习笔记

今天处理的三个小问题——20160120(r7笔记第84天)

今天处理了几件事情,有几件还比较有意思,我拿出三件来说说。 首先是早上有一个同学打电话求助一个问题,给我的反馈是他们目前有一个表,数据量越来越大,目前数据插入变...

2864
来自专栏idealclover的填坑日常

ubuntu 18.04 前期配置

啊这个显卡实在让我欲仙欲死...让ubuntu卡在开机logo的罪魁祸首...这个已经在上一期里说过啦

2281
来自专栏晨星先生的自留地

一次不完全成功的渗透

2165

扫码关注云+社区