Hint的正确使用姿势 SQL优化 一篇文章说清楚Oracle (hint用法)

Hint的正确使用姿势 SQL优化 一篇文章说清楚Oracle (hint用法)

作者介绍

**韩锋,**宜信技术研发中心数据库架构师。精通多种关系型数据库,曾任职于当当网、TOM在线等公司,曾任多家公司首席DBA、数据库架构师等职,多年一线数据库架构、设计、开发经验。著有《SQL优化最佳实践》一书。**一、提示(Hint)概述**1
<section>为什么引入Hint?</section>
复制代码

Hint 是 Oracle 数据库中很有特色的一个功能,是很多 DBA 优化中经常采用的一个手段。那为什么 Oracle 会考虑引入优化器呢?基于代价的优化器是很聪明的,在绝大多数情况下它会选择正确的优化器,减轻 DBA 的负担。

但有时它也聪明反被聪明误,选择了很差的执行计划,使某个语句的执行变得奇慢无比。此时就需要 DBA 进行人为的干预,告诉优化器使用指定的存取路径或连接类型生成执行计划,从而使语句高效地运行。Hint 就是 Oracle 提供的一种机制,用来告诉优化器按照告诉它的方式生成执行计划。

2
<section>不要过分依赖Hint</section>
复制代码

当遇到 SQL 执行计划不好的情况,应优先考虑统计信息等问题,而不是直接加 Hint 了事。如果统计信息无误,应该考虑物理结构是否合理,即没有合适的索引。只有在最后仍然不能 SQL 按优化的执行计划执行时,才考虑 Hint。

毕竟使用 Hint,需要应用系统修改代码,Hint 只能解决一条 SQL 的问题,并且由于数据分布的变化或其他原因(如索引更名)等,会导致 SQL 再次出现性能问题。

3
<section>Hint的弊端</section>
复制代码4
<section>Hint与注释关系</section>
复制代码

提示是 Oracle 为了不破坏和其他数据库引擎之间对 SQL 语句的兼容性而提供的一种扩展功能。Oracle 决定把提示作为一种特殊的注释来添加。它的特殊性表现在提示必须紧跟着 DELETE、INSERT、UPDATE 或 MERGE 关键字。

换句话说,提示不能像普通注释那样在 SQL 语句中随处添加。且在注释分隔符之后的第一个字符必须是加号。在后面的用法部分,会详细说明。

5
<section>Hint功能</section>
复制代码

Hint 提供的功能非常丰富,可以很灵活地调整语句的执行过程。通过 Hint,我们可以调整:

**二、Hint用法**1
<section>语法</section>
复制代码

1)关键字说明

2)提示中的错误

提示中的语法错误不会报错,如果解析器不能解析它,就会把它看做一个普通注释处理。这也是容易造成困惑的一点,使用的 Hint 到底是否起效?可以采用一些手段,检查提示的有效性。需要注意的是,那些语法正确但引用对象错误的提示是不会被报告的。

使用 dbms_xplan 输出中的 note 选项。

在 10g 中,这个事件产生的输出文档的末尾有一部分内容专门讲提示。通过它可以检查两个方面:一是每个用到的提示都会被列出来。如果漏掉了哪个,就说明这个提示没有被识别;二是检查是否有一些信息指明了出现提示错误(如果出错,err 值将大于 0)。

3)提示中的对象

SELECT /*+ INDEX(table_name index_name) */ …

2
<section>提示的作用域</section>
复制代码

初始化参数提示对整个 SQL 语句起作用,其他的提示仅仅对查询块起作用。仅仅对单个查询块起作用的提示,必须在它控制的查询块内指定。

可以使用点号引用包含在其他查询块(假设这些块已命名)中的对象。全局提示的语法可以支持两层以上的引用,对象间必须用点号分隔。

既然 where 子句中的子查询是没有命名的,它们的对象就不能被全局提示引用。为了解决这个问题,10g 中使用了另一种方法来解决-命名查询块。查询优化器可以给每个查询生成一个查询块名,而且还可以使用提示 qb_name 手工为每个查询块命名。大多数提示都可以通过参数来指定在那个查询块中有效。

*在提示中通过 @来引用一个查询块。

3
<section>提示数据字典</section>
复制代码

Oracle 在 11g 的版本中提供了一个数据字典—V$SQL_HINT。通过这个数据字典可以看到提示的出现版本、概要数据版本、SQL 特性以及相反提示等。

这个 hint 相反操作的 hint。

代表着这个 hint 正式公布引入的版本。

**三、Hint分类**1
<section>和优化器相关的</section>
复制代码

当对优化器为某个语句所制定的基本执行计划不满意时,最好的办法就是通过提示来转换优化器的模式,并观察其转换后的结果,看是否已经达到期望程度。如果只通过转换优化器的模式就可以获得非常好的执行计划,则就没有必要额外使用更为复杂的提示了。

这个提示的作用就是使我们在某条语句中指定某个系统参数值。

为实现查询语句整体最优化而引导优化器制定最少成本的执行计划。这个提示会使优化器选择一条可最快检索所有查询行的路径,而代价就是在检索一行数据时,速度很慢。

为获得最佳响应时间而引导优化器制定最少成本的执行计划。这个提示会使优化器选择可最快检索出查询的第一行(或指定行)数据的路径,而代价就是检索很多行时速度就会很慢。利用 FIRST_ROWS 来优化的行数,默认值为 1,这个值介于 10 到 1000 之间,这个使用 FIRST_ROWS(n)的新方法是完全基于代价的方法。它对 n 很敏感,如果 n 值很小,CBO 就会生成包含嵌套循环以及索引查找的计划;如果 n 很大,CBO 会生成由哈希连接和全表扫描组成的计划(类似 ALL_ROWS)。

依据 SQL 中所使用到的表的统计信息存在与否,来决定使用 RBO 还是 CBO。在 CHOOSE 模式下,如果能够参考表的统计信息,则将按照 ALL_ROWS 方式执行。除非在查询中的所有表都没有经过分析,否则 choose 提示会对整个查询使用基于代价的优化。如果在多表连接中有一个表经过分析过,那么就会对整个查询进行基于代价的优化。

使用基于规则的优化器来实现最优化执行,即引导优化器根据优先顺序规则来决定查询条件中所使用到的索引或运算符的执行顺序来制定执行计划。这个提示强制 oracle 优先使用预定义的一组规则,而不是对数据进行统计;同时该提示还会使这个语句避免使用其他提示,除了 DRIVING_SITE 和 ORDERED(不管是否进行基于规则的优化,这两个提示都可使用)。

2
<section>和访问路径相关的</section>
复制代码

告诉优化器通过全表扫描方式访问数据。这个提示只对所指定的表进行全表扫描,而不是查询中的所有表。FULL 提示可以改善性能。这主要是因为它改变了查询中的驱动表,而不是因为全表扫描。在使用其他某些提示时,也必须使用 FULL 提示。只有访问整个表时,才可利用 CACHE 提示将表进行缓存。并行组中的某些提示也必须使用全表扫描。

引导优化器通过扫描聚簇索引来从索引表中读取数据。

引导优化器按照哈希扫描的方式从表中读取数据。

告诉优化器对指定表通过索引的方式访问数据。当访问数据会导致结果集不完整时,优化器将忽略这个 Hint。

告诉优化器对指定表不允许使用索引。这个提示会禁止优化器使用指定索引。可以在删除不必要的索引之前在许多查询中禁止索引。如果使用了 NO_INDEX,但是没有指定任何索引,则会执行全表扫描。如果对某个索引同时使用了 NO_INDEX 和会之产生冲突的提示(如 INDEX),这时两个提示都会被忽略掉。

利用索引从表中读取数据时,引导优化器对提示中所指定索引的索引列值按照升序使用范围扫描。

告诉优化器强制选择位图索引。这个提示会使优化器合并表上的多个位图索引,而不是选择其中最好的索引(这是 INDEX 提示的用途)。还可以使用 index_combine 指定单个索引(对于指定位图索引,该提示优先于 INDEX 提示)。对于 B 树索引,可以使用 AND_EQUAL 提示而不是这个提示。

索引关联,当谓词中引用的列上都有索引的时候,可以通过索引关联的方式来访问数据。这个提示可以将同一个表的各个不同索引进行合并,这样就只需要访问这些索引就可以了,节省了回表查询的时间。但只能在基于代价的优化器中使用该提示。这个提示不仅允许只访问表上的索引,这样可以扫描更少的代码块,并且它比使用索引并通过 rowid 扫描整个表快 5 倍。

利用索引从表中读取数据时,引导优化器对提示中所指定索引的索引列值按照降序使用范围扫描。

告诉优化器以 INDEX FFS(index fast full scan)的方式访问数据。INDEX_FFS 提示会执行一次索引的快速全局扫描。这个提示只访问索引,而不是对应的表。只有查询需要检索的信息都在索引上时,才使用这个提示。特别在表有很多列时,使用该提示可以极大地改善性能。

强制使用 index skip scan 的方式访问索引。当在一个联合索引中,某些谓词条件并不在联合索引的第一列时(或者谓词并不在联合索引的第一列时),可以通过 index skip scan 来访问索引获得数据。当联合索引第一列的唯一值很少时,使用这种方式比全表扫描的方式效率要高。

3
<section>和查询转换相关的</section>
复制代码

将含有多个 OR 或者 IN 运算符所连接起来的查询语句分解为多个单一查询语句,并为每个单一查询语句选择最优化查询路径,然后再将这些最优化查询路径结合在一起,以实现整体查询语句的最优化目的。只有在驱动查询条件中包含 OR 的时候,才可以使用该提示。

引导优化器不要为使用 OR 运算符号(或 IN 运算符)的条件制定相互结合的执行计划。正好和 USE_CONCAT 相反。

当表连接的对象是数据量比较大的表或者需要获得使用统计函数处理过的结果时,为了提高执行速度可预先创建物化视图。当用户要求查询某个查询语句时,优化器会在从表中和从物化视图中读取数据的两种方法中选择一个更有效的方法来读取数据。该执行方法称之为查询重写。使用 REWRITE 提示引导优化器按照该方式执行。

为了能以最优方式从视图或者嵌套视图中读取数据,通过变换查询语句来直接读取视图使用的基表数据,该过程被称之为视图合并。不同的情况其具体使用类型也有所不同。该提示主要在视图未发生合并时被使用。尤其是对比较复杂的视图或者嵌套视图(比如使用了 GROUP BY 或 DISTINC 的视图)使用该提示,有时会取得非常好的效果。

提示优化器将子查询转换为连接的方式。也就是引导优化器合并子查询和主查询并且将其向连接类型转换。

引导优化器让子查询能够独立地执行完毕之后再跟外围的查询做 FILTER。

使用该提示可以将视图或嵌套视图以外的查询条件推入到视图之内。

使用该提示确保视图或嵌套视图以外的查询条件不被推入到视图内部。

使用该提示引导优化器为不能合并的子查询制定执行计划。不能合并的子查询被优先执行之后,该子查询的执行结果将扮演缩减主查询数据查询范围的提供者角色。通常在无法执行子查询合并的情况下,子查询扮演的都是检验者角色,所以子查询一般被放在最后执行。在无法被合并的子查询拥有较少的结果行,或者该子查询可以缩减主查询查询范围的情况下,可以使用该提示引导优化器最大程度地将该子查询放在前面执行,以提高执行速度。但如果子查询执行的是远程表或者排序合并连接的一部分连接结果,则该提示将不起任何作用。

使用该提示将引导优化器将不能实现合并的子查询放在最后执行。在子查询无法缩减主查询的查询范围,或者执行子查询开销较大的情况下,将这样的子查询放在最后执行可以在某种程度上提高整体的执行效率。也就是说,尽可能地使用其他查询条件最大程度地缩减查询范围之后,再执行子查询。

4
<section>和表连接顺序相关的</section>
复制代码

这些提示可以调整表连接的顺序。调整表连接的顺序并不是只能使用这些提示,在嵌套循环连接方式中也可以让提示来引导优化器使用由驱动查询条件所创建的索引。然而,该方法只有在使用的索引和表连接顺序同时被调整的情况下才比较有效。一般而言,这些提示主要在执行多表连接和表之间的连接顺序比较混乱的情况下才使用,也在排序合并连接或哈希连接方式下,为引导优化器优先执行数据量比较少得表时使用。

在一个多表关联的查询中,这个 Hint 指定由哪个表作为驱动表,即告诉优化器首先要访问那个表上的数据。引导优化器使用 LEADING 指定的表作为表连接顺序中的第一个表。该提示既与 FROM 中所描述的表的顺序无关,也与作为调整表连接顺序的 ORDERED 提示不同,并且在使用该提示时并不需要调整 FROM 中所描述的表的顺序。当该提示与 ORDERED 提示同时使用时,该提示被忽略。

这个提示类似 ORDERED 提示,它允许指定驱动查询的表,然后由优化器来判断下一个要访问的表。如果使用这个提示指定多张表,那么就可以忽略这个提示。

引导优化器按照 FROM 中所描述的表的顺序执行连接。如果和 LEADING 提示被一起使用,则 LEADING 提示将被忽略。由于 ORDERED 只能调整表连接的顺序并不能改变表连接的方式,所以为了改变表的连接方式,经常将 USE_NL、USE_MERGE 提示与 ORDERED 提示放在一起使用。

5
<section>和表连接操作相关的</section>
复制代码

使用该提示引导优化器按照嵌套循环连接方式执行表连接。它只是指出表连接的方式,对于表连接顺序不会有任何影响。

引导优化器按照排序合并连接方式执行连接。在有必要的情况下,推荐将该提示与 ORDERED 提示一起使用。提示通常用于获得查询的最佳吞吐量。假设将两个表连接在一起,从每个表返回的行集将被排序,然后再被合并(也就是合并排序),从而组成最终的结果集。由于每个行先被排序之后才进行合并,所以在给定查询中检索所有行时,速度将会最快。如果需要以最快速度返回第一行,就应该使用 USE_NL 提示。

该提示引导优化器按照哈希连接方式执行连接。在执行哈希连接时,如果由于某一边的表比较小,从而可以在内存中实现哈希连接,那么就能够获得非常好的执行速度。由于在大部分情况下优化器会通过对统计信息的分析来决定 Build Input 和 Prove Input,所以建议不要使用 ORDERED 提示随意改变表的连接顺序。但是当优化器没能做出正确判断时,或者像从嵌套视图中所获得的结果集合那样不具备统计信息时,可以使用该提示。

6
<section>和并行相关的</section>
复制代码

指定 SQL 执行的并行度,这个值将会覆盖表自身设定的并行度。如果这个值为 default,CBO 使用系统参数。从表中读取大量数据和执行 DML 操作时使用该提示来指定 SQL 的并行操作。一般情况下需要在该提示中指定将要使用的并行线程个数。如果在该提示中没有指定并行度的个数,则优化器将使用 PARALLEL_THREADS_PER_CPU 参数所指定的值进行自动计算。如果在定义表时指定了 PARALLEL,那么在能够使用并行操作的情况下,即使没有使用该提示,优化器也会按照指定的并行级别选择并行操作。但是如果想在 DELETE、INSERT、UPDATE、MERGE 等 DML 操作中使用并行操作,则必须要在会话中设置 ALTER SESSION ENABLE PARALLEL DML。在某个会话中所设置的并行级别也可以被引用在内部的 GROUP BY 或者排序操作中。在并行操作中如果出现了某个限制要素,则该提示将被忽略。

在 SQL 语句禁止使用并行。在有些版本中用 NO_PARALLEL 提示来代替 NOPARALLEL 提示。

为了提高并行连接的执行速度,使用该提示来定义使用何种方法在主从进程之间(例如生产者进程和消费者进程)分配各连接表的数据行。

为了按照并行操作的方式对分区索引进行索引范围扫描而使用该提示,并且可以指定进程的个数。

7
<section>其他相关的</section>
复制代码

让数据库以直接加载的方式(direct load)将数据加载入库。这个提示不会检查当前是否有插入所需要的块空间,相反它会直接将数据添加到新块中。这样会浪费空间,但可以提高插入的性能。需要注意的是,数据将被存储在 HWM 之上的位置。

在 11.2 中,Oracle 新增了 APPEND_VALUES 提示,使得 INSERT INTO VALUES 语句也可以使用直接路径插入。

在全表扫描之后,数据块将留在 LRU 列表的最活跃端。如果设置表的 CACHE 属性,它的作用和 HINT 一样。这个提示会将全表扫描全部缓存到内存中。如果表很大,会占用大量内存。因此适用于用户经常访问的较小的表。

引导优化器将通过全表扫描方式获取的数据块缓存在 LRU 列表的最后位置,这样可以让数据库实例缓存中的这些数据块被优先清除。这是优化器在 Buffer Cache 中管理数据块的默认方法(仅针对全表扫描)。

使用该提示为查询语句块命名,在其他查询语句块可以直接使用该查询语句块的名称。

这个提示在分布式数据库操作中有用。指定表是处理连接所在的位置。可以限制通过网络处理的信息量。此外,还可以建立远程表的本地视图来限制从远程站点检索的行。本地视图应该有 where 子句,从而视图可以在将行发送回本地数据库之前限制从远程数据库返回的行。

提示 SQL 执行时动态采样的级别。这个级别为 0~10,它将覆盖系统默认的动态采样级别。等级越高,所获得统计信息的准确率越高。该提示的功能就是为了确保将动态采样原理应用在单个 SQL 中。

这个提示会使优化器合并表上的多个索引,而不是选择其中最好的索引(这是 INDEX 提示的用途)。这个提示与前面的 INDEX_JOIN 提示有区别,以此指定的合并索引随后需访问表,而 INDEX_JOIN 提示则只需访问索引。如果发现需经常用到这个提示,可能需要删除这些单个索引而改用一个组合索引。需要查询条件里面包括所有索引列,然后取得每个索引中得到的 rowid 列表。然后对这些对象做 merge join,过滤出相同的 rowid 后再去表中获取数据或者直接从索引中获得数据。在 10g 中,and_equal 已经废弃了,只能通过 hint 才能生效。

向优化器提供对某个查询语句的整体或部分的预测基数值,并通过参考该基数值来为查询语句制定执行计划。如果在该提示中没有指定表的名称,则该基数值将被视为从该查询语句所获得的最终结果行数。

**四、Hint使用示例**

下面通过一个例子说明一下提示的使用及在什么情况下提示会被忽略。

(1).构建表

(2).使用 INDEX 提示

*在某些情况下,如果 CBO 认为 Hint 会导致错误结果,那么 Hint 则会忽略。该例子中因为 ID 字段可能为空,而索引是保存空值的,因此 count(*)使用索引将导致错误的结果,故而使用了全表扫描,忽略了 Hint。

(3).使用 INDEX 提示(非空字段)

*ID 字段不可为空,因此 COUNT 可用索引扫描的方式处理,Hint 生效了。

原文链接:

声明:本文来自用户分享和网络收集,仅供学习与参考,测试请备份。