互联网技术 / 互联网资讯 · 2023年12月7日 0

底层原理:Explain执行计划解析

底层原理:Explain执行计划解析

本节将介绍 Explain 的用法要点与参数要点,帮助你快速掌握执行计划的获取与解读。

Hive 提供了 EXPLAIN 命令,用于展示查询的执行计划。通过查看执行计划,可以理解底层执行逻辑、进行性能调优以及排查数据倾斜等问题。

使用语法如下:

EXPLAIN [EXTENDED|CBO|AST|DEPENDENCY|authorization|LOCKS|VECTORIZATION|ANALYZE] query

ExplAIn 后面可以跟以下可选参数,注意:这几个可选参数不是 Hive 的每个版本都支持

在 Hive CLI 中输入以下命令(Hive 2.3.7):

EXPLAIN select SUM(id) FROM test1;

得到结果(请逐行阅读,即使不完全理解,也请逐行查看):

阶段依赖:Stage-1 是根阶段,Stage-0 依赖于 Stage-1。

执行计划要点:Stage-1、MapReduce、Map 操作树、TableScan;别名 test1。

统计信息:Num Rows: 6;数据大小: 75;基础统计: COMPLETE;列统计: NONE。

选择操作符:表达式 id(类型:int),输出列名:id;统计信息:Num Rows: 6;数据大小: 75;基础统计: COMPLETE;列统计: NONE。