底层原理:Explain执行计划解析
本节将介绍 Explain 的用法要点与参数要点,帮助你快速掌握执行计划的获取与解读。
Hive 提供了 EXPLAIN 命令,用于展示查询的执行计划。通过查看执行计划,可以理解底层执行逻辑、进行性能调优以及排查数据倾斜等问题。
使用语法如下:
EXPLAIN [EXTENDED|CBO|AST|DEPENDENCY|authorization|LOCKS|VECTORIZATION|ANALYZE] query
ExplAIn 后面可以跟以下可选参数,注意:这几个可选参数不是 Hive 的每个版本都支持
在 Hive CLI 中输入以下命令(Hive 2.3.7):
EXPLAIN select SUM(id) FROM test1;
得到结果(请逐行阅读,即使不完全理解,也请逐行查看):
阶段依赖:Stage-1 是根阶段,Stage-0 依赖于 Stage-1。
执行计划要点:Stage-1、MapReduce、Map 操作树、TableScan;别名 test1。
统计信息:Num Rows: 6;数据大小: 75;基础统计: COMPLETE;列统计: NONE。
选择操作符:表达式 id(类型:int),输出列名:id;统计信息:Num Rows: 6;数据大小: 75;基础统计: COMPLETE;列统计: NONE。
