一、什么是AVL树
1、AVL树的概念
二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查 找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii 和E.M.Landis在1962年 发明了一种解决上述问题的方法:
当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。
一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:
- 它的左右子树都是AVL树
- 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在O(log_2 n),搜索时间复杂度O(log_2 n)。
2. 平衡因子
平衡因子为结点左右子树的高度差,本文假设平衡因子(bf)=右子树高度-左子树高度
在AVL树中每个结点的平衡因子都是大于等于-1,小于等于1的
二、AVL树的实现
1.AVL树结点结构
template<class K, class V>
struct AVLTreeNode
{struct AVLTreeNode* _left;struct AVLTreeNode* _right;struct AVLTreeNode* _parent; //_parent是为了后续旋转调整方便pair<K, V> _kv;//结点数据int _bf; //平衡因子AVLTreeNode(const pair<K, V>& kv):_left(nullptr), _right(nullptr), _parent(nullptr), _kv(kv), _bf(0){}
};
2.AVL树的插入
插入流程:
1. 先将结点按二叉搜索树的规则‘’插入AVL树
2. 更新插入结点祖先的平衡因子
a.如果插入到父亲结点的左边,平衡因子- -
b.如果插入到父亲结点的右边,平衡因子++
c.如果父亲的平衡因子==0,说明父亲结点原来的平衡因子一定为1或-1,插入后父亲结点达 到平衡,没有改变高度,插入成功,不需要向上改变祖先的平衡因子
d.如果父亲的平衡因子为1或-1,说明父亲结点原来的平衡因子一定为0,插入结点后改变了 树的高度,此时需要向上调整祖先结点的平衡因子
e.如果父亲的平衡因子为2或-2,说明此时不平衡了,需要旋转调整
三、AVL树的旋转
1. 新节点插入较高左子树的左侧---左左:右单旋
if (parent->_bf == -2 && cur->_bf == -1)
//纯粹的左边高
// *
// *
// *
让parent的左指向subLR,如果subLR不为空,更新subLR的父亲结点,让subL的右指向parent,并更新parent与subL的父亲结点,注意parrent结点可能是根节点也可能是一个子树结点,更新subL的父亲节点需要分类讨论。旋转完后,树达到平衡,将parent和subL的平衡因子置为0
void RotateR(Node *parent)
{Node *SubL = parent->_left;Node *SubLR = SubL->_right;parent->_left = SubLR;if (SubLR)SubLR->_parent = parent;SubL->_right = parent;Node *ppNode = parent->_parent;parent->_parent = SubL;if (parent == _root){_root = SubL;SubL->_parent = nullptr;}else{if (ppNode->_left == parent){ppNode->_left = SubL;}else{ppNode->_right = SubL;}SubL->_parent = ppNode;}parent->_bf = SubL->_bf = 0;
}
2. 新节点插入较高右子树的右侧---右右:左单旋
if (parent->_bf == 2 && cur->_bf == 1)
//纯粹的右边高
// *
// *
// *
与右单旋相类似,让parent的右指向subRL,如果subRL不为空更新subRL的父亲节点,让subR的左指向parent,并更新parent和sunR的父亲节点
void RotateL(Node* parent)
{Node* SubR = parent->_right;Node* SubRL = SubR->_left;parent->_right = SubRL;if (SubRL)SubRL->_parent = parent;SubR->_left = parent;Node* ppNode = parent->_parent;parent->_parent = SubR;if (parent == _root){_root=SubR;SubR->_parent = nullptr;}else{if (ppNode->_left == parent){ppNode->_left = SubR;}else{ppNode->_right = SubR;}SubR->_parent = ppNode;}parent->_bf = SubR->_bf = 0;
}
3. 新节点插入较高左子树的右侧---左右:先左单旋再右单旋
if (parent->_bf == -2 && cur->_bf == 1)
//parent结点的左树高,而cur结点的右树高
// *
// *
// *
先以subL为父亲结点进行左单旋,变为纯粹的左边高,再以parent为父亲结点进行右单旋调整,最后调整结点的平衡因子
平衡因子处理分析:
这种情况只有将结点插入到b树或c树后面才会进行左右旋,而左右旋只改变了parent、subL、subLR结点的左右子树,左旋是将b树给了subL结点,右旋是将c树给了parent结点,subLR作为处理树的根结点,故subLR的平衡因子最终为0,所以parent与subL结点平衡因子的关键就是插入结点插入到了b树下还是c树下
- 如果插入到b树下:subL结点左右子树高度相同,bf=0,parent结点的右子树比左子树高1,bf=1
- 如果插入到c树下:parent结点左右子树高度相同,bf=0,subL结点的左子树比右子树高1,bf=-1
void RotateLR(Node* parent)
{Node* SubL = parent->_left;Node* SubLR = SubL->_right;int bf = SubLR->_bf;RotateL(SubL);RotateR(parent);if (bf == -1){SubL->_bf = 0;SubLR->_bf = 0;parent->_bf = 1;}else if (bf == 1){SubL->_bf = -1;SubLR->_bf = 0;parent->_bf = 0;}else if (bf == 0){SubL->_bf = 0;SubLR->_bf = 0;parent->_bf = 0;}else{assert(false);}
}
4. 新节点插入较高右子树的左侧---右左:先右单旋再左单旋
if (parent->_bf == 2 && cur->_bf == -1)
//parent结点的右树高,而cur结点的左树高
// *
// *
// *
先以subR为父亲结点进行右单旋,变为纯粹的右边高,再以parent为父亲结点进行左单旋调整,最后调整结点的平衡因子
- 如果插入到c树下:subR结点左右子树高度相同,bf=0,parent结点的左子树比右子树高1,bf=-1
- 如果插入到b树下:parent结点左右子树高度相同,bf=0,subR结点的右子树比左子树高1,bf=-1
void RotateRL(Node* parent)
{Node* SubR = parent->_right;Node* SubRL = SubR->_left;int bf = SubRL->_bf;RotateR(SubR);RotateL(parent);if (bf == -1){SubR->_bf = 1;SubRL->_bf = 0;parent->_bf = 0;}else if (bf == 1){SubR->_bf = 0;SubRL->_bf = 0;parent->_bf = -1;}else if (bf == 0){SubR->_bf = 0;SubRL->_bf = 0;parent->_bf = 0;}else{assert(false);}
}
AVL树插入代码:
bool Insert(const pair<K, V>& kv)
{if (_root == nullptr){_root = new Node(kv);return true;}Node* parent = nullptr;Node* cur = _root;while (cur){if (cur->_kv.first < kv.first){parent = cur;cur = cur->_right;}else if (cur->_kv.first > kv.first){parent = cur;cur = cur->_left;}else{return false;}}cur = new Node(kv);if (parent->_kv.first < kv.first){parent->_right = cur;}else{parent->_left = cur;}cur->_parent = parent;//更新平衡因子while (parent){if (cur == parent->_left){parent->_bf--;}else{parent->_bf++;}if (parent->_bf == 0) // 1 -1 -> 0{//更新结束break;}else if (parent->_bf == 1 || parent->_bf == -1) // 0 -> 1 -1{// 继续往上更新cur = parent;parent = parent->_parent;}else if (parent->_bf == 2 || parent->_bf == -2) // 1 -1 -> 2 -2{// 当前子树出问题了,需要旋转平衡一下if (parent->_bf == -2 && cur->_bf == -1){RotateR(parent);}else if (parent->_bf == 2 && cur->_bf == 1){RotateL(parent);}else if (parent->_bf == 2 && cur->_bf == -1){RotateRL(parent);}else if (parent->_bf == -2 && cur->_bf == 1){RotateLR(parent);}break;}else{// 理论而言不可能出现这个情况assert(false);}}return true;
}
五、AVL树的验证
AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:
1. 验证其为二叉搜索树
如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
2. 验证其为平衡树
- 每个节点子树高度差的绝对值不超过1
- 节点的平衡因子是否计算正确
bool _Is_Balance(Node* root)
{if (root == nullptr){return true;}int LeftHeight = _Height(root->_left);int RightHeight = _Height(root->_right);if (abs(LeftHeight - RightHeight >1)){cout<<"1:" << root->_kv.first << endl;return false;}if (RightHeight - LeftHeight != root->_bf){cout <<"2:" << root->_kv.first << endl;cout << root->_parent->_kv.first << endl;cout << root->_bf << endl;return false;}return _Is_Balance(root->_left) && _Is_Balance(root->_right);
}
六、AVL树的性能
AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即$log_2 (N)$。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。