C语言中的二叉树和堆详解
作者:杯浅
前言
树形结构指的是数据元素之间存在着“一对多”的树形关系的数据结构,是一类重要的非线性数据结构,本篇重点讲解它。
一、什么是树(Tree):
1.树的基本概念:
树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
我们先来看一张图来试着了解树形结构:
我们可以看到,每个结点不断往下有一个或多个结点,就像树的树枝一样,树形结构像是倒过来的树。
- 有一个特殊的结点,称为根结点,根节点没有前驱结点
- 除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
- 因此,树是递归定义的。
2.树的相关概念:
我们再来了解一些基本名词概念:
3.树的表示方法:
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既要保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
typedef int DataType; struct Node { struct Node* _firstChild1; //第一个孩子结点 struct Node* _pNextBrother; //指向其下一个兄弟结点 DataType _data; //结点中的数据域 };
二、二叉树:
1.基本概念及结构:
一棵二叉树是结点的一个有限集合,该集合:
- 由一个根节点加上两棵别称为左子树和右子树的二叉树组成
- 或者为空
从上图可以看出:
- 二叉树不存在度大于2的结点
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
2.特殊的二叉树类型:
- 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是 ,则它就是满二叉树。
- 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
3.二叉树的性质:
- 若规定根节点的层数为1,则一棵非空二叉树的第i层上最多有2^(i-1)个结点.
- 若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h - 1.
- 对任何一棵二叉树, 如果度为0其叶结点个数为n0, 度为2的分支结点个数为n2,则有 n0=n2+1
- 若规定根节点的层数为1,具有n个结点的满二叉树的深度,h= log2(n+1). (ps: log2(n+1)是log以2为底,n+1为对数)
- 对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
- 1.若i>0,i位置节点的双亲序号:(i-1)/2;i=0,无双亲节点
2. 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
3. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
- 1.若i>0,i位置节点的双亲序号:(i-1)/2;i=0,无双亲节点
4.二叉树的存储结构:
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
- 顺序存储:顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
- 链式存储:二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点的左孩子和右孩子所在的链结点的存储地址,链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链。
typedef int BTDataType; // 二叉链 struct BinaryTreeNode { struct BinTreeNode* _pLeft; //指向当前节点左孩子 struct BinTreeNode* _pRight; //指向当前节点右孩子 BTDataType _data; //当前节点值域 } // 三叉链 struct BinaryTreeNode { struct BinTreeNode* _pParent; //指向当前节点的双亲 struct BinTreeNode* _pLeft; //指向当前节点左孩子 struct BinTreeNode* _pRight; //指向当前节点右孩子 BTDataType _data; //当前节点值域 };
5.二叉树的遍历:
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历(Traversal)是按照某种特定的规则,依次对二叉树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序/中序/后序的递归结构遍历:
- 前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。
- 中序遍历(InorderTraversal)——访问根结点的操作发生在遍历其左右子树之中间。
- 后序遍历(PostorderTraversal)——访问根结点的操作发生在遍历其左右子树之后。
void PreOrder(BTNode* root)//前序遍历 { if (root == NULL) { printf("# ");//为空打印# return; } printf("%d ", root->data); PreOrder(root->left); PreOrder(root->right); } void InOrder(BTNode* root)//中序遍历 { if (root == NULL) { printf("# ");//为空打印# return; } InOrder(root->left); printf("%d", root->data); InOrder(root->right); } void PostOrder(BTNode* root)//后序遍历 { if (root == NULL) { printf("# ");//为空打印# return; } PostOrder(root->left); PostOrder(root->right); printf("%d ", root->data); }
三、堆:
1.基本概念及结构:
如果有一个集合它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足: 每个节点的值总是不大于或不小于其父节点的值; 将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。 堆的性质:
- 堆中某个节点的值总是不大于或不小于其父节点的值;
- 堆总是一棵完全二叉树
2.堆的实现:
- 向下调整算法:
我们可以把一个数组从逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提:左右子树必须是一个堆,才能调整。
- 堆的创建:
我们可以把一个数组从逻辑上看做一颗完全二叉树,叶子节点可以看为是一个堆,所以从最后一个非叶子节点开始依次向前进行向下调整算法既可创建一个堆。
代码演示:
void HeapInit(Heap* ph)//堆的初始化 { assert(ph); ph->arr = NULL; ph->capacity = ph->size = 0; } void HeapDestroy(Heap* ph)//堆的销毁 { assert(ph); free(ph->arr); ph->arr = NULL; ph->size = ph->capacity = 0; } void Swap(HeapDataType* child, HeapDataType* parent)//交换堆数组内容 { HeapDataType tmp = *child; *child = *parent; *parent = tmp; } void AdjustUp(int* arr, int child)//向上调整函数 { while (child > 0) { int parent = (child - 1) / 2; if (arr[parent] > arr[child]) { Swap(&arr[child], &arr[parent]);//交换堆数组内容 child = parent; } else { break; } } } void HeapPush(Heap* ph, HeapDataType x)//插入数据 { assert(ph); if (ph->capacity == ph->size) { int newcapacity = ph->capacity = 0 ? 4 : ph->capacity * 2; HeapDataType* tmp = (HeapDataType*)realloc(ph->arr, sizeof(HeapDataType) * newcapacity); if (tmp == NULL) { perror("malloc"); exit(-1); } ph->arr = tmp; ph->capacity = newcapacity; } ph->arr[ph->size] = x; ph->size++; AdjustUp(ph->arr, ph->size - 1);//向上调整函数 } void AdjustDown(HeapDataType* arr, int size, int parent)//向下调整函数 { int child = parent * 2 + 1; while (child < size) { if (child + 1 < size && arr[child] > arr[child + 1]) { child++; } if (arr[parent] > arr[child]) { Swap(&arr[parent], &arr[child]); parent = child; child = parent * 2 + 1; } else { break; } } } void HeapPop(Heap* ph)//堆的删除 { assert(ph); assert(!HeapEmpty(ph)); Swap(&ph->arr[0], &ph->arr[ph->size - 1]); ph->size--; AdjustDown(ph->arr, ph->size, 0);//向下调整函数 } HeapDataType HeapTop(Heap* ph)//返回堆顶元素 { assert(ph); assert(!HeapEmpty(ph)); return ph->arr[0]; } bool HeapEmpty(Heap* ph)//堆的判空 { assert(ph); return ph->size == 0; } int HeapSize(Heap* ph)//返回堆中元素个数 { assert(ph); return ph->size; } void HeapPrint(Heap* ph)//打印堆中数据 { assert(ph); assert(!HeapEmpty(ph)); for (int i = 0; i < ph->size; i++) { printf("%d ", ph->arr[i]); } printf("\n"); }
- 堆排序:
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
原理:例如排升序建大堆,即堆顶元素为序列最大值,例如堆尾元素下标为end,将堆顶元素与堆尾元素交换让最大值到堆尾,然后end-1,再向下调整继续交换,以此类推,最后end=0排序结束
void HeapSort(int* arr, int sz) { int end1 = (sz - 1 - 1) / 2;//求最后一个节点的父节点,这个父节点即最后一个非叶子节点 for (int i = end1; i >= 0; i--) { AdjustDown(arr, sz, i); } //开始排序 //升序 -- 用大堆 //降序 -- 用小堆 int end2 = sz - 1; while (end2 > 0) { Swap(&arr[0], &arr[end2]); AdjustDown(arr, end2, 0); end2--; } for (int i = 0; i < sz; i++) { printf("%d ", arr[i]); } }
到此这篇关于C语言中的二叉树和堆详解的文章就介绍到这了,更多相关二叉树和堆内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!