这篇博客讲的不是按像素计算的图片或者摄影摄像的构图,而是节点与节点之间有边、边上有权值的图,如何把这样的一张图存入计算机中。这里将介绍三种较为常用的构图方式:邻接矩阵、vector 数组和链式前向星构图。
首先要弄清楚的一点是,计算机存图,存的是什么?包含两部分:节点和边,每个节点都有自己相应的信息,例如在一个战争时期军人的调度问题,每个城池拥有的军人数量,或者染色问题上节点的颜色等等,这些就是节点上的信息。每条边上的信息就比如说是路程、路费,从这个节点出发的目标节点等等。一般来说节点和边是要分两个结构体Node 和Edge 来存的,但是很多题目基本上只有边的信息,节点基本没有信息,所以有时候可以不用写节点的结构体,如果边没有权值等其他信息,只需要知道一条边连接的是哪两个节点,连边的结构体也不用写了。这里只讨论有向图的一般情况。
邻接矩阵构图
无权图
邻接矩阵用第uu 行第
v " role="presentation"> 列为11 表示从u " role="presentation"> 到vv 有一条边,用0 " role="presentation"> 表示从uu 到v " role="presentation"> 没有直接相连的边。有权图
先设定一个无穷大数∞∞,则用第uu 行第
v " role="presentation"> 列为一非无穷大数值weightweight 表示从uu 到v " role="presentation"> 之间,边的权值为weightweight ,为一无穷大数∞∞ 则表示从uu 到v " role="presentation"> 没有直接相连的边或者不可达。在图没有经过任何处理的情况下,∞∞ 表示“无直接相连的边”,如果已经处理出全图的最短路径,则∞∞ 表示“不可达”,故可以根据处理出全图最短路径后的图是否存在∞∞ 的边来判断全图是否连通,当然判断连通图有更快的并查集的做法,不推荐上面这种方法来判断图的连通性。
图上加边代码
struct Edge { int weight;// 权值};Edge G[maxn][maxn];void add(int u, int v, int w) { G[u][v].weight = w;}
遍历uu 点的目标节点代码
void traversal(int u) {for(int i = 0; i < n; ++i) { // n 为图上实际节点数visit(G[u][i]);}}
邻接矩阵性质
初始状态下,第u " role="presentation"> 行所有非0/∞0/∞ 的列所对应的节点,即从uu 出发能够到达的所有节点,其数量即u " role="presentation"> 的出度,第vv 列所有非0 / ∞ " role="presentation"> 的行对应的节点,即能够到达vv 的所有节点,其数量即v " role="presentation"> 的入度。 如果整张图有nn 个节点,则邻接矩阵构图的空间复杂度为O ( n 2 ) " role="presentation"> ,在图上宽搜和深搜的时间复杂度都为O(n2)O(n2)。这种构图方式适用的算法:floyd 多源最短路径算法,该算法的时间复杂度为O(n3)O(n3),编程难度较低,适用于图上节点数200 以下的图。除了需要用floyd 查找多源最短路径,其他情况均不推荐这种构图方式。vector 数组构图
数据结构课本上提到过邻接链表构图,大意如下:
先定义一个链表数组,该数组下标对应图上所有节点,如果节点uu 添加一条到
v " role="presentation"> 的边,则在数组第uu 个链表后面添加一条指向v " role="presentation"> 节点的边。对于图
如果加边顺序如下(u v w):
[AE45][AB3][BE40][CA21][AC20][BC15][DB20][DE35][ED30][CD20][AE45][AB3][BE40][CA21][AC20][BC15][DB20][DE35][ED30][CD20]
其邻接矩阵表示为:
G[A]−>[E45]−>[B3]−>[C20]−>NULLG[A]−>[E45]−>[B3]−>[C20]−>NULL
G[B]−>[E40]−>[C15]−>NULLG[B]−>[E40]−>[C15]−>NULL
G[C]−>[A21]−>[D20]−>NULLG[C]−>[A21]−>[D20]−>NULL
G[D]−>[B20]−>[E35]−>NULLG[D]−>[B20]−>[E35]−>NULL
G[E]−>[D30]−>NULLG[E]−>[D30]−>NULL
可以看到,图上有多少条边,就只需要多少内存,不会像邻接矩阵那样有大量的空间浪费。
C++ 的STL 为我们提供了强大的容器类,使得我们不必手打链表、可变长数组等,所以我们可以直接用已经写好的类。但是为什么用vector 而不用list 呢?因为在算法题中时间是很重要的,动态开辟内存会带来很大的时间开销,因此我们更经常用vector 数组来代替链表数组,以节约时间上的开销。
图上加边代码
struct Edge {int weight; // 权值int to; // 终点节点下标Edge(int w, int t) {weight = w;to = t;}Edge() {}};vector<Edge> G[maxn];void add(int u, int v, int w) {G[u].push_back(Edge(w, v));}
遍历uu 点的目标节点代码
void traversal(int u) {int len = G[u].size();for(int i = 0; i < len; ++i) {visit(G[u][i]);}}
vector 数组性质
G[u].size() 即节点u " role="presentation"> 的出度,想要求节点vv 的入度时间复杂度为O ( e ) " role="presentation"> ,ee 为图上所有边的数量,如果需要建议在建图的时候就用一个d e g i n " role="presentation"> 辅助数组来存放所有节点的入度。 边的存储顺序与加边顺序有关如果图上有ee 条边,vector 数组的空间复杂度为O ( e ) " role="presentation"> ,宽搜和深搜的时间复杂度都为O(e)O(e),其他算法的时间复杂度由算法的优化程度决定,vector 数组构图不会增加算法的时间复杂度。vector 数组构图代码较短效率较高,推荐使用该方式。链式前向星构图
在链式前向星之前还有一种叫前向星的构图方式,该方法在加完所有边后还需要进行一次排序,时间复杂度为O(eloge)O(eloge),其中ee 为图上所有边的数量,链式前向星是该方式的改进,这里不展开讨论。
链式前向星将所有边存在一个Edge 数组中,并在边上加了一个next 数据成员,表示与该边同起点的下一条边、在该数组中的下标。是的,链式前向星存的边并不是连续的,并不是将同起点的所有边存在一起,而是像链表一样,在一条边中存着下一条边的地址(数组下标)。
那么在所有的边中,怎么找到最开始的那条边呢?这里需要一个head 数组,来存放所有相同起点的第一条边所在下标,为代码简洁明了,实际上head 数组存放的是:当前起点最后添加进去的边的下标,而边的next 数据成员,指向的是:在加这条边之前,最后加进去的一条边的下标(也就是head 数组对应的值),而这个下标必然是小于当前边的下标的,所以next 数据成员实际上存放的是比当前边的下标更小的值,也就是“向前指向下一条边”,而存储边的方式又是链式的,链式前向星就是这个意思。
而最先加入的那一条边指向的下标是-1,所以head 数组应初始化为-1。
如果可以知道边的数量(一般题目会给边的数量的范围),更建议用边数组的写法,而不是vector 可变长数组,因为动态开辟空间的速度不如在静态全局区申请快。
图上加边代码
memset(head, -1, sizeof(head)); // main 函数中的预处理struct Edge {int weight; // 权值int to; // 终点节点下标int next; // 下一条边的下标Edge(int w, int t, int n) {weight = w;to = t;next = n;}Edge() {}};// vector 写法vector<Edge> E;int head[maxn];void add(int u, int v, int w) {E.push_back(Edge(w, v, head[u]));head[u] = E.size() - 1;}// 定长数组写法Edge E[maxm]; // maxm 为题目给定的最多的边数int head[maxn];int cnt;void add(int u, int v, int w) {E[cnt].weight = w;E[cnt].to = v;E[cnt].next = head[u];head[u] = cnt++;}
遍历
u " role="presentation"> 点的目标节点代码
void traversal(int u) {for(int i = head[u]; i != -1; i = E[i].next) {visit(E[i]);}}
链式前向星性质
图上所有点的入度与出度需要用另外的数组来维护,如果在解题过程中需要对节点进行排序,请将head、deg 数组作为Node 结构体的数据成员。链式前向星是速度最快的存图方式,代码量相比于vector 数组稍长四五行,但也有一些弊端:如果不能事先知道图上边最多有多少条,就要按照完全图开数组或者用vector,在这一点上空间的浪费相比于vector 数组要大。其他性质与vector 数组第2、3 点相同。