拓扑排序

定义

拓扑排序的英文名是 Topological sorting。

拓扑排序要解决的问题是给一个有向无环图的所有节点排序。

我们可以拿大学每学期排课的例子来描述这个过程，比如学习大学课程中有：「程序设计」，「算法语言」，「高等数学」，「离散数学」，「编译技术」，「普通物理」，「数据结构」，「数据库系统」等。按照例子中的排课，当我们想要学习「数据结构」的时候，就必须先学会「离散数学」，学习完这门课后就获得了学习「编译技术」的前置条件。当然，「编译技术」还有一个更加前的课程「算法语言」。这些课程就相当于几个顶点 , 顶点之间的有向边就相当于学习课程的顺序。教务处安排这些课程，使得在逻辑关系符合的情况下排出课表，就是拓扑排序的过程。

topo

但是如果某一天排课的老师打瞌睡了，说想要学习数据结构，还得先学操作系统，而操作系统的前置课程又是数据结构，那么到底应该先学哪一个（不考虑同时学习的情况）？在这里，数据结构和操作系统间就出现了一个环，显然同学们现在没办法弄清楚自己需要先学什么了，也就没办法进行拓扑排序了。因为如果有向图中存在环路，那么我们就没办法进行拓扑排序。

因此我们可以说在一个 DAG（有向无环图）中，我们将图中的顶点以线性方式进行排序，使得对于任何的顶点到的有向边 , 都可以有在的前面。

还有给定一个 DAG，如果从到有边，则认为依赖于。如果到有路径（可达），则称间接依赖于。

拓扑排序的目标是将所有节点排序，使得排在前面的节点不能依赖于排在后面的节点。

AOV 网

日常生活中，一项大的工程可以看作是由若干个子工程组成的集合，这些子工程之间必定存在一定的先后顺序，即某些子工程必须在其他的一些子工程完成后才能开始。

我们用有向图来表现子工程之间的先后关系，子工程之间的先后关系为有向边，这种有向图称为顶点活动网络，即 AOV 网 (Activity On Vertex Network)。一个 AOV 网必定是一个有向无环图，即不带有回路。与 DAG 不同的是，AOV 的活动都表示在边上。（上面的例图即为一个 AOV 网）

在 AOV 网中，顶点表示活动，弧表示活动间的优先关系。AOV 网中不应该出现环，这样就能够找到一个顶点序列，使得每个顶点代表的活动的前驱活动都排在该顶点的前面，这样的序列称为拓扑序列（一个 AOV 网的拓扑序列不是唯一的），由 AOV 网构造拓扑序列的过程称为拓扑排序。因此，拓扑排序也可以解释为将 AOV 网中所有活动排成一个序列，使得每个活动的前驱活动都排在该活动的前面（一个 AOV 网中的拓扑排序也不是唯一的）。

前驱活动：有向边起点的活动称为终点的前驱活动（只有当一个活动的前驱全部都完成后，这个活动才能进行）。
后继活动：有向边终点的活动称为起点的后继活动。

检测 AOV 网中是否带环的方式是构造拓扑序列，看是否包含所有顶点。

构造拓扑序列步骤

从图中选择一个入度为零的点。
输出该顶点，从图中删除此顶点及其所有的出边。

重复上面两步，直到所有顶点都输出，拓扑排序完成，或者图中不存在入度为零的点，此时说明图是有环图，拓扑排序无法完成，陷入死锁。

关键路径和 AOE 网

与 AOV 网对应的是 AOE 网（Activity On Edge Network) 即边表示活动的网。AOE 网是一个带权的有向无环图，其中，顶点表示事件，弧表示活动持续的时间。通常，AOE 网可以用来估算工程的完成时间。AOE 网应该是无环的，且存在唯一入度为零的起始顶点（源点），以及唯一出度为零的完成顶点（汇点）。

topo

AOE 网中的有些活动是可以并行进行的，所以完成整个工程的最短时间是从开始点到完成点的最长活动路径长度（这里所说的路径长度是指路径上各活动的持续时间之和，即弧的权值之和，不是路径上弧的数目）。因为一项工程需要完成所有工程内的活动，所以最长的活动路径也是关键路径，它决定工程完成的总时间。

AOE 网的相关基本概念

活动：AOE 网中，弧表示活动。弧的权值表示活动持续的时间，活动在事件被触发后开始。
事件：AOE 网中，顶点表示事件，事件能被触发。
弧（活动）的最早开始时间：初始点到该弧起点的最长路径长度，记为。
弧（活动）的最迟开始时间：在不推迟整个工期的前提下，工程达到弧起点所表示的状态最晚能容忍的时间，记为。
顶点（事件）的最早发生时间：初始点到该顶点的最长路径长度，记为，它决定了以该顶点开始的活动的最早发生时间，所以。
顶点（事件）的最迟发生时间：在不推迟整个工期的前提下，工程达到顶点所表示的状态最晚能容忍的时间，记为，它决定了所有以该状态结束的活动的最迟发生时间，所以。
关键路径：AOE 网中从源点到汇点的最长路径的长度。
关键活动：关键路径上的活动，最早开始时间和最迟开始时间相等。

最早和最迟发生时间的递推关系

ve(j) = \max\{ve(k) + dut(\langle k,j\rangle)\},\quad \langle k,j\rangle \in T,2\le j\le n

vl(j) = \min\{vl(k) - dut(\langle j,k\rangle)\},\quad \langle j,k\rangle \in S,1\le j\le n-1

按拓扑顺序求，最早是从前往后，前驱顶点的最早开始时间与边的权重之和最大者，最迟是从后往前，后继顶点的最迟开始时间与边的权重之差的最小者。

关键路径算法

输入条弧，建立 AOE 网；
从源点出发，令 , 按照拓扑排序求其余各个顶点的最早发生时间 $ve[i],~(i \le i \le n-1)$ 。如果得到的拓扑有序序列中顶点的个数小于网中的顶点数，则说明网中存在环，不能求关键路径，算法终止；否则执行步骤 3；
从汇点出发，令，按照逆拓扑有序求其余各顶点的最迟发生时间 $vl[i],~(n-2 \ge i \ge 2)$ ;
根据各顶点的和值，求每条弧的最早开始时间和最迟开始时间。若某条弧满足条件 , 则为关键活动。

Kahn 算法

过程

初始状态下，集合装着所有入度为的点，是一个空列表。

每次从中取出一个点（可以随便取）放入 , 然后将的所有边 $(u, v_1), (u, v_2), (u, v_3) \cdots$ 删除。对于边，若将该边删除后点的入度变为，则将放入中。

不断重复以上过程，直到集合为空。检查图中是否存在任何边，如果有，那么这个图一定有环路，否则返回，中顶点的顺序就是构造拓扑序列的结果。

首先看来自 Wikipedia 的伪代码

实现

L ← Empty list that will contain the sorted elements
S ← Set of all nodes with no incoming edges
while S is not empty do
    remove a node n from S
    insert n into L
    for each node m with an edge e from n to m do
        remove edge e from the graph
        if m has no other incoming edges then
            insert m into S
if graph has edges then
    return error (graph has at least one cycle)
else
    return L (a topologically sorted order)

代码的核心是维持一个入度为 0 的顶点的集合。

可以参考该图

topo

对其排序的结果就是：2 -> 8 -> 0 -> 3 -> 7 -> 1 -> 5 -> 6 -> 9 -> 4 -> 11 -> 10 -> 12

时间复杂度

假设这个图在初始化入度为的集合的时候就需要遍历整个图，并检查每一条边，因而有的复杂度。然后对该集合进行操作，显然也是需要的时间复杂度。

因而总的时间复杂度就有

实现

int n, m;
vector<int> G[MAXN];
int in[MAXN];  // 存储每个结点的入度

bool toposort() {
  vector<int> L;
  queue<int> S;
  for (int i = 1; i <= n; i++)
    if (in[i] == 0) S.push(i);
  while (!S.empty()) {
    int u = S.front();
    S.pop();
    L.push_back(u);
    for (auto v : G[u]) {
      if (--in[v] == 0) {
        S.push(v);
      }
    }
  }
  if (L.size() == n) {
    for (auto i : L) cout << i << ' ';
    return true;
  } else {
    return false;
  }
}

DFS 算法

实现

C++Python

using Graph = vector<vector<int>>;  // 邻接表

struct TopoSort {
  enum class Status : uint8_t { to_visit, visiting, visited };

  const Graph& graph;
  const int n;
  vector<Status> status;
  vector<int> order;
  vector<int>::reverse_iterator it;

  TopoSort(const Graph& graph)
      : graph(graph),
        n(graph.size()),
        status(n, Status::to_visit),
        order(n),
        it(order.rbegin()) {}

  bool sort() {
    for (int i = 0; i < n; ++i) {
      if (status[i] == Status::to_visit && !dfs(i)) return false;
    }
    return true;
  }

  bool dfs(const int u) {
    status[u] = Status::visiting;
    for (const int v : graph[u]) {
      if (status[v] == Status::visiting) return false;
      if (status[v] == Status::to_visit && !dfs(v)) return false;
    }
    status[u] = Status::visited;
    *it++ = u;
    return true;
  }
};

from enum import Enum, auto


class Status(Enum):
    to_visit = auto()
    visiting = auto()
    visited = auto()


def topo_sort(graph: list[list[int]]) -> list[int] | None:
    n = len(graph)
    status = [Status.to_visit] * n
    order = []

    def dfs(u: int) -> bool:
        status[u] = Status.visiting
        for v in graph[u]:
            if status[v] == Status.visiting:
                return False
            if status[v] == Status.to_visit and not dfs(v):
                return False
        status[u] = Status.visited
        order.append(u)
        return True

    for i in range(n):
        if status[i] == Status.to_visit and not dfs(i):
            return None

    return order[::-1]

时间复杂度：空间复杂度：

合理性证明

考虑一个图，删掉某个入度为的节点之后，如果新图可以拓扑排序，那么原图一定也可以。反过来，如果原图可以拓扑排序，那么删掉后也可以。

应用

拓扑排序可以判断图中是否有环，还可以用来判断图是否是一条链。拓扑排序可以用来求 AOE 网中的关键路径，估算工程完成的最短时间。

求字典序最大/最小的拓扑排序

将 Kahn 算法中的队列替换成最大堆/最小堆实现的优先队列即可，此时总的时间复杂度为 $O(E+V \log{V})$ 。

习题

CF 1385E：需要通过拓扑排序构造。

Luogu P1347: 拓扑排序模板。

参考

离散数学及其应用。ISBN:9787111555391
https://blog.csdn.net/dm_vincent/article/details/7714519
Topological sorting,https://en.wikipedia.org/w/index.php?title=Topological_sorting&oldid=854351542
https://blog.csdn.net/time_money/article/details/109857779
https://zhuanlan.zhihu.com/p/164751109

本页面最近更新：2023/11/19 21:40:31，更新历史
发现错误？想一起完善？在 GitHub 上编辑此页！
本页面贡献者：aofall, CCXXXI, ChungZH, CoelacanthusHex, countercurrent-time, cquptEthan, Enter-tainer, evrmji, fearlessxjdx, H-J-Granger, Haohu Shen, HeRaNO, iamtwz, Ir1d, kfy666, Marcythm, mcendu, Menci, NachtgeistW, ouuan, Persdre, Petalzu, Prevalence, shawlleyw, ShizuhaAki, shuzhouliu, SukkaW, Tiphereth-A, TrisolarisHD, Walker30360, william-song-shy, Xeonacid, zhb2000
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供，附加条款亦可能应用