人工智能基础-路径规划

图的遍历

深度优先遍历 DFS

遍历一个节点,需要访问它自己,再遍历左子树和右子树,根据遍历顺序分为以下三种遍历

前序遍历:先访问当前节点,再遍历左右子树
中序遍历:先遍历左子树,再访问自己,最后遍历右子树
后序遍历:先遍历左右子树,最后访问自己

#include <iostream>
 
struct _Node{
    int num;
    _Node *lChild;
    _Node *rChild;
};
 
void 前序遍历(_Node *node){
    if(node == nullptr) return;
    printf("num = %d\n",node->num);//访问自己
    前序遍历(node->lChild);
    前序遍历(node->rChild);
}
 
void 中序遍历(_Node *node){
    if(node == nullptr) return;
    中序遍历(node->lChild);
    printf("num = %d\n",node->num);//访问自己
    中序遍历(node->rChild);
}
 
void 后序遍历(_Node *node){
    if(node == nullptr) return;
    后序遍历(node->lChild);
    后序遍历(node->rChild);
    printf("num = %d\n",node->num);//访问自己
}

例如下面的二叉树

它的遍历顺序分别为

前序遍历: A-B-D-E-C-F
中序遍历: D-B-E-A-C-F
后序遍历: D-E-B-F-C-A

广度优先遍历 BFS

广度优先遍历是指先遍历顶点V的所有子节点 $V_1$ , $V_2$ …… $V_n$ ,然后再分别遍历V1,V2……Vn的子节点.即每次先遍历完第n层的节点,再遍历n+1层的节点

上图的广度优先遍历顺序为: A-B-C-D-E-F

#include <iostream>
#include <queue>
 
using namespace std;
 
struct _Node{
    int num;
    _Node *lChild;
    _Node *rChild;
};
void BFS(_Node *node);
 
int main(){
    _Node *nodes[6];
    //初始化节点
    for(int i=0;i<6;i++){
        nodes[i] = (_Node*)malloc(sizeof(_Node));
        nodes[i]->num = i;
        nodes[i]->lChild = nodes[i]->rChild = NULL;
    }
    nodes[0]->lChild = nodes[1];
    nodes[0]->rChild = nodes[2];
    nodes[1]->lChild = nodes[3];
    nodes[1]->rChild = nodes[4];
    nodes[2]->rChild = nodes[5];
    //广度优先遍历
    BFS(nodes[0]);
    return 0;
}
 
void BFS(_Node *node){
    if(node == NULL) return;
    _Node *head;
    queue<_Node*> q;
    q.push(node);
    while (!q.empty()){
        //弹出表头节点
        head = q.front();
        q.pop();
        //访问当前节点
        printf("Search: %d\n",head->num);
        //插入下一层的节点
        if(head->lChild != NULL) q.push(head->lChild);
        if(head->rChild != NULL) q.push(head->rChild);
    }
}

复杂度与效率

在查找路径时,BFS能够快速找到最短路径,但是它的空间复杂度更高,而DFS也可以找到一条路径,但是不保证它就是最短路径.如果一定要查找最短路径,那么它就需要遍历所有节点.

Dijikstra算法

设图 $G$ 的邻接矩阵 $M$ , $M(i,j)$ 表示 $i$ 到 $j$ 的距离,用一个大整数来表示 $i$ 和 $j$ 不连通

用二维数组map来表示矩阵M,称map[0][0]为原点

#define G 10000
int map[5][5] = {
        {0,G,3,G,1},
        {G,0,1,G,3},
        {3,1,0,2,G},
        {G,G,2,0,3},
        {1,3,G,3,0}
};

其中map[i][j]表示i到j的路程距离,G表示i和j不相邻.G可以使用一个大整数来表示,也可以使用-1来表示,但是这样就需要额外写一个判断语句

用d[i]数组来表示原点到i点的最短路程,并使用map[0]来初始化.此时原点到各点的最短路程就是它和相邻的点之间的距离

在每次循环中,先搜索d数组中最小的元素,并将其标记,下次搜索就会跳过这个元素.记搜到的最小值为min,下标为index,循环判断d[index]和map[index][k]的大小,如果存在d[index] + map[index][k] < d[k],则说明从原点先到index点再到k点比直接到k点路程更短,则将d[k]更新为d[index] + map[index][k]

#include <iostream>
#include <queue>
#define G 10000
using namespace std;
 
int map[5][5] = {
        {0,G,3,G,1},
        {G,0,1,G,3},
        {3,1,0,2,G},
        {G,G,2,0,3},
        {1,3,G,3,0}
};
int d[5];
bool mark[5] = {false,false,false,false,false};
void Dijikstra();
 
int main(){
    memcpy(d,map[0],sizeof d);
    Dijikstra();
    for(int i=0;i<5;i++){
            cout << d[i] << endl;
    }
    return 0;
}
 
void Dijikstra(){
    for(int i=0;i<5;i++){
        d[i] = map[0][i];//初始化d数组
    }
    for(int i=1;i<=5;i++){
        int min = G;//距离原点最近点距离
        int index = 0;//距离原点最近点下标
        for(int j=0;j<5;j++){
            if(!mark[j] && min > d[j]){
                min = d[j];
                index = j;
            }
        }
        mark[index] = true;//标记
        for(int j=1;j<5;j++){
            if(map[index][j] != G){
                if(d[index] + map[index][j] < d[j]){
                    d[j] = d[index] + map[index][j];
                }
            }
        }
    }
}

启发式算法

曼哈顿距离

两点的曼哈顿距离是两点 $x$ 轴之差的绝对值和 $y$ 轴之差的绝对值的和,例如 $(x_1,y_1)$ 和 $(x_2,y_2)$ 之间的曼哈顿距离是 $(|x_1-x_2|+|y_1-y_2|)$

欧式距离

欧式距离就是传统平面直角坐标系中的两点间距离

加权图

在之前的图中,都默认边的长度为1.但是在地图中,两个城市之间的距离是不固定的,也就是说每一条公路都有不同的长度,这就是权.实际上在Dijikstra算法中的图也是加权图

在加权图中每条边都有一个权值,因此通路Γ的长度不再是边的个数,而是通路中所有边的权之和

估值函数

设当前访问的顶点为 $N$ ,终点为 $G$ ,为了估计 $N$ 与 $G$ 的距离,定义估值函数 $h(N)$ 表示 $N$ 到 $G$ 的估计最小距离,而 $h^*(N)$ 表示 $N$ 到 $G$ 的实际最小距离.在平面直角坐标系中,通常用欧式距离来计算 $h(N)$ ,即 $h(N)=|NG|$ .但是有时为了方便,也可以使用曼哈顿距离来表示 $h(N)$

以地图上的城市为例,在不知道实际最小距离的情况下,通常用连接两城市的线段长度来估计距离,而它们的实际最小距离通常会大于估计最小距离

综合优先级

设图的起点为 $S$ ,当前访问节点为 $N$ ,终点为 $G$ ,显然 $S$ 到 $G$ 的实际距离是已知的(只需要把路径上的所有边的权相加).记 $g(N)$ 为 $S$ 到 $N$ 的最小距离,这个最小距离就是所有边的权之和.

记 $f(N)=g(N)+h(N)$ 为 $N$ 点的综合优先级, $f(N)$ 越小则综合优先级越高

优先队列

优先队列用于保存元素的优先级

例如

地点	A	B	C
优先级	1	2	3

数字越小表示优先级越高

A*算法

$A^*$ 算法的效率取决于 $f(N)$ 的准确度,也就是 $h(N)$ 的准确度

首先将起点放入队列中,记录它的父节点(NULL), $g(S)$ 和 $f(S)$ ,然后开始循环：如果队列不为空,则查找优先级最高的点 $N$ ,遍历与它相邻的所有点,且每个点只被遍历一次,记录下这些点的父节点 $(N)$ , $g(S)$ 和 $f(S)$ ,然后添加到优先队列中,并从优先队列移除 $N$ .如此重复,直到终点变成优先级最高的节点,此时从终点 $G$ 开始,沿着父节点查找就可以找到 $S$ 到 $G$ 的最短路径

A*算法示例

如上图,起点为S,终点为G.为了方便计算,令 $h(N)=1$

先把S加入队列

父节点	NULL
节点	S
优先级	1

将与S相邻的节点加入队列,并移除S

父节点	NULL	S	S
节点	S	A	B
优先级	1	3	4

A的优先级最高,因此遍历与A相邻的节点,并加入优先队列

父节点	NULL	S	S	A	A
节点	S	A	B	C	D
优先级	1	3	4	4	10

现在B和C的优先级相同,任意选择一个即可.现选择B作为下一个循环的节点,发现B附近的节点D已经在优先队列中,但是优先级比从A到D更高,因此直接更新列表,覆盖原来的节点

父节点	NULL	S	S	A	B
节点	S	A	B	C	D
优先级	1	3	4	4	8

选择C作为下一个循环的节点,再次更新D节点

父节点	NULL	S	S	A	C	C	C
节点	S	A	B	C	D	E	F
优先级	1	3	4	4	7	10	7

选择D作为下一个循环的节点,由于A,C节点都被遍历过,只需要考虑F,但是从D到F的优先级为9,而从C到F的优先级为7,因此不更新列表

父节点	NULL	S	S	A	C	C	C
节点	S	A	B	C	D	E	F
优先级	1	3	4	4	7	10	7

选择F作为下一个节点

父节点	NULL	S	S	A	C	C	C	F
节点	S	A	B	C	D	E	F	G
优先级	1	3	4	4	7	10	7	8

此时G变成优先级最高的节点,循环结束,沿着父节点一路向上查找,得到的就是最短路径

S-A-C-F-G, $g(G)=7$ ,即路径长度为7

估值函数对A*算法的影响

当 $h(N)=0$ 时,优先级完全由 $g(N)$ 决定,此时 $A^*$ 算法变成Dijkstra算法

当 $h(N)$ 偏小时,意味着某些优先级较低的节点优先级变高,这样会导致循环次数增加,查找范围增大,但是仍然能够找到最短路径

当 $h(N)$ 偏大时,某些优先级较高的节点优先级降低,可能会导致算法提前终止,查找范围变小,则此时 $A^*$ 不一定能找到最短路径