쏭의 개발 블로그

[6-1] 최단거리 알고리즘 - 다익스트라 알고리즘 본문

알고리즘

[6-1] 최단거리 알고리즘 - 다익스트라 알고리즘

songu1 2023. 6. 25. 17:21

[1] 최단경로 알고리즘이란?

가장 짧은 경로를 찾는 알고리즘

 

다양한 문제상황

  • 한 지점에서 다른 한 지점까지의 최단경로
  • 한 지점에서 다른 모든 지점까지의 최단경로
  • 모든 지점에서 다른 모든 지점까지의 최단 경로

표현

  • 각 지점은 그래프에서 노드로 표현
  • 지점간 연결된 도로는 그래프에서 간선으로 표현

 

[2-1] 다익스트라 최단경로 알고리즘

특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산

  • 음의 간선이 없을 때 정상적으로 동작( 현실세계의 간선은 음의 간선X)
  • 그리디 알고리즘으로 분류됨
  • 매 상황에서(방문하지 않은 노드 중) 가장 비용이 적은 노드를 선택해 임의의 과정을 반복

 

동작과정

  1. 출발 노드를 설정
  2. 최단 거리 테이블을 초기화
    • 모든 노드까지 가기 위한 비용을 무한으로 설정
    • 자기자신의 노드는 0
  3. 방문하지 않은 노드 중에서 최단거리가 가장 짧은 노드를 선택
    • 선택된 노드까지의 최단거리는 더 이상 바뀌지 않음
    • 3번 과정을 반복할 때마다 특정 노드까지의 최단거리를 확실하게 결정
    • ⇒ 그리디 알고리즘
  4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신
  5. 3번과 4번을 반복

💡 단순한 형태

  • 출발 노드로부터 다른 모든 노드까지의 최단거리를 구하는 것
  • 이러한 과정을 반복 → 각 노드까지의 최단 거리만 알 수 있음

💡 완전한 형태 : 코테 수준에서는 잘 나오지 않음

 

최단 거리 테이블 : 각 노드에 대한 현재까지의 최단 거리 정보를 가짐

처리 과정에서 더 짧은 경로를 찾음 → ‘이제부터 이 경로가 제일 짧은 경로야’라고 갱신

 

상세 동작 과정 (그림)

[초기상태] 그래프를 준비하고 출발 노드를 설정

[Step 1] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(1번)를 처리

  1. 인접 노드 정보를 확인 : 2, 3, 4
  2. 1번 노드를 거쳐할 때의 거리값으로 바꿔줌

[Step 2] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(4번)를 처리

  • 4번노드까지 가는 비용은 고정 (최단거리를 설정하면 고정)
  1. 인접노드 정보를 확인 : 3, 5
  2. 4번노드까지의 비용 + 4번에서 인접노드까지의 비용을 더한 값
  3. 원래 값보다 (2)값이 작으면 바꿔줌

[Step 3] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(2번)를 처리

  • 방문하지 않은 노드 중 최단거리가 가장 짧은 노드가 여러개일 경우 아무거나 선택 (일반적으로는 번호가 작은 노드)

  1. 2번노트의 인접 노드를 확인 : 2, 3
  2. 2번노트까지의 최단 거리 비용 + 2번에서 인접노드까지의 비용을 더한 값
  3. 원래 값보다 (2)번 값이 작으면 바꿔줌
    • 이미 방문처리한 노드라면 무시
      • 최단 거리 값이 이미 결정 되었으므로

[Step 4] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(5번)를 처리

  1. 5번 노드의 인접 노드를 확인 : 3,6
  2. 5번노트까지의 최단 거리 비용 + 5번에서 인접노드까지의 비용을 더한 값
  3. 원래 값보다 (2)번 값이 작으면 바꿔줌

[Step 5] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(6번)를 처리

  • 마지막 노드 정보는 처리하지 않아도 됨
    • 방문하지 않은 노드가 없으므로

 

특징

  1. 그리디 알고리즘
    • 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택에 임의의 과정을 반복
    • 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않음
      • 한 단계 당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있음
    • 다익스트라 알고리즘을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장됨

 

다익스트라 알고리즘 간단한 구현 방법

파이썬

import sys
input = sys.stdin.readline()
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수 입력 받기
n,m = map(int,input().split())
# 시작 노드 번호를 입력받기
start=int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph=[[] for i in range(n+1)]
# 방문한 적 있는지 체크하는 목적의 리스트 만들기
visited=[False]*(n+1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF]*(n+1)

# 모든 간선 정보를 입력받기
for _ in range(m):
	a,b,c = map(int,input().split())
	# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
	graph[a].append((b,c))

# 방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
	min_value = INF
	index = 0 # 가장 최단 거리가 짧은 노드(인덱스)
	for i in range(1,n+1):
		if distance[i] < min_value and not visited[i]:
			min_value=distance[i]
			index=i
	return index

def dijkstra(start):
	# 시작노드에 대해서 초기화
	distance[start]=0
	visited[start]=True
	for j in graph[start]:
		distance[j[0]]=j[1]
	# 시작 노드를 제외한 전체 n-1개 노드에 대해 반복
	for i in range(n-1):
		# 현재 최단 거리가 가장 짧은 노드를 꺼내서 방문처리
		now = get_smallest_node()
		visited[now]=True
		# 현재 노드와 연결된 다른 노드를 확인
		for j in graph[now]:
			cost = distance[now] + j[1]
			# 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
			if cost < distance[j[0]]:
				distanc[j[0]]=cost

# 다익스트라 알고리즘을 수행
dijkstra(start)

# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1,n+1):
	# 도달할 수 없는 경우, 무한이라고 출력
	if distance[i]==INF:
		print("INFINITY")
	# 도달할 수 있는 경우 거리를 출력
	else:
		print(distance[i])

자바

import java.util.*;

class Node {

    private int index;
    private int distance;

    public Node(int index, int distance) {
        this.index = index;
        this.distance = distance;
    }

    public int getIndex() {
        return this.index;
    }

    public int getDistance() {
        return this.distance;
    }
}

public class Main {

    public static final int INF = (int) 1e9; // 무한을 의미하는 값으로 10억을 설정
    // 노드의 개수(N), 간선의 개수(M), 시작 노드 번호(Start)
    // 노드의 개수는 최대 100,000개라고 가정
    public static int n, m, start;
    // 각 노드에 연결되어 있는 노드에 대한 정보를 담는 배열
    public static ArrayList<ArrayList<Node>> graph = new ArrayList<ArrayList<Node>>();
    // 방문한 적이 있는지 체크하는 목적의 배열 만들기
    public static boolean[] visited = new boolean[100001];
    // 최단 거리 테이블 만들기
    public static int[] d = new int[100001];

    // 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
    public static int getSmallestNode() {
        int min_value = INF;
        int index = 0; // 가장 최단 거리가 짧은 노드(인덱스)
        for (int i = 1; i <= n; i++) {
            if (d[i] < min_value && !visited[i]) {
                min_value = d[i];
                index = i;
            }
        }
        return index;
    }

    public static void dijkstra(int start) {
        // 시작 노드에 대해서 초기화
        d[start] = 0;
        visited[start] = true;
        for (int j = 0; j < graph.get(start).size(); j++) {
            d[graph.get(start).get(j).getIndex()] = graph.get(start).get(j).getDistance();
        }
        // 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
        for (int i = 0; i < n - 1; i++) {
            // 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
            int now = getSmallestNode();
            visited[now] = true;
            // 현재 노드와 연결된 다른 노드를 확인
            for (int j = 0; j < graph.get(now).size(); j++) {
                int cost = d[now] + graph.get(now).get(j).getDistance();
                // 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
                if (cost < d[graph.get(now).get(j).getIndex()]) {
                    d[graph.get(now).get(j).getIndex()] = cost;
                }
            }
        }
    }

    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);

        n = sc.nextInt();
        m = sc.nextInt();
        start = sc.nextInt();

        // 그래프 초기화
        for (int i = 0; i <= n; i++) {
            graph.add(new ArrayList<Node>());
        }

        // 모든 간선 정보를 입력받기
        for (int i = 0; i < m; i++) {
            int a = sc.nextInt();
            int b = sc.nextInt();
            int c = sc.nextInt();
            // a번 노드에서 b번 노드로 가는 비용이 c라는 의미
            graph.get(a).add(new Node(b, c));
        }

        // 최단 거리 테이블을 모두 무한으로 초기화
        Arrays.fill(d, INF);
        
        // 다익스트라 알고리즘을 수행
        dijkstra(start);

        // 모든 노드로 가기 위한 최단 거리를 출력
        for (int i = 1; i <= n; i++) {
            // 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
            if (d[i] == INF) {
                System.out.println("INFINITY");
            }
            // 도달할 수 있는 경우 거리를 출력
            else {
                System.out.println(d[i]);
            }
        }
    }
}

 

성능 분석

  • O(V)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색함
  • 전체 시간 복잡도는 O(V^2)
  • 일반적으로 코딩테스트의 최단 경로 문제에서 전체 노드의 개수가 5000개 이하라면 이 코드로 문제를 해결 가능
    • but 10000개가 넘는다면 해결 불가

 

[2-2] 다익스트라 최단경로 알고리즘 : 우선순위 큐

우선순위 큐

우선순위가 가장 높은 데이터를 가장 먼저 삭제하는 자료구조

  • 파이썬, c++, 자바에서 표준 라이브러리 형태로 지원

힙 (Heap)

우선순위 큐를 구현하기 위해 사용하는 자료구조 중 하나

  • 최소 힙(Min Heap) : 값이 낮은 데이터부터 꺼내는 방식
  • 최대 힙(Max Heap) : 값이 높은 데이터부터 꺼내는 방식
  • 시간 복잡도
    • 리스트 : 삽입( O(1) ) / 삭제( O(N) )
    • 힙(Heap) : 삽입, 삭제 ( O(logN) )

파이썬 : 힙 라이브러리 (최소 힙)

import heapq 

# 오름차순 힙 정렬 (Heap Sort) 
def heapsort(iterable):
	h = [] 
    result = [] 
    # 모든 원소를 차례대로 힙에 삽입 
    for value in iterable: 
    	heapq.heappush(h,value) # 특정 리스트에 데이터를 넣기 
    # 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기 
    for i in range(len(h)): 
    	result.append(heapq.heappop(h)) # 특정 리스트에 데이터 빼기 
    return result 

result = heapsort([1,3,5,7,9,2,4,6,8,0]) 
print(result)

 

파이썬 : 힙 라이브러리 (최대 힙)

import heapq 

# 내림차순 힙 정렬 (Heap Sort) 
def heapsort(iterable): 
	h = [] 
    result = [] 
    # 모든 원소를 차례대로 힙에 삽입 
    for value in iterable: 
    	heapq.heappush(h,-value) 
        # 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기 
        for i in range(len(h)): 
        	result.append(-heapq.heappop(h)) 
        return result 

result = heapsort([1,3,5,7,9,2,4,6,8,0]) 
print(result)

 

다익스트라 알고리즘 : 개선된 구현 방법

  • 단계마다 방문하지 않은 노드 중에서 최단거리가 가장 짧은 노드를 선택하기 위해 힙(Heap) 자료구조를 이용
  • 기본 원리
    • 현재 가장 가까운 노드를 저장해 놓기 위해서 힙 자료구조를 추가적으로 이용
    • 현재 최단 거리가 가장 짧은 노드를 선택해야 하므로 최소 힙을 사용

상세 동작 과정 (그림)

[초기상태] 그래프를 준비하고 출발 노드를 설정하여 우선순위 큐에 삽입

[Step 1] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 1번 노드 처리

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 0, 노드 : 1)
  2. 인접노드까지의 거리를 갱신 : 2,3,4번 노드
  3. 갱신한 노드를 우선순위 큐에 삽입 (우선순위가 높은 데이터가 위)

[Step 2] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 4번 노드 처리

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 1 노드 : 4)
  2. 인접노드 확인 : 3, 5번 노드
  3. (1) 4번노드까지의 비용 + 4번에서 인접노드까지의 비용(2) 현재 거리 값을 비교하여 갱신
  4. 갱신한 노드를 우선순위 큐에 삽입 (우선순위가 높은 데이터가 위)
    • (거리 : 4 노드 : 3) 삽입
    • 이전값인 (거리 : 5, 노드 : 3) 은 밀려나 더 아래쪽에 위치

[Step 3] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 2번 노드 처리

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 2 노드 : 2)
  2. 인접노드 확인 : 3, 4번 노드
  3. (1) 2번노드까지의 비용 + 2번에서 인접노드까지의 비용(2) 현재 거리 값을 비교

[Step 4] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 5번 노드 처리

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 2 노드 : 5)
  2. 인접노드 확인 : 3, 6번 노드
  3. (1) 5번노드까지의 비용 + 5번에서 인접노드까지의 비용(2) 현재 거리 값을 비교하여 갱신
  4. 갱신한 노드를 우선순위 큐에 삽입 (우선순위가 높은 데이터가 위)
    • (거리 : 3 노드 : 3) 삽입
    • 이전값인 (거리 : 4, 노드 : 3) 은 밀려나 더 아래쪽에 위치

[Step 5] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 3번 노드 처리

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 3 노드 : 3)
  2. 인접노드 확인 : 2, 6번 노드
  3. (1) 3번노드까지의 비용 + 3번에서 인접노드까지의 비용과 (2) 현재 거리 값을 비교

[Step 6] 우선순위 큐에서 원소를 꺼냅니다. 3번 노드는 이미 방문했으므로 무시

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 4 노드 : 3)

[Step 7] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 6번 노드 처리

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 4 노드 : 6)
  2. 인접노드 확인 : 없음

[Step 8] 우선순위 큐에서 원소를 꺼냅니다. 3번 노드는 이미 방문했으므로 무시

  1. 우선순위 큐에서 원소를 꺼냄 : (거리 : 5 노드 : 3)

 

다익스트라 알고리즘 : 개선된 구현 방법

파이썬

import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어있는 노드에 대한 정보를 담는 리스트 만들기
graph = [[] for i in range(n+1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n+1)

# 모든 간선 정보를 입력 받기
for _ in range(m):
	a, b, c = map(int, input().split())
	# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
	graph[a].append((b,c))

def dijkstra(start):
	q = []
	# 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
	heapq.heappush(q, (0, start))
	distance[start] = 0
	while q:  # 큐가 비어있지 않다면
		# 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
		dist, now = heapq.heappop(q)
		# 현재 노드가 이미 처리된 적 있는 노드라면 무시
		if distance[now] < dist:
			continue
		# 현재 노드와 연결된 다른 인접한 노드들을 확인
		for i in graph[now]:
			const = dist + i[1]
			# 현재 노드를 거처서, 다른 노드로 이동하는 거리가 더 짧은 경우
			if cost < distance[i[0]]:
				distance[i[0]] = cost
				heapq.heappush(q, (cost,i[0]))

# 다익스트라 알고리즘을 수행
dijkstra(start)

# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
	# 도달할 수 없는 경우 ,무한이라고 출력
	if distance[i] == INF:
		print("INF")
	# 도달할 수 있는 경우 거리를 출력
	else:
		print(distance[i])

자바

import java.util.*;

class Node implements Comparable<Node> {

    private int index;
    private int distance;

    public Node(int index, int distance) {
        this.index = index;
        this.distance = distance;
    }

    public int getIndex() {
        return this.index;
    }

    public int getDistance() {
        return this.distance;
    }

    // 거리(비용)가 짧은 것이 높은 우선순위를 가지도록 설정
    @Override
    public int compareTo(Node other) {
        if (this.distance < other.distance) {
            return -1;
        }
        return 1;
    }
}

public class Main {

    public static final int INF = (int) 1e9; // 무한을 의미하는 값으로 10억을 설정
    // 노드의 개수(N), 간선의 개수(M), 시작 노드 번호(Start)
    // 노드의 개수는 최대 100,000개라고 가정
    public static int n, m, start;
    // 각 노드에 연결되어 있는 노드에 대한 정보를 담는 배열
    public static ArrayList<ArrayList<Node>> graph = new ArrayList<ArrayList<Node>>();
    // 최단 거리 테이블 만들기
    public static int[] d = new int[100001];

    public static void dijkstra(int start) {
        PriorityQueue<Node> pq = new PriorityQueue<>();
        // 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
        pq.offer(new Node(start, 0));
        d[start] = 0;
        while(!pq.isEmpty()) { // 큐가 비어있지 않다면
            // 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
            Node node = pq.poll();
            int dist = node.getDistance(); // 현재 노드까지의 비용 
            int now = node.getIndex(); // 현재 노드
            // 현재 노드가 이미 처리된 적이 있는 노드라면 무시
            if (d[now] < dist) continue;
            // 현재 노드와 연결된 다른 인접한 노드들을 확인
            for (int i = 0; i < graph.get(now).size(); i++) {
                int cost = d[now] + graph.get(now).get(i).getDistance();
                // 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
                if (cost < d[graph.get(now).get(i).getIndex()]) {
                    d[graph.get(now).get(i).getIndex()] = cost;
                    pq.offer(new Node(graph.get(now).get(i).getIndex(), cost));
                }
            }
        }
    }

    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);

        n = sc.nextInt();
        m = sc.nextInt();
        start = sc.nextInt();

        // 그래프 초기화
        for (int i = 0; i <= n; i++) {
            graph.add(new ArrayList<Node>());
        }
        
        // 모든 간선 정보를 입력받기
        for (int i = 0; i < m; i++) {
            int a = sc.nextInt();
            int b = sc.nextInt();
            int c = sc.nextInt();
            // a번 노드에서 b번 노드로 가는 비용이 c라는 의미
            graph.get(a).add(new Node(b, c));
        }

        // 최단 거리 테이블을 모두 무한으로 초기화
        Arrays.fill(d, INF);
        
        // 다익스트라 알고리즘을 수행
        dijkstra(start);

        // 모든 노드로 가기 위한 최단 거리를 출력
        for (int i = 1; i <= n; i++) {
            // 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
            if (d[i] == INF) {
                System.out.println("INFINITY");
            }
            // 도달할 수 있는 경우 거리를 출력
            else {
                System.out.println(d[i]);
            }
        }
    }
}

성능 분석

  • 힙 자료구조를 이용하는 다익스트라 알고리즘의 시간복잡도 : O(ElogV)
  • 노드를 하나씩 꺼내 검사하는 반복문(while문)은 노드의 개수 v 이상의 횟수로는 처리되지 않음
    • 결과적으로 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총 횟수는 최대 간선의 개수 만큼 연산이 수행될 수 있음
  • E개의 원소를 우선순위 큐에 넣었다가 모두 빼내는 연산과 매우 유사
    • 시간복잡도 : O(ElogE)
    • 중복 간선을 포함하지 않는 경우 : O(ElogV)

 

 


참고자료 및 출처

https://www.youtube.com/watch?v=acqm9mM1P6o&t=3031s 

 

'알고리즘' 카테고리의 다른 글

[7] 백트래킹 알고리즘 (파이썬 구현)  (0) 2023.06.25
[6-2] 최단거리 알고리즘 - 플로이드 워셜  (0) 2023.06.25
[5] 다이나믹 프로그래밍  (0) 2023.02.28
[4] 이진탐색  (0) 2023.02.28
[3] 정렬 알고리즘  (0) 2023.02.28