쏭의 개발 블로그
[6-1] 최단거리 알고리즘 - 다익스트라 알고리즘 본문
[1] 최단경로 알고리즘이란?
가장 짧은 경로를 찾는 알고리즘
다양한 문제상황
- 한 지점에서 다른 한 지점까지의 최단경로
- 한 지점에서 다른 모든 지점까지의 최단경로
- 모든 지점에서 다른 모든 지점까지의 최단 경로
표현
- 각 지점은 그래프에서 노드로 표현
- 지점간 연결된 도로는 그래프에서 간선으로 표현
[2-1] 다익스트라 최단경로 알고리즘
특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산
- 음의 간선이 없을 때 정상적으로 동작( 현실세계의 간선은 음의 간선X)
- 그리디 알고리즘으로 분류됨
- 매 상황에서(방문하지 않은 노드 중) 가장 비용이 적은 노드를 선택해 임의의 과정을 반복
동작과정
- 출발 노드를 설정
- 최단 거리 테이블을 초기화
- 모든 노드까지 가기 위한 비용을 무한으로 설정
- 자기자신의 노드는 0
- 방문하지 않은 노드 중에서 최단거리가 가장 짧은 노드를 선택
- 선택된 노드까지의 최단거리는 더 이상 바뀌지 않음
- 3번 과정을 반복할 때마다 특정 노드까지의 최단거리를 확실하게 결정
- ⇒ 그리디 알고리즘
- 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신
- 3번과 4번을 반복
💡 단순한 형태
- 출발 노드로부터 다른 모든 노드까지의 최단거리를 구하는 것
- 이러한 과정을 반복 → 각 노드까지의 최단 거리만 알 수 있음
💡 완전한 형태 : 코테 수준에서는 잘 나오지 않음
최단 거리 테이블 : 각 노드에 대한 현재까지의 최단 거리 정보를 가짐
처리 과정에서 더 짧은 경로를 찾음 → ‘이제부터 이 경로가 제일 짧은 경로야’라고 갱신
상세 동작 과정 (그림)
[초기상태] 그래프를 준비하고 출발 노드를 설정
[Step 1] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(1번)를 처리
- 인접 노드 정보를 확인 : 2, 3, 4
- 1번 노드를 거쳐할 때의 거리값으로 바꿔줌
[Step 2] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(4번)를 처리
- 4번노드까지 가는 비용은 고정 (최단거리를 설정하면 고정)
- 인접노드 정보를 확인 : 3, 5
- 4번노드까지의 비용 + 4번에서 인접노드까지의 비용을 더한 값
- 원래 값보다 (2)값이 작으면 바꿔줌
[Step 3] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(2번)를 처리
- 방문하지 않은 노드 중 최단거리가 가장 짧은 노드가 여러개일 경우 아무거나 선택 (일반적으로는 번호가 작은 노드)
- 2번노트의 인접 노드를 확인 : 2, 3
- 2번노트까지의 최단 거리 비용 + 2번에서 인접노드까지의 비용을 더한 값
- 원래 값보다 (2)번 값이 작으면 바꿔줌
- 이미 방문처리한 노드라면 무시
- 최단 거리 값이 이미 결정 되었으므로
- 이미 방문처리한 노드라면 무시
[Step 4] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(5번)를 처리
- 5번 노드의 인접 노드를 확인 : 3,6
- 5번노트까지의 최단 거리 비용 + 5번에서 인접노드까지의 비용을 더한 값
- 원래 값보다 (2)번 값이 작으면 바꿔줌
[Step 5] 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드(6번)를 처리
- 마지막 노드 정보는 처리하지 않아도 됨
- 방문하지 않은 노드가 없으므로
특징
- 그리디 알고리즘
- 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택에 임의의 과정을 반복
- 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않음
- 한 단계 당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있음
- 다익스트라 알고리즘을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장됨
다익스트라 알고리즘 간단한 구현 방법
파이썬
import sys
input = sys.stdin.readline()
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정
# 노드의 개수, 간선의 개수 입력 받기
n,m = map(int,input().split())
# 시작 노드 번호를 입력받기
start=int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph=[[] for i in range(n+1)]
# 방문한 적 있는지 체크하는 목적의 리스트 만들기
visited=[False]*(n+1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF]*(n+1)
# 모든 간선 정보를 입력받기
for _ in range(m):
a,b,c = map(int,input().split())
# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph[a].append((b,c))
# 방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
min_value = INF
index = 0 # 가장 최단 거리가 짧은 노드(인덱스)
for i in range(1,n+1):
if distance[i] < min_value and not visited[i]:
min_value=distance[i]
index=i
return index
def dijkstra(start):
# 시작노드에 대해서 초기화
distance[start]=0
visited[start]=True
for j in graph[start]:
distance[j[0]]=j[1]
# 시작 노드를 제외한 전체 n-1개 노드에 대해 반복
for i in range(n-1):
# 현재 최단 거리가 가장 짧은 노드를 꺼내서 방문처리
now = get_smallest_node()
visited[now]=True
# 현재 노드와 연결된 다른 노드를 확인
for j in graph[now]:
cost = distance[now] + j[1]
# 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[j[0]]:
distanc[j[0]]=cost
# 다익스트라 알고리즘을 수행
dijkstra(start)
# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1,n+1):
# 도달할 수 없는 경우, 무한이라고 출력
if distance[i]==INF:
print("INFINITY")
# 도달할 수 있는 경우 거리를 출력
else:
print(distance[i])
자바
import java.util.*;
class Node {
private int index;
private int distance;
public Node(int index, int distance) {
this.index = index;
this.distance = distance;
}
public int getIndex() {
return this.index;
}
public int getDistance() {
return this.distance;
}
}
public class Main {
public static final int INF = (int) 1e9; // 무한을 의미하는 값으로 10억을 설정
// 노드의 개수(N), 간선의 개수(M), 시작 노드 번호(Start)
// 노드의 개수는 최대 100,000개라고 가정
public static int n, m, start;
// 각 노드에 연결되어 있는 노드에 대한 정보를 담는 배열
public static ArrayList<ArrayList<Node>> graph = new ArrayList<ArrayList<Node>>();
// 방문한 적이 있는지 체크하는 목적의 배열 만들기
public static boolean[] visited = new boolean[100001];
// 최단 거리 테이블 만들기
public static int[] d = new int[100001];
// 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
public static int getSmallestNode() {
int min_value = INF;
int index = 0; // 가장 최단 거리가 짧은 노드(인덱스)
for (int i = 1; i <= n; i++) {
if (d[i] < min_value && !visited[i]) {
min_value = d[i];
index = i;
}
}
return index;
}
public static void dijkstra(int start) {
// 시작 노드에 대해서 초기화
d[start] = 0;
visited[start] = true;
for (int j = 0; j < graph.get(start).size(); j++) {
d[graph.get(start).get(j).getIndex()] = graph.get(start).get(j).getDistance();
}
// 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
for (int i = 0; i < n - 1; i++) {
// 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
int now = getSmallestNode();
visited[now] = true;
// 현재 노드와 연결된 다른 노드를 확인
for (int j = 0; j < graph.get(now).size(); j++) {
int cost = d[now] + graph.get(now).get(j).getDistance();
// 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
if (cost < d[graph.get(now).get(j).getIndex()]) {
d[graph.get(now).get(j).getIndex()] = cost;
}
}
}
}
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
n = sc.nextInt();
m = sc.nextInt();
start = sc.nextInt();
// 그래프 초기화
for (int i = 0; i <= n; i++) {
graph.add(new ArrayList<Node>());
}
// 모든 간선 정보를 입력받기
for (int i = 0; i < m; i++) {
int a = sc.nextInt();
int b = sc.nextInt();
int c = sc.nextInt();
// a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph.get(a).add(new Node(b, c));
}
// 최단 거리 테이블을 모두 무한으로 초기화
Arrays.fill(d, INF);
// 다익스트라 알고리즘을 수행
dijkstra(start);
// 모든 노드로 가기 위한 최단 거리를 출력
for (int i = 1; i <= n; i++) {
// 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
if (d[i] == INF) {
System.out.println("INFINITY");
}
// 도달할 수 있는 경우 거리를 출력
else {
System.out.println(d[i]);
}
}
}
}
성능 분석
- O(V)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색함
- 전체 시간 복잡도는 O(V^2)
- 일반적으로 코딩테스트의 최단 경로 문제에서 전체 노드의 개수가 5000개 이하라면 이 코드로 문제를 해결 가능
- but 10000개가 넘는다면 해결 불가
[2-2] 다익스트라 최단경로 알고리즘 : 우선순위 큐
우선순위 큐
우선순위가 가장 높은 데이터를 가장 먼저 삭제하는 자료구조
- 파이썬, c++, 자바에서 표준 라이브러리 형태로 지원
힙 (Heap)
우선순위 큐를 구현하기 위해 사용하는 자료구조 중 하나
- 최소 힙(Min Heap) : 값이 낮은 데이터부터 꺼내는 방식
- 최대 힙(Max Heap) : 값이 높은 데이터부터 꺼내는 방식
- 시간 복잡도
- 리스트 : 삽입( O(1) ) / 삭제( O(N) )
- 힙(Heap) : 삽입, 삭제 ( O(logN) )
파이썬 : 힙 라이브러리 (최소 힙)
import heapq
# 오름차순 힙 정렬 (Heap Sort)
def heapsort(iterable):
h = []
result = []
# 모든 원소를 차례대로 힙에 삽입
for value in iterable:
heapq.heappush(h,value) # 특정 리스트에 데이터를 넣기
# 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
for i in range(len(h)):
result.append(heapq.heappop(h)) # 특정 리스트에 데이터 빼기
return result
result = heapsort([1,3,5,7,9,2,4,6,8,0])
print(result)
파이썬 : 힙 라이브러리 (최대 힙)
import heapq
# 내림차순 힙 정렬 (Heap Sort)
def heapsort(iterable):
h = []
result = []
# 모든 원소를 차례대로 힙에 삽입
for value in iterable:
heapq.heappush(h,-value)
# 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
for i in range(len(h)):
result.append(-heapq.heappop(h))
return result
result = heapsort([1,3,5,7,9,2,4,6,8,0])
print(result)
다익스트라 알고리즘 : 개선된 구현 방법
- 단계마다 방문하지 않은 노드 중에서 최단거리가 가장 짧은 노드를 선택하기 위해 힙(Heap) 자료구조를 이용
- 기본 원리
- 현재 가장 가까운 노드를 저장해 놓기 위해서 힙 자료구조를 추가적으로 이용
- 현재 최단 거리가 가장 짧은 노드를 선택해야 하므로 최소 힙을 사용
상세 동작 과정 (그림)
[초기상태] 그래프를 준비하고 출발 노드를 설정하여 우선순위 큐에 삽입
[Step 1] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 1번 노드 처리
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 0, 노드 : 1)
- 인접노드까지의 거리를 갱신 : 2,3,4번 노드
- 갱신한 노드를 우선순위 큐에 삽입 (우선순위가 높은 데이터가 위)
[Step 2] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 4번 노드 처리
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 1 노드 : 4)
- 인접노드 확인 : 3, 5번 노드
- (1) 4번노드까지의 비용 + 4번에서 인접노드까지의 비용과 (2) 현재 거리 값을 비교하여 갱신
- 갱신한 노드를 우선순위 큐에 삽입 (우선순위가 높은 데이터가 위)
- (거리 : 4 노드 : 3) 삽입
- 이전값인 (거리 : 5, 노드 : 3) 은 밀려나 더 아래쪽에 위치
[Step 3] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 2번 노드 처리
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 2 노드 : 2)
- 인접노드 확인 : 3, 4번 노드
- (1) 2번노드까지의 비용 + 2번에서 인접노드까지의 비용과 (2) 현재 거리 값을 비교
[Step 4] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 5번 노드 처리
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 2 노드 : 5)
- 인접노드 확인 : 3, 6번 노드
- (1) 5번노드까지의 비용 + 5번에서 인접노드까지의 비용과 (2) 현재 거리 값을 비교하여 갱신
- 갱신한 노드를 우선순위 큐에 삽입 (우선순위가 높은 데이터가 위)
- (거리 : 3 노드 : 3) 삽입
- 이전값인 (거리 : 4, 노드 : 3) 은 밀려나 더 아래쪽에 위치
[Step 5] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 3번 노드 처리
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 3 노드 : 3)
- 인접노드 확인 : 2, 6번 노드
- (1) 3번노드까지의 비용 + 3번에서 인접노드까지의 비용과 (2) 현재 거리 값을 비교
[Step 6] 우선순위 큐에서 원소를 꺼냅니다. 3번 노드는 이미 방문했으므로 무시
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 4 노드 : 3)
[Step 7] 우선순위 큐에서 원소를 꺼냄. 아직 방문하지 않은 6번 노드 처리
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 4 노드 : 6)
- 인접노드 확인 : 없음
[Step 8] 우선순위 큐에서 원소를 꺼냅니다. 3번 노드는 이미 방문했으므로 무시
- 우선순위 큐에서 원소를 꺼냄 : (거리 : 5 노드 : 3)
다익스트라 알고리즘 : 개선된 구현 방법
파이썬
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정
# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어있는 노드에 대한 정보를 담는 리스트 만들기
graph = [[] for i in range(n+1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n+1)
# 모든 간선 정보를 입력 받기
for _ in range(m):
a, b, c = map(int, input().split())
# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph[a].append((b,c))
def dijkstra(start):
q = []
# 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
heapq.heappush(q, (0, start))
distance[start] = 0
while q: # 큐가 비어있지 않다면
# 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
dist, now = heapq.heappop(q)
# 현재 노드가 이미 처리된 적 있는 노드라면 무시
if distance[now] < dist:
continue
# 현재 노드와 연결된 다른 인접한 노드들을 확인
for i in graph[now]:
const = dist + i[1]
# 현재 노드를 거처서, 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost,i[0]))
# 다익스트라 알고리즘을 수행
dijkstra(start)
# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
# 도달할 수 없는 경우 ,무한이라고 출력
if distance[i] == INF:
print("INF")
# 도달할 수 있는 경우 거리를 출력
else:
print(distance[i])
자바
import java.util.*;
class Node implements Comparable<Node> {
private int index;
private int distance;
public Node(int index, int distance) {
this.index = index;
this.distance = distance;
}
public int getIndex() {
return this.index;
}
public int getDistance() {
return this.distance;
}
// 거리(비용)가 짧은 것이 높은 우선순위를 가지도록 설정
@Override
public int compareTo(Node other) {
if (this.distance < other.distance) {
return -1;
}
return 1;
}
}
public class Main {
public static final int INF = (int) 1e9; // 무한을 의미하는 값으로 10억을 설정
// 노드의 개수(N), 간선의 개수(M), 시작 노드 번호(Start)
// 노드의 개수는 최대 100,000개라고 가정
public static int n, m, start;
// 각 노드에 연결되어 있는 노드에 대한 정보를 담는 배열
public static ArrayList<ArrayList<Node>> graph = new ArrayList<ArrayList<Node>>();
// 최단 거리 테이블 만들기
public static int[] d = new int[100001];
public static void dijkstra(int start) {
PriorityQueue<Node> pq = new PriorityQueue<>();
// 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
pq.offer(new Node(start, 0));
d[start] = 0;
while(!pq.isEmpty()) { // 큐가 비어있지 않다면
// 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
Node node = pq.poll();
int dist = node.getDistance(); // 현재 노드까지의 비용
int now = node.getIndex(); // 현재 노드
// 현재 노드가 이미 처리된 적이 있는 노드라면 무시
if (d[now] < dist) continue;
// 현재 노드와 연결된 다른 인접한 노드들을 확인
for (int i = 0; i < graph.get(now).size(); i++) {
int cost = d[now] + graph.get(now).get(i).getDistance();
// 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
if (cost < d[graph.get(now).get(i).getIndex()]) {
d[graph.get(now).get(i).getIndex()] = cost;
pq.offer(new Node(graph.get(now).get(i).getIndex(), cost));
}
}
}
}
public static void main(String[] args) {
Scanner sc = new Scanner(System.in);
n = sc.nextInt();
m = sc.nextInt();
start = sc.nextInt();
// 그래프 초기화
for (int i = 0; i <= n; i++) {
graph.add(new ArrayList<Node>());
}
// 모든 간선 정보를 입력받기
for (int i = 0; i < m; i++) {
int a = sc.nextInt();
int b = sc.nextInt();
int c = sc.nextInt();
// a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph.get(a).add(new Node(b, c));
}
// 최단 거리 테이블을 모두 무한으로 초기화
Arrays.fill(d, INF);
// 다익스트라 알고리즘을 수행
dijkstra(start);
// 모든 노드로 가기 위한 최단 거리를 출력
for (int i = 1; i <= n; i++) {
// 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
if (d[i] == INF) {
System.out.println("INFINITY");
}
// 도달할 수 있는 경우 거리를 출력
else {
System.out.println(d[i]);
}
}
}
}
성능 분석
- 힙 자료구조를 이용하는 다익스트라 알고리즘의 시간복잡도 : O(ElogV)
- 노드를 하나씩 꺼내 검사하는 반복문(while문)은 노드의 개수 v 이상의 횟수로는 처리되지 않음
- 결과적으로 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총 횟수는 최대 간선의 개수 만큼 연산이 수행될 수 있음
- E개의 원소를 우선순위 큐에 넣었다가 모두 빼내는 연산과 매우 유사
- 시간복잡도 : O(ElogE)
- 중복 간선을 포함하지 않는 경우 : O(ElogV)
참고자료 및 출처
https://www.youtube.com/watch?v=acqm9mM1P6o&t=3031s
'알고리즘' 카테고리의 다른 글
[7] 백트래킹 알고리즘 (파이썬 구현) (0) | 2023.06.25 |
---|---|
[6-2] 최단거리 알고리즘 - 플로이드 워셜 (0) | 2023.06.25 |
[5] 다이나믹 프로그래밍 (0) | 2023.02.28 |
[4] 이진탐색 (0) | 2023.02.28 |
[3] 정렬 알고리즘 (0) | 2023.02.28 |