CS/알고리즘

[알고리즘] DFS&BFS - (1) DFS

말하는 알감자 2024. 1. 17. 16:48

DFS (Depth-First Search)

: DFS는 깊이 우선 탐색이라 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.

1. 그래프(Graph) 기본 구조

그래프는 노드(node)와 간선(edge)로 표현되며, 이때 노드를 정점(vertex)라 한다.

그래프 탐색이란, 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다.

두 노드가 간선으로 연결되어 있다면 '두 노드는 인접하다(Adjacent)' 라고 한다.

1) 그래프 표현 방식

(1) 인접 행렬 (Adjacency Matrix)

인접 행렬 (Adjacency Matrix)

2차원 배열로 그래프의 연결 관계를 표현하는 방식

연결되지 않은 노드 끼리는 무한(infinity)의 비용이라 작성

- 예제 코드 : Adjacency_Matrix.py

  INF = 999999999 # 무한의 비용 선언

  # 2차원 리스트를 이용해 인접 행렬 표현
  graph = [
      [0, 7, 5],
      [7, 0, INF],
      [5, INF, 0]
  ]

  print(graph)

- 출력

  [[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]

(2) 인접 리스트(Adjacency List)

인접 리스트 (Adjacency list)

리스트 그래프의 연결 관계를 표현하는 방식

밑의 그림처럼 모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장

+) 인접 리스트 구현

인접 리스트는 '연결 리스트'라는 자료구조를 이용해 구현하는데, C++이나 자바와 같은 프로그래밍 언어에서는 별도로 연결 리스트 기능을 위한 표준 라이브러리를 제공하는 반면에, 파이썬은 기본 자료형인 리스트 자료형이 append()와 메소드를 제공하므로, 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.

파이썬으로 인접 리스트를 아용해 그래프를 표현하고자 할 때에도, 단순히 2차원 리스트를 이용하면 된다는 점만 기억하자!

- 예제 코드 : Adjacency_List.py

  # 행(Row)이 3개인 2차원 리스트로 인접 리스트 표현
  graph = [[] for _ in range(3)]

  #노드 0에 연결된 노드 정보 저장(노드, 거리)
  graph[0].append((1, 7)    
  graph[0].append((2, 5))

  #노드 1에 연결된 노드 정보 저장(노드, 거리)
  graph[1].append((0, 7))

  #노드 2에 연결된 노드 정보 저장(노드, 거리)
  graph[2].append((0, 5))

  print(graph)

- 출력

    [[(1, 7), (2, 5)], [0, 7)],[(0,5)]]

2) 두 방식의 차이

(1) 메모리 측면

: 인접 행렬 방식은 모든 관계를 저장하므로, 노드 개수가 많을 수록 메모리가 불필요하게 낭비된다.

반면, 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.

(2) 속도 측면

: 인접 행렬 방식은 특정 두 노드가 연결되어있는지 확인하기 쉽다.

반면, 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 특정한 두 노드가 연결되어 있는 지에 대한 정보를 얻기 위해서 연결된 데이터를 하나씩 확인해야해서, 정보를 얻는 속도가 느리다.

ex) 노드 1과 노드 7이 연결된 그래프

- 인접 행렬 : graph[1][7]만 확인하면 됨
- 인접 리스트 : 노드1에 대한 인접 리스트를 앞에서부터 차례대로 확인해야 한다.

그러므로 특정한 노드와 연결된 모든 인접 노드를 순회해야하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.

2. DFS 동작

DFS는 깊이 우선 알고리즘으로, 이 알고리즘은 특정한 경로를 탐색하다가 특정한 상황에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘이다.

DFS는 stack 자료 구조를 이용하며, 구체적인 동작 과정은 다음과 같다.

1️⃣ 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
2️⃣ 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
3️⃣ 2번의 과정을 더 이상 수행할 수 없을 때 까지 반복한다.

+) 방문 처리는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 않게 체크하는 것을 의미한다. 방문 처리를 함으로써 각 노드를 한 번씩만 처리할 수 있다.

1) 예제

위의 그래프를 노드 1을 시작 노드로 설정하여 DFS를 이용해 탐색을 진행하면 어떻게 될까?

깊이 우선 탐색이라는 이름에서부터 알 수 있듯, 단순하게 가장 깊숙이 위치하는 노드에 닿을 때 까지 확인(탐색)하면 된다.

인접한 노드 중 방문하지 않은 노드가 여러 개 있으면, 번호가 낮은 순서부터 처리한다.

- step1 : 시작 노드인 '1'을 스택에 삽입하고 방문 처리를 한다.

+) 방문 처리된 노드는 회색으로, 현재 처리하는 스택의 최상단 노드는 하늘색으로 표현한다.

- step2 : 스택의 최상단 노드인 '1'에 방문하지 않은 인접 노드 '2', '3', '8'이 있다. 이 중에서 가장 작은 노드인 '2'를 스택에 넣고 방문 처리를 한다.

- step3 : 스택의 최상단 노드인 '2'에 방문하지 않은 인접 노드 '7'이 있다. 따라서 '7'번 노드를 스택에 넣고 방문 처리를 한다.

- step4 : 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드 '6'과 '8'이 있다. 이 중에서 가장 작은 노드인 '6'을 스택에 넣고 방문 처리를 한다.

- step5 : 스택의 최상단 노드인 '6'에 방문하지 않은 인접 노드가 없다. 따라서 스택에서 '6'번 노드를 꺼낸다.

- step6 : 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드 '8'이 있다. 따라서 '8'번 노드를 스택에 넣고 방문 처리를 한다.

- step7 : 스택의 최상단 노드인 '8'에 방문하지 않은 인접 노드가 없다. 따라서 스택에서 '8'번 노드를 꺼낸다.

- step8 : 스택의 최상단 노드인 '7'에 방문하지 않은 인접 노드가 없다. 따라서 스택에서 '7'번 노드를 꺼낸다.

- step9 : 스택의 최상단 노드인 '2'에 방문하지 않은 인접 노드가 없다. 따라서 스택에서 '2'번 노드를 꺼낸다.

- step10 : 스택의 최상단 노드인 '1'에 방문하지 않은 인접 노드 '3'을 스택에 넣고 방문 처리한다.

- step11 : 스택의 최상단 노드인 '3'에 방문하지 않은 인접 노드 '4'와 '5'가 있다. 이 중에서 가장 작은 노드인 '4'를 스택에 넣고 방문 처리를 한다.

- step12 : 스택의 최상단 노드인 '4'에 방문하지 않은 인접 노드 '5'가 있다. 따라서 '5'번 노드를 스택에 넣고 방문 처리를 한다.

- step13 : 남아 있는 노드에 방문하지 않은 인접 노드가 없다. 따라서 모든 노드를 차례대로 꺼내면 다음과 같다.

결과적으로 노드의 탐색 순서 (스택에 들어간 순서)는 다음과 같다.

1 -> 2 -> 7 -> 6 -> 8 -> 3 -> 4 -> 5

깊이 우선 탐색 알고리즘인 DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다. 실제로는 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우 O(N)의 시간이 소요된다는 특징이 있다.

또한 DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다.

아래는 예제 소스 코드이다.

- 예제 코드 : dfs.py


# DFS 메서드 정의
def dfs(graph, v, visited):
    # 현재 노드를 방문 처리
    visited[v] = True
    print(v, end = ' ')
    # 현재 노드와 연결된 다른 노드를 재귀적으로 방문
    for i in graph[v]:
        if not visited[i]:
            dfs(graph, i, visited)

# 각 노드가 연결된 정보를 리스트 자료형으로 표현 (2차원 리스트)
graph = [
    [],
    [2, 3, 8],
    [1, 7],
    [1, 4, 5],
    [3, 5],
    [3, 4],
    [7],
    [2, 6, 8],
    [1, 7]
]

# 각 노드가 방문된 정보를 리스트 자료형으로 표현 (1차원 리스트)
visited = [False] * 9

#정의된 DFS 함수 호출
dfs(graph, 1, visited)

- 출력

1 2 7 6 8 3 4 5