stack을 이용해서 recursion을 iteration으로 바꾸기.

3 분 소요

1-line summary

stack을 이용해서 recursion DFS를 iteration으로 변경해봄.

Recursion

프로그래머의 성향에 따라서 다를 수 있지만, recursion이라는 직관적으로 문제를 풀 수 있는 방법을 알려줍니다. 뿐만 아니라, 해당 기법은 for를 이용한 iteration보다 훨씬 이해가 쉽다는 장점이 있죠. 사실, 저는 “가독성이 매우 뛰어나다”라는 측면에서 recursion의 중요성을 이해합니다.
하지만, recursion의 경우는 함수에서 또 다른 함수를 반복적으로 call을 하기 때문에, 현재의 함수 call이 어떤 함수로부터 발생한 것인지를 다 기억해야 한다는 한계가 있죠. 간단하게 아래와 같은 factorial(n)이 있다고 합시다. factorial(10)을 call하면, “10에서 9를 불렀고, 9에서 8을 불렀고, 이 과정을 다 컴퓨터가 기억해놓아야 합니다”. 그래야 이후에 다 합쳐서 문제없이 해결할 수 있을 테니까요.
이를 해결하기 위해서, recursion call을 함수의 맨 끝에만 위치시킴으로써 효율적으로 해결하는 tail-recursion이라는 기법도 있습니다. 이 기법은 함수 끝에서 recursion call을 하게 되므로, 이전의 함수를 기억할 필요가 없다는 장점이 있죠. 하지만, 이것이 가능하려면 해당 언어에서 tail-recursion optimization이라는 것을 지원해야 합니다만, python에서는 지원하지 않아요.

def factorial(n): 
    if n==1:
        return 1
    else:
        return n*factorial(n-1)

아무튼, 뭐 웬만한 개발에서는 recursion을 그냥 써도 됩니다만, 아래 코드를 보시면, 제 컴퓨터에서는 recursion이 1000개만 되어도, maximum recursion depth를 초과하는 문제가 발생합니다. 물론 sys.setrecursionlimit를 사용해서 최대 recursion을 조정할 수 있지만, 저는 하지 않겠습니다. 잘못 건드리면 스택오버플로우가 발생하거든요.
또한, 사실 아래 문제의 경우는 iteration으로 바꾸는 게 워낙 쉽기도 하죠. 그냥 바꾸는 것이 쉽습니다.

import networkx as nx
import sys

def factorial_recursive(n): 
    if n==1:
        return 1
    else: 
        return n*factorial_recursive(n-1)

def factorial_iteration(n): 
    r = 1
    for i in range(n, 0, -1):
        r = r*i
    return r

assert factorial_recursive(10) == factorial_iteration(10)
try: 
    recursion_limit = sys.getrecursionlimit()
    print(f"recursion limit: {recursion_limit}")
    factorial_recursive(recursion_limit)
except Exception as error_code:
    # 하지만, recursion은 수행 횟수에 제한이 있어서, 효과적이지 못할 때가 있음.
    print("Exception: ",error_code)
print("=="*30)

recursion limit: 1000
Exception:  maximum recursion depth exceeded in comparison
============================================================

Depth first search(DFS) problem

graph를 Depth-first search로 풀 때, recursive, iterative하게 풀었습니다.
recursion을 iterative하게 풀 때 중요한 것은 “각 recursion에서 필요로 하는 것이 어떤 값들(argument)인가?”죠.

Graph DFS traversal: recursion

factorial과 같은 문제는 recursion을 iteration으로 변경하는 것이 쉽습니다만, graph나 tree처럼 조금 복잡하게 recursion이 걸리는 경우에는 변경하는 것이 약간 어렵습니다. 그래도, 우선은 그냥 recursion으로 풀어보죠.
저는 간단하게, graph G에서 source로부터 출발하여 모든 node를 DFS로 탐색하는, 간단한 함수를 만들었습니다.

import networkx as nx

def dfs_recursive(G, source, visited=set()): 
    """
    G: nx.Graph
    source: DFS로 탐색할 때 첫번째 노드
    visited: 방문한 node들의 set, 모든 recursion에서 같은 객체를 공유함.
    """
    if len(visited)==len(G):
        # visited와 G의 크기가 같으면 모든 노드를 방문했다는 말이므로, 빈 edge를 리턴함.
        return []
    else: 
        # source를 방문했으므로 visited에 업데이트하고.
        visited.add(source)
        # source로부터 visited를 방문하지 않고 탐색하는 edge
        edges = []
        for nbr in (set(G[source]) - visited):
            # 현재 source의 neighbor중에서 visited에 포함되지 않는 노드 nbr에 대해서 
            # 매번 nbr이 visited에 추가되지 않았는지 확인하고
            if nbr not in visited: 
                # 추가할 수 있는 경우 다음 edge를 추가해주고, recursion을 수행함.
                edges.append((source, nbr))
                edges += dfs_recursive(G, nbr, visited=visited)
        return edges

Graph DFS traversal: iteration

앞서 말한 것처럼 recursion으로 풀 경우 python에서 graph의 크기가 충분히 커졌을 때, 문제가 생길 수 있습니다. 따라서, 이럴 때는 stack을 이용해서 iteration으로 풀어주는 것이 좋죠.
방법이야 여러 가지가 있게지만, 저는 stack을 이용해서 recursion을 call하는 함수와, call되는 함수를 매번 state로 기억해두기로 했습니다. 즉, call stack처럼 만들어준 것이죠.
recursion을 iteration으로 변경할 때 신경써야 하는 것은 “각 recursion마다 필요로 하는 argument들이 무엇이고, 그 상태를 어떻게 저장해야 하는가?”입니다. 사실, 정작 만들고 나니까, 생각보다 간단해서 놀랐습니다.
아래 iteration에서도 state_stack이라는 리스트에, 각 recursion마다 필요한 argument 값을 저장해두고 마치 recursion과 유사하게 돌아가는 것이죠.

def dfs_iterative(G, source): 
    # shared contain in all recursion call. 
    edges = []
    visited = set([source])
    # state_stack: 어떤 recurstion이 어떤 recursion을 콜했는지, argument에 대해서 저장해둠
    # parent => child recursion을 포함한 recursion의 argument
    # child => parent child recurtion에서 새롭게 콜하는 recurion의 argument
    # 즉, 아래에서 source가 argument이 recursion들에서는 다시 nbr의 argument에 대해서 
    # 새롭게 recursion을 call하게 됩니다. 이러한 구조를 stack에 저장해주는 것이죠.
    state_stack = [{'parent': source, 'child': nbr} for nbr in G[source]]

    while True: 
        # state_stack이 비어 있다는 것은 더이상 실행할 recursion이 없다는 것. 
        if len(state_stack)==0:
            return edges
        else:
            # 새로운 state를 끝에서 가져옴.
            cur_state = state_stack.pop()
            from_n, to_n = cur_state['parent'], cur_state['child']
            if to_n not in visited: 
                visited.add(to_n)
                edges.append((from_n, to_n))
                # Update New states: 새로운 state를 update해줌
                for nbr in G[to_n]: 
                    if nbr not in visited: 
                        state_stack.append({'parent': to_n, 'child': nbr})

wrap-up

사실, recursion을 stack을 이용해서 간단하게 iteration의 형태로 변경해봤지만, 사실 모든 recursion이 이렇게 쉽게 변형되는 것은 아닙니다. 꽤 복잡한 경우도 매우 많죠.
하지만, 그래도, 대부분의 경우 stack은 이용한다는 것, recursion이 돌아가는 방식이 결국은 가장 최근에 발생한 놈을 다시 사용한다는, stack과 유사한 LIFO의 방식을 사용한다는 것만 정확하게 기억해두시는 것이 좋겠네요.

reference

way to go from recursion to iteration

Twitter Facebook LinkedIn

frhyme

stack을 이용해서 recursion을 iteration으로 바꾸기.

1-line summary

Recursion

Depth first search(DFS) problem

Graph DFS traversal: recursion

Graph DFS traversal: iteration

wrap-up

reference

공유하기

댓글남기기