기록을 남기자

전체 글 186

카테고리 설명
개발,CS,PS 기록을 남기려 합니다.
  • 1. 분할 정복(Divide and Conquer)큰 문제를 작은 부분 문제로 분할하고, 각각의 작은 부분 문제를 해결하여 전체 문제의 해답을 구하는 알고리즘문제의 크기가 커서 직접적인 해결이 어려운 경우 유용하다.대표적인 예로, 정렬 알고리즘인 병합 정렬(Merge Sort)과 퀵 정렬(Quick Sort)이 있다. 2. 동작 방식문제를 작은 부분 문제들로 분할한다.분할된 부분 문제들을 각각 재귀적으로 해결한다.부분 문제들의 해답을 결합하여 전체 문제의 해답을 얻는다. 3.  시간 복잡도시간 복잡도는 일반적으로 부분 문제의 개수, 분할된 문제의 크기, 분할과정의 복잡도에 따라 결정된다.대부분의 경우, 분할 정복 알고리즘은 재귀적인 방법으로 문제를 해결하므로, 재귀 호출의 깊이에 따라 시간 복잡도가 결정..

  • 완전 탐색알고리즘에서 사용되는 기법 중 하나로 '모든 가능한 경우의 수를 탐색'하여 '최적의 결과를 찾는 방법'을 의미합니다.💡 미 완전 탐색은 무엇일까?- 모든 경우의 수를 고려하지 더 이상 탐색이 필요 없는 경우 그 루트를 끊어버리는 것을 의미합니다.- 예를 들어서 재귀함수가 함수를 모든 경우의 수를 탐색하다 결과를 찾아서 탐색을 중지하는 경우 루트를 끊는 경우를 자치기(Pruning)라고 합니다. 이를 수행하면 불필요한 탐색을 줄일 수 있습니다.1. 브루트 포스(Brute-Force)난폭한 힘, 폭력 => 무식하지만 확실한 방식을 의미이는 수행하는데 오래걸리는 데다 자원이 많이 소요되지만 이론적으로 가능한 수를 모두 검색하기에 예상된 결과를 얻을 수 있습니다.'모든 경우를 다 탐색'하면서 결과를 ..

  • 1.  이진 탐색이진 탐색은 탐색의 범위를 절반씩 좁혀가며 데이터를 탐색하는 알고리즘입니다. 이진탐색 알고리즘은 리스트 내 데이터가 어느 정도 정렬되어 있어야만 사용 가능하며 데이터가 무작위로 정렬되어 있다면 사용할 수 없습니다. 이진 탐색 알고리즘은 입력 데이터가 많거나(e.g., 1,000만 개 이상) 탐색 범위의 크기가 매우 넓을 때(e.g., 1,000억 이상) 효과적으로 문제를 해결할 수 있습니다.2.  이진 탐색의 동작 과정이진 탐색은 특정 데이터를 찾기 위해 리스트 내 기준점으로서 시작 인덱스, 중간 인덱스, 마지막 인덱스를 사용합니다.  이진 탐색의 동작 순서는 아래와 같습니다. 1️⃣ 시작 인덱스와 마지막 인덱스 사이의 중간 값에서 소수점 이하를 버려 중간 인덱스를 정합니다.2️⃣ 중간 ..

  • 플로이드 워셜플로이드 워셜 알고리즘을 쓰는 문제의 경우, 노드의 개수가 500개 이하일 경우가 많다.하지만 노드가 500개라고 해도 500 * 500 * 500 은 1억이 넘어가기 때문에 시간제한이 넉넉하지 않다면 시간초과에 걸릴 수도 있다.1. 플로이드 워셜 알고리즘 개요모든 노드에서 다른 모든 노드까지의 최단 경로를 모두 계산한다.플로이드 워셜(Floyd-Warshall) 알고리즘은 다익스트라 알고리즘과 마찬가지로 단계별로 거쳐 가는 노드를 기준으로 알고리즘을 수행한다.다만 매 단계마다 방문하지 않은 노드 중에 최단 거리를 갖는 노드를 찾는 과정이 필요하지 않다.플로이드 워셜은 2차원 테이블에 최단 거리 정보를 저장한다.플로이드 워셜 알고리즘은 다이나믹 프로그래밍 유형에 속한다.2. 플로이드 워셜 알..

  • 최단 경로 문제최단 경로 알고리즘은 가장 짧은 경로를 찾는 알고리즘을 의미한다. cf. 다양한 문제 상황한 지점에서 다른 한 지점까지의 최단 경로한 지점에서 다른 모든 지점까지의 최단 경로모든 지점에서 다른 모든 지점까지의 최단 경로각 지점은 그래프에서 노드로 표현한다.지점 간 연결된 도로는 그래프에서 간선으로 표현한다. 방향그래프 예시 1. 다익스트라 최단 경로 알고리즘 개요특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산한다.다익스트라 최단 경로 알고리즘은 음의 간선이 없을 때 정상적으로 동작한다.현실 세계의 도로(간선)은 음의 간선으로 표현되지 않는다.다익스트라 최단 경로 알고리즘은 그리디 알고리즘으로 분류된다.매 상황에서 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다. 2..

작성일
2024. 7. 11. 23:58
작성자
ssun_bear
반응형

1. 분할 정복(Divide and Conquer)

큰 문제 작은 부분 문제로 분할하고, 각각의 작은 부분 문제를 해결하여 전체 문제의 해답을 구하는 알고리즘

문제의 크기가 커서 직접적인 해결이 어려운 경우 유용하다.

대표적인 예로, 정렬 알고리즘인 병합 정렬(Merge Sort)과 퀵 정렬(Quick Sort)이 있다.

 

2. 동작 방식

  1. 문제를 작은 부분 문제들로 분할한다.
  2. 분할된 부분 문제들을 각각 재귀적으로 해결한다.
  3. 부분 문제들의 해답을 결합하여 전체 문제의 해답을 얻는다.

 

3.  시간 복잡도

시간 복잡도는 일반적으로 부분 문제의 개수, 분할된 문제의 크기, 분할과정의 복잡도에 따라 결정된다.

대부분의 경우, 분할 정복 알고리즘은 재귀적인 방법으로 문제를 해결하므로, 재귀 호출의 깊이에 따라 시간 복잡도가 결정된다.

분할된 문제들의 크기가 일정하다면, 재귀 호출의 깊이는 로그 시간 복잡도에 비례한다.

 

분할된 문제의 개수가 N이라면, 시간 복잡도는 O(N*logN)

 

그러나 분할된 문제의 개수가 지수적으로 증가하거나 분할된 문제들이 크기가 일정하지 않은 경우, 시간 복잡도가 지수적으로 증가할 수 있다.

이 경우에는 다른 알고리즘을 고려해야 한다.

 

4. 병합 정렬(Merge Sort)

분할과 정복을 모두 사용하여 리스트를 반으로 나누어 각각을 재귀적으로 정렬하고, 정렬된 두 개의 부분 리스트를 합쳐 전체 리스트를 정렬하는 방식

1. 동작 과정

  1. 분할: 입력 리스트를 반으로 나눕니다.
  2. 정복: 각각의 부분 리스트를 재귀적으로 병합 정렬합니다.
  3. 결합: 정렬된 부분 리스트를 합쳐 전체 리스트를 정렬합니다.

 

2. 파이썬 구현 코드

def merge_sort(arr):
    if len(arr) <= 1:
        return arr
    
    # Divide
    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]
    
    # Conquer
    left_sorted = merge_sort(left)
    right_sorted = merge_sort(right)
    
    # Combine
    return merge(left_sorted, right_sorted)
    
    
def merge(left, right):
    result = []
    i, j = 0, 0
    
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    result += left[i:]
    result += right[j:]
    
    return result

 

  • merge_sort 함수 :
    • 입력 리스트를 반으로 나누고 재귀적으로 호출하여 각각을 정렬
    • 마지막으로 merge 함수를 사용하여 두 정렬된 리스트를 합병하여 전체 리스트를 정렬
  • merge 함수 :
    • 두 개의 정렬된 리스트를 인수로 받아, 두 리스트를 비교하여 작은 순서대로 result 리스트에 삽입하고, 남은 요소를 추가하여 반환

 

5. 퀵 정렬(Quick Sort)

분할과 정복을 사용하여 리스트를 분할하고, 각각을 재귀적으로 정렬한 다음, 전체 리스트를 합치지 않고 원래 위치에 놓여있는 것을 기준으로 정렬

 

특히, 정렬을 위해 별도의 저장 공간을 필요로 하지 않아 메모리 사용량이 적다는 특징이 있다.

1. 동작과정

  1. 기준점(pivot) 선택: 리스트에서 하나의 원소를 기준점으로 선택한다.
  2. 분할: 기준점을 기준으로 리스트를 두 개로 분할한다. 분할된 두 개의 리스트는 각각 기준점보다 작은 값과 큰 값으로 이루어져 있다.
  3. 정복: 각각의 부분 리스트를 재귀적으로 퀵 정렬한다.
  4. 결합: 정렬된 부분 리스트를 합쳐 전체 리스트를 정렬한다.

 

2. 파이썬 구현 코드

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    
    # Divide
    pivot = arr[0]
    left = []
    right = []
    
    for i in range(1, len(arr)):
        if arr[i] < pivot:
            left.append(arr[i])
        else:
            right.append(arr[i])
    
    # Conquer
    left_sorted = quick_sort(left)
    right_sorted = quick_sort(right)
    
    # Combine
    return left_sorted + [pivot] + right_sorted

 

  • quick_sort 함수 :
    • 입력 리스트의 첫 번째 요소를 기준으로 왼쪽과 오른쪽 부분 리스트를 나눔
    • 재귀적으로 각각을 정렬하여 마지막으로 합쳐서 반환

 

입력 리스트의 첫 번째 요소를 기준으로 나누기 때문에, 최악의 경우(이미 정렬된 리스트, 피벗이 가장 작거나 큰 수 등)에는 분할이 제대로 이루어지지 않아 시간 복잡도가 O(n^2)에 근접해질 수 있다.

이를 방지하기 위해서는 피벗을 무작위로 선택하거나, 미리 섞어서 평균적인 경우를 대응하는 방법 등이 있다.

 

반응형
작성일
2024. 7. 11. 23:56
작성자
ssun_bear
반응형

완전 탐색

  • 알고리즘에서 사용되는 기법 중 하나로 '모든 가능한 경우의 수를 탐색'하여 '최적의 결과를 찾는 방법'을 의미합니다.

💡 미 완전 탐색은 무엇일까?
- 모든 경우의 수를 고려하지 더 이상 탐색이 필요 없는 경우 그 루트를 끊어버리는 것을 의미합니다.
- 예를 들어서 재귀함수가 함수를 모든 경우의 수를 탐색하다 결과를 찾아서 탐색을 중지하는 경우 루트를 끊는 경우를 자치기(Pruning)라고 합니다. 이를 수행하면 불필요한 탐색을 줄일 수 있습니다.

1. 브루트 포스(Brute-Force)

  • 난폭한 힘, 폭력 => 무식하지만 확실한 방식을 의미
  • 이는 수행하는데 오래걸리는 데다 자원이 많이 소요되지만 이론적으로 가능한 수를 모두 검색하기에 예상된 결과를 얻을 수 있습니다.
  • '모든 경우를 다 탐색'하면서 결과를 얻는 알고리즘을 의미합니다.
  • 해당 알고리즘은 경우의 수가 작을 때 사용하는 것이 일반적입니다. 대표적인 예시로는 자물쇠의 비밀번호를 알 수 없는 경우 모든 경우를 대입하여 비밀번호를 찾아가는 경우가 있습니다.
💡 완전 탐색에서 브루트 포스란?
모든 경우의 수를 탐색하여 최적의 결과를 찾아가는 완전탐색에서 브루트 포스는 모든 경우를 다 검사하여 원하는 값을 탐색하는 방법입니다.

💡 브루트 포스를 이용한 공격방식이란?
해커들은 이 알고리즘을 이용하여 다양한 공격을 시도합니다. 예를 들어, 로그인 페이지에서 사용자 이름과 비밀번호를 입력하여 로그인하는 경우 해커들은 브루트 포스 알고리즘을 이용하여 가능한 모든 비밀번호를 시도하면서 로그인을 시도합니다. 이러한 공격을 방지하기 위해서는 강력한 비밀번호를 사용하고 로그인 시도 횟수를 제안하는 등의 보안 조치를 취해야 합니다.

브루터 포스 사용 예시

  1. 배열 탐색
    • 배열에서 특정 값을 찾는 문제에서 브루트 포스 알고리즘은 배열을 모두 탐색하여 값을 찾는 방식으로 문제를 해결합니다.
  2. 문자열 비교
    • 문자열 비교 문제에서 브루트 포스 알고리즘은 가능한 모든 문자열 쌍을 비교하여 최소값 또는 최대값을 찾는 방식으로 문제를 해결합니다

2. 비트마스크(Bitmask)

  • '이진수'를 '비트 연산'을 통해 경우의 수를 줄여가며 탐색하는 방식을 의미합니다.
  • 모든 경우의 수(상태)를 이진수로 표현
  • 비트 마스크를 사용하면 하나의 변수에 여러개의 상태정보를 저장할 수 있으며 이를 통해 복잡한 조건문을 간단하게 처리할 수 있습니다.
  • 이 방법은 비트 연산을 사용하기 때문에 빠르게 계산할 수 있어서, 경우의 수가 많은경우에 유용합니다.
  • 💡 완전 탐색에서 비트마스크란? 모든 경우의 수를 탐색하여 최적의 결과를 찾아가는 완전탐색에서 비트마스크는 모든 경우의 수를 이진수로 표현하여 빠르게 계산을 해 나아가는 방식입니다.

간단한 연산

a = 10 #1010
b = 12 #1100

result = a & b
result = a | b
result = a ^ b # XOR 연산
result = a << 1
result = a >> 1

비트마스크 사용 예시

  1. 권한 관리
    PERMISSION_READ = 0b0001 << 0; # 0001
    PERMISSION_WRITE = 0b0001 << 1; # 0010
    PERMISSION_DELETE = 0b0001 << 2; # 0100
    PERMISSION_EXECUTE = 0b0001 << 3; # 1000
    
    print(PERMISSION_EXECUTE)
    userPermission = PERMISSION_READ | PERMISSION_WRITE
    print(userPermission)
    groupPermission = PERMISSION_READ | PERMISSION_EXECUTE
    
    hasReadPermission = (userPermission & PERMISSION_READ) != 0
    print(hasReadPermission)
    hasDeletePermission = groupPermission & PERMISSION_DELETE != 0
    print(hasDeletePermission)
    
    #출력문
    #8
    #3
    #True
    #False


  2. 보통 권한은 4가지 이상으로 구분되어 있는 경우가 많습니다. 이때 각 권한을 비트로 표현하여 하나의 정수값으로 나타내면 매우 간편해집니다.
  3. 집합 관리
    set = (1 << 3) | (1 << 5) | (1 << 7) #0010 1010 1000
    hasElement5 = (set & (1 << 5)) != 0; #True
    hasElement6 = (set & (1 << 6)) != 0; #False
  4. 집합을 비트로 표현하여 메모리를 절약할 수 있습니다. 예를들어, 0부터 31까지의 정수 중에서 3, 5, 7번째 원소를 포함하는 집합을 나타내면 다음과 같이 표현할 수 있습니다.
  5. 상태 플래그 관리
    FLAG_POWER_OF_TWO = 1 << 0; #0001
    FLAG_NEGATIVE = 1 << 1; #0010
    
    number = 8; # 2의 거듭제곱
    flags = 0;
    
    if number & (number-1) == 0 :
        flags |= FLAG_POWER_OF_TWO
    
    
    if (number < 0):
        flags |= FLAG_NEGATIVE
        print(flags)
    
    
    if ((flags & FLAG_POWER_OF_TWO) != 0):
        print(number, " is power of two") #1
    
    if ((flags & FLAG_NEGATIVE != 0)):
        print(number, "is negaive") # 2
  6. 여러 상태를 하나의 정수값으로 나타내어 관리할 수 있다. 예를 들어, 주어진 수가 2의 거듭제곱인지 여부를 판단할 때 다음과 같은 방법을 사용할 수 있습니다.

3. 백트래킹(Backtracking)

  • 해결책으로 가는 도중에 막히게 되면 그 지점으로 다시 돌아가서 다른 경로를 탐색하는 방식을 의미합니다. 이를 통해 모든 가능한 경우의 수를 탐색하여 해결책을 찾습니다.
  • 해당 알고리즘을 사용할 때 주로 재귀함수를 사용하여 구현하며 스택을 이용하여서 사용하는 경우도 있습니다.
  • 재귀함수를 이용하는 경우 해결책을 찾기 위해 생성, 검사, 선택, 이동, 되돌아가기 등 과정이 재귀적으로 수행됩니다.
  • 💡완전탐색에서 백트래킹이란 - 모든 경우의 수를 탐색하여 최적의 결과를 찾아가는 완전탐색에서 백트래킹은 해결책을 찾아가는 도중에 막히게 되면 다시 돌아가서 다른 경로로 탐색을 하여 결국 모든 가능한 경우의 수를 탐색하여 해결책을 찾아가는 방식으로 사용됩니다. - 주로 재귀함수, 스택이 이용됩니다.

4. 순열 탐색

  • '순열'을 이용하여 모든 경우의 수를 탐색하는 방법입니다. 순열은 서로 다른 서로 다른 n개 중에서 r개를 선택하여 숫자를 모든 순서대로 뽑는 경유를 말합나다.
  • 순열의 예
    • 1, 2, 3, 세 숫자 중 '2개를 선택' 하여 숫자를 모든 순서대로 뽑는 경우입니다.
     [1,2] [1,3] [2,1] [2,3] [3.1] [3,2]

1. Swap 배열을 이용한 순열

  • Swap 배열
    • 배열에서 두 요소의 위치를 바꿔가며 순열을 생성하는 방법입니다. 배열의 인덱스 0 부터 순서대로 선택하면 다음 인덱스와 위치를 바꾸고 이를 마지막 인덱스 까지 반복합나다.
    • 이 방법은 쉽게 구현할 수 있지만, 큰 데이터셋에서는 비효율적일 수 있습니다.
    • [1, 2, 3]배열에서 순열을 모두 구하는 예시입니다.
      1. 메인함수에서 permute메서드에 파라미터로 배열과 0개를 선택합니다.
      2. permute메서드는 재귀적으로 호출하면서 swap 메서드를 이용하여 배열의 원소를 순서대로 바꾸면서 모든 순열을 생성합니다.
      3. 이때, k는 순열을 생성할 위치를 의미합니다. 만약 k가 arr의 길이와 같아지면, 모든 원소에 대한 순열이 생성되었다는 것을 의미하므로 순열을 출력합니다.
  • 즉, 순열에서 특정 값을 fix 시키고 이후의 값들을 swap 하면서 순열을 생성한다.
  • 💡 완전 탐색에서 순열은? - 모든 경우의 수를 탐색하여 최적의 결과를 찾아가는 완전탐색에서 순열은 서로 다른 n개 중에서 r개를 선택해서 나열하면서 모든 경우의 수를 탐색하는 방식으로 사용이 됩니다. 
  • 파이썬에서는 itertools의 permutation()을 사용하는 방법이 더 편하다.

2. Visited 배열을 이용한 순열

  • 배열에서 '현재 인덱스의 값을 선택한 후' 해당 인덱스를 visited라는 배열에 체크합니다. 이후, 다음 인덱스로 넘어가기 전 visited 배열에서 체크되지 않은 가장 작은 인덱스를 선택합니다. 이를 마지막 인덱스까지 반복합니다.
  • 이 방법은 swap을 이용한 배열보다 효율적입니다.
  • 즉, 한 loop내에서 해당 인덱스가 Visited이면 다음 최소 인덱스로 넘어간다.

5. 재귀 함수(Recursion Function)

  • 함수 내부에서 ‘자기 자신을 호출’하는 함수를 의미합니다.
  • 이를 통해서 함수가 자신을 반복적으로 호출하면서 원하는 결과를 도출할 수 있습니다.
  • 💡 완전 탐색에서 재귀함수는? - 모든 경우의 수를 탐색하여 최적의 결과를 찾아가는 완전탐색에서 재귀함수는 자기 자신을 호출하며 모든 가능한 경우를 체크하면서 최적의 해답하는 방법으로 사용이 됩니다.
    💡 재귀함수는 미 완전 탐색일 수도 있다? - 재귀함수는 모든 경우의 수를 다 탐색하지 않고도 원하는 결과를 얻을 수 있는 경우도 있습니다. 따라서, 재귀함수는 미완전탐색의 일종이라고는 할 수 있지만, 항상 미완전탐색이라고 할 수는 없습니다. (뿌리 자르기)

6. 깊이 우선 탐색(DFS) / 너비 우선 탐색(BFS)

아래의 게시물을 통해 자세히 설명을 해두었으니 참조하는 것이 좋을 것 같다.

 

탐색 알고리즘 - DFS와 BFS

BFS와 DFS는 모두 그래프를 탐색하는 방법이다. 그래프는 Node와 Node를 연결하는 Edge로 이루어진 자료구조이고 그래프를 탐색하는 것은 하나의 정점으로부터 연결된 모든 정점들을 한 번씩 차례대

define-me.tistory.com

 

반응형
작성일
2024. 7. 11. 23:45
작성자
ssun_bear
반응형

1.  이진 탐색

이진 탐색은 탐색의 범위를 절반씩 좁혀가며 데이터를 탐색하는 알고리즘입니다. 

이진탐색 알고리즘은 리스트 내 데이터가 어느 정도 정렬되어 있어야만 사용 가능하며 데이터가 무작위로 정렬되어 있다면 사용할 수 없습니다. 

이진 탐색 알고리즘은 입력 데이터가 많거나(e.g., 1,000만 개 이상) 탐색 범위의 크기가 매우 넓을 때(e.g., 1,000억 이상) 효과적으로 문제를 해결할 수 있습니다.

2.  이진 탐색의 동작 과정

이진 탐색은 특정 데이터를 찾기 위해 리스트 내 기준점으로서 시작 인덱스, 중간 인덱스, 마지막 인덱스를 사용합니다.

 

이진 탐색의 동작 순서는 아래와 같습니다.

 

1️⃣ 시작 인덱스와 마지막 인덱스 사이의 중간 값에서 소수점 이하를 버려 중간 인덱스를 정합니다.

2️⃣ 중간 인덱스에 해당하는 데이터와 현재 찾으려는 데이터가 같은지 비교합니다.

3️⃣ 중간 값이 더 크면 중간 인덱스 이후의 값은 확인하지 않고, 마지막 인덱스를 중간 인덱스로부터 한 칸 앞으로 옮깁니다.

반대로, 중간 값이 더 작다면 시작 인덱스를 중간 인덱스로부터 한 칸 뒤로 옮깁니다.

4️⃣ 중간 인덱스의 값과 찾으려는 값이 같아질 때까지 2️⃣ 과정과 3️⃣ 과정을 반복합니다.

 

이제 구체적인 예시를 통해 동작 과정을 알아보겠습니다. 아래와 같이 리스트 내 10개의 데이터 중에서 값이 4인 원소를 이진 탐색을 통해 찾아보겠습니다.

 

편의상 찾고자 하는 데이터(target data)는 파란색으로 표현하고, 탐색할 필요가 없는 데이터는 회색으로 채우겠습니다.

 

(1) 리스트 내 원소가 총 10개이므로 시작 인덱스는 [0]이고 마지막 인덱스는 [9]입니다. 중간 인덱스는 시작 인덱스와 마지막 인덱스의 중간 지점인 [4]가 됩니다. [4.5]에서 소수점 이하를 버리기 때문이죠.

 

 

(2) 중간 인덱스의 값인 8은 찾으려는 값 4보다 크기 때문에, 중간 인덱스 이후의 값은 이제 따로 탐색하지 않습니다. 이제 마지막 인덱스를 중간 인덱스 한 칸 앞으로 옮깁니다. 즉, 기존 중간 인덱스가 [4]였기 때문에 마지막 인덱스는 [3]이 됩니다. 중간 인덱스는 [0]과 [3] 중간 값인 [1]이 됩니다(실제 중간 값인 [1.5]에서 소수점 이하를 제거하였습니다).

 

 

(3) 중간 인덱스의 값인 2는 찾으려는 데이터 4보다 작기 때문에 2 이하의 데이터는 탐색할 필요가 없습니다. 따라서 시작 인덱스를 중간 인덱스의 한 칸 뒤인 [2]로 옮깁니다. 이제 새로운 중간 인덱스는 [2]와 [3] 사이의 [2]가 됩니다([2.5]에서 소수점 이하 절사). 중간 인덱스에 위치한 데이터 4는 찾으려는 데이터 4와 같기 때문에 이 시점에서 탐색을 종료합니다.

 

3.  이진 탐색의 구현(Python)

파이썬 기반에서 이진 탐색은 2가지 방법으로 구현이 가능합니다. 첫 번째는 재귀 함수를 사용하는 것이고, 다른 한 가지 방법은 반복문을 이용하는 것입니다. 각 방법별로 구현 방법을 알아보도록 하겠습니다.

3.1.  재귀 함수를 활용한 구현

# 재귀함수를 활용한 이진 탐색 구현
def binary_search (arr, target, start, end):
    
    if start > end:
        return None
    
    # 중간 인덱스는 시작 인덱스와 마지막 인덱스 사이의 중간 인덱스
    # 몫만 구하기 위해 // 연산자 활용
    mid = (start + end) // 2
    
    # 중간 인덱스의 값이 타겟 데이터와 같은 경우 탐색 종료
    if arr[mid] == target:
        return mid
        
    # 중간 인덱스의 값이 타겟 데이터보다 큰 경우
    # 마지막 인덱스를 중간 인덱스의 한 칸 앞으로 이동
    elif arr[mid] > target:
        return binary_search(arr, target, start, mid-1)
        
    # 중간 인덱스의 값이 타겟 데이터보다 작은 경우
    # 시작 인덱스를 중간 인덱스의 한 칸 뒤로 이동
    else:
        return binary_search(arr, target, mid+1, end)

arr = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
n = len(arr)
# 찾으려는 값으로서 임의로 4로 설정
target = 4

# 시작 인덱스 및 마지막 인덱스를 전달인자로 할당
res = binary_search(arr, target, 0, n-1)
print("{}번째에서 타겟 확인.".format(res + 1))

 

3.2.  반복문을 활용한 구현

# 반복문을 활용한 이진 탐색 구현
def binary_search (arr, target, start, end):
    while start <= end:
        # 중간 인덱스는 시작 인덱스와 마지막 인덱스 사이의 중간 인덱스
        # 몫만 구하기 위해 // 연산자 활용
        mid = (start + end) // 2
    
        # 중간 인덱스의 값이 타겟 데이터와 같은 경우 탐색 종료
        if arr[mid] == target:
            return mid
        
        # 중간 인덱스의 값이 타겟 데이터보다 큰 경우
        # 마지막 인덱스를 중간 인덱스의 한 칸 앞으로 이동
        elif arr[mid] > target:
            end = mid - 1
        
        # 중간 인덱스의 값이 타겟 데이터보다 작은 경우
        # 시작 인덱스를 중간 인덱스의 한 칸 뒤로 이동
        else:
            start = mid + 1
            
    return None

arr = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
n = len(arr)
# 찾으려는 값으로서 임의로 4로 설정
target = 4

# 시작 인덱스 및 마지막 인덱스를 전달인자로 할당
res = binary_search(arr, target, 0, n-1)
print("{}번째에서 타겟 확인.".format(res + 1))

4.  이진 탐색의 시간 복잡도

앞서 살펴본 예시에서는 리스트 내 데이터가 총 10개였지만, 이진 탐색을 이용하면 총 3회의 탐색을 통해 원하는 데이터를 찾을 수 있었습니다. 이진 탐색은 탐색 횟수별로 확인하는 데이터의 개수가 절반씩 줄어들기 때문에 시간 복잡도가 O(log N) 입니다. 이처럼 확인하는 데이터의 개수가 절반씩 줄어드는 특징은 퀵 정렬과 동일합니다.

그렇다면 이진 탐색은 언제 사용하면 좋을까요?

탐색해야 하는 데이터의 개수나 값이 1,000만 단위 이상일 경우 이진 탐색과 같이 시간 복잡도가 O(log N) 수준으로 빠른 속도를 낼 수 있는 알고리즘을 활용하는 것이 좋습니다.

반응형
작성일
2024. 7. 11. 23:12
작성자
ssun_bear
반응형

플로이드 워셜

플로이드 워셜 알고리즘을 쓰는 문제의 경우, 노드의 개수가 500개 이하일 경우가 많다.
하지만 노드가 500개라고 해도 500 * 500 * 500 은 1억이 넘어가기 때문에 시간제한이 넉넉하지 않다면 시간초과에 걸릴 수도 있다.

1. 플로이드 워셜 알고리즘 개요

  • 모든 노드에서 다른 모든 노드까지의 최단 경로를 모두 계산한다.
  • 플로이드 워셜(Floyd-Warshall) 알고리즘은 다익스트라 알고리즘과 마찬가지로 단계별로 거쳐 가는 노드를 기준으로 알고리즘을 수행한다.
    • 다만 매 단계마다 방문하지 않은 노드 중에 최단 거리를 갖는 노드를 찾는 과정이 필요하지 않다.
  • 플로이드 워셜은 2차원 테이블에 최단 거리 정보를 저장한다.
  • 플로이드 워셜 알고리즘은 다이나믹 프로그래밍 유형에 속한다.

2. 플로이드 워셜 알고리즘

  • 각 단계마다 특정한 노드 k를 거쳐 가는 경우를 확인한다.
    • a에서 b로 가는 최단 거리보다 a에서 k를 거쳐 b로 가는 거리가 더 짧은지 검사한다.
  • 점화식은 다음과 같다.

 

3. 플로이드 워셜 알고리즘: 동작 과정 살펴보기

 

4. 플로이드 워셜 알고리즘 구현 (Python)

INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수 및 간선의 개수를 입력받기
n = int(input())
m = int(input())
# 2차원 리스트(그래프 표현)를 만들고, 무한으로 초기화
graph = [[INF] * (n + 1) for _ in range(n + 1)]

# 자기 자신에게 자기 자신으로 가는 비용은 0으로 초기화
for a in range(1, n + 1):
	for b in range(1, n + 1):
		if a == b:
			graph[a][b] = 0

# 각 간선에 대한 정보를 입력 받아, 그 값으로 초기화
for _ in range(m):
	# A에서 B로 가는 비용은 C라고 설정
	a, b, c = map(int, input().split())
	graph[a][b] = c

# 점화식에 따라 플로이드 워셜 알고리즘을 수행
for k in range(1, n + 1):
	for a in range(1, n + 1):
		for b in range(1, n + 1):
			graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])

# 수행된 결과를 출력
for a in range(1, n + 1):
	for b in range(1, n + 1):
		# 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
		if graph[a][b] == INF:
			print("INFINITY", end=" ")
		# 도달할 수 있는 경우 거리를 출력
		else:
			print(graph[a][b], end=" ")
    print()

5. 플로이드 워셜 알고리즘 성능 분석

  • 노드의 개수가 N개일 때 알고리즘 상으로 N번의 단계를 수행한다.
    • 각 단계마다 O(N^2)의 연산을 통해 현재 노드를 거쳐 가는 모든 경로를 고려한다.
  • 따라서 플로디으 워셜 알고리즘의 총 시간 복잡도는 O(N^3)이다.

최단 경로 문제 (이코테 ch7. 최단 경로 알고리즘 예시)

1.  <문제> 전보: 문제 설명

2.  <문제> 전보: 문제 조건

 

3. <문제> 전보: 문제 해결 아이디어

 

4. <문제> 전보: 답안 예시(Python)

import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수, 시작 노드를 입력받기
n, m, start = map(int, input().split())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보를 입력받기
for _ in range(m):
	x, y, z = map(int, input().split())
	# X번 노드에서 Y번 노드로 가는 비용이 Z라는 의미
	graph[x].append((y, z))

def dijkstra(start):
	q = []
	# 시작 노드로 가기 위한 최단 거리는 0으로 설정하여, 큐에 삽입
	heapq.heappush(q, (0, start))
	distance[start] = 0
	while q:  # 큐가 비어있지 않다면
		# 가장 최단 거리가 짧은 노드에 대한 정보를 꺼내기
		dist, now = heapq.heappop(q)
		if distance[now] < dist:
			continue
		# 현재 노드와 연결된 다른 인접한 노드들을 확인
		for i in graph[now]:
			cost = dist + i[1]
			# 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
			if cost < distance[i[0]]:
				distance[i[0]] = cost
				heapq.heappush(q, (cost, i[0]))

# 다익스트라 알고리즘을 수행
dijkstra(start)

# 도달할 수 있는 노드의 개수
count = 0
# 도달할 수 있는 노드 중에서, 가장 멀리 있는 노드와의 최단 거리
max_distance = 0
for d in distance:
	# 도달할 수 있는 노드인 경우
	if d != INF:
		count += 1
		max_distance = max(max_distance, d)

# 시작 노드는 제외해야 하므로 count - 1을 출력
print(count - 1, max_distance)
반응형
작성일
2024. 7. 11. 22:55
작성자
ssun_bear
반응형

최단 경로 문제

최단 경로 알고리즘은 가장 짧은 경로를 찾는 알고리즘을 의미한다.

 

cf. 다양한 문제 상황

  1. 한 지점에서 다른 한 지점까지의 최단 경로
  2. 한 지점에서 다른 모든 지점까지의 최단 경로
  3. 모든 지점에서 다른 모든 지점까지의 최단 경로

각 지점은 그래프에서 노드로 표현한다.

지점 간 연결된 도로는 그래프에서 간선으로 표현한다.

 

방향그래프 예시

 

1. 다익스트라 최단 경로 알고리즘 개요

  • 특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산한다.
  • 다익스트라 최단 경로 알고리즘은 음의 간선이 없을 때 정상적으로 동작한다.
    • 현실 세계의 도로(간선)은 음의 간선으로 표현되지 않는다.
  • 다익스트라 최단 경로 알고리즘은 그리디 알고리즘으로 분류된다.
    • 매 상황에서 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다.

 

2. 다익스트라 최단 경로 알고리즘

알고리즘의 동작 과정은 다음과 같다.

  1. 출발 노드를 설정한다.
  2. 최단 거리 테이블을 초기화한다. (cf. 모든 노드까지 가기 위한 비용을 무한으로 설정하고 자기 자신에 대한 노드는 0으로 설정한다.)
  3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
  4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
  5. 위 과정에서 3번과 4번을 반복한다.

 

알고리즘 동작 과정에서 최단 거리 테이블은 각 노드에 대한 현재까지의 최단 거리 정보를 가지고 있다.

처리 과정에서 더 짧은 경로를 찾으면 '이제부터는 이 경로가 제일 짧은 경로야'라고 갱신한다.

 

 

3. 다익스트라 알고리즘: 동작 과정 살펴보기

 

cf) 이미 방문처리된 노드라면, 그 노드까지 최단거리값이 결정되어 바뀌지 않기 때문에 무시하는 방법을 사용할 수도 있다.
여기에서 4번 노드는 이미 방문했기 때문에 무시할 수도 있다.

 

 

앞서 확인했던 다른 노드까지의 최단 경로는 바뀌지 않기때문에 마지막 노드에 대해선 처리하지 않아도 된다.

 

4. 다익스트라 알고리즘의 특징

  • 그리디 알고리즘: 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다.
  • 단계를 거치며 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않는다.
    • 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있다.
  • 다익스트라 알고리즘을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장된다.
    • 완벽한 형태의 최단 경로를 구하려면 소스코드에 추가적인 기능을 더 넣어야 한다.

 

다익스트라 알고리즘 구현(Python) - 개선 전

1. 다익스트라 알고리즘: 간단한 구현 방법(Python)

  • 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 테이블의 모든 원소를 확인(순차 탐색)한다.
import sys
input = sys.stdin.readline
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수를 입력받기
n , m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
# 방문한 적이 있는지 체크하는 목적의 리스트를 만들기
visited = [False] * (n + 1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보를 입력받기
for _ in range(m):
	a, b, c = map(int, input().split())
	# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
	graph[a].append((b, c))

# 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
	min_value = INF
	index = 0  # 가장 최단 거리가 짧은 노드(인덱스)
	for i in range(1, n + 1):
		if distance[i] < min_value and not visited[i]:
			min_value = distance[i]
			index = i
	return index

def dijkstra(start):
	# 시작 노드에 대해서 초기화
	distance[start] = 0
	visited[start] = True
	for j in graph[start]:
		distance[j[0]] = j[1]
	# 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
	for i in range(n - 1):
		# 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문처리
		now = get_smallest_node()
		visited[now] = True
		# 현재 노드와 연결된 다른 노드를 확인
		for j in graph[now]:
			cost = distance[now] + j[1]
			# 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
			if cost < distance[j[0]]:
				distance[j[0]] = cost

# 다익스트라 알고리즘을 수행
dijkstra(start)

# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n + 1):
	# 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
	if distance[i] == INF:
		print("INFINITY")
	# 도달할 수 있는 경우 거리를 출력
	else:
		print(distance[i])

 

2. 다익스트라 알고리즘: 간단한 구현 방법 성능 분석

  • 총 O(V)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 한다.
  • 따라서 전체 시간 복잡도는 O(V^2)이다.
  • 일반적으로 코딩 테스트의 최단 경로 문제에서 전체 노드의 개수가 5,000개 이하라면 이 코드로 문제를 해결할 수 있다.
    • 하지만 노드의 개수가 10,000개를 넘어가는 문제라면 어떻게 해야할까?
      • 따라서 우선순위 큐(Priority Queue) 자료구조를 알아야할 필요가 있다.

다익스트라 알고리즘 구현(Python) - 개선한 버전 (우선순위 큐)

1. 우선순위 큐(Priority Queue)

우선순위가 가장 높은 데이터를 가장 먼저 삭제하는 자료구조이다.

예를 들어 여러 개의 물건 데이터를 자료구조에 넣었다가 가치가 높은 물건 데이터부터 꺼내서 확인해야하는 경우 우선순위 큐를 이용할 수 있다.

Python, C++, Java를 포함한 대부분의 프로그래밍 언어에서 표준 라이브러리 형태로 지원한다.

 

 

1-1. 힙(Heap)

우선순위 큐(Priority Queue)를 구현하기 위해 사용하는 자료구조 중 하나이다.

최소 힙(Min Heap)과 최대 힙(Max Heap)이 있다.

(cf. 최소 힙은 값이 낮은 값부터 꺼내는 방식, 최대 힙은 높은 값부터 꺼내는 방식으로 동작)

다익스트라 최단 경로 알고리즘을 포함해 다향한 알고리즘에서 사용된다.

 

 

1-1-1. 힙 라이브러리 사용 예제: 최소 힙

heapq 라이브러리는 데이터를 꺼낼 때 우선순위가 높은 데이터부터 차례대로 나온다는 특징때문에, 이러한 heapq 자료구조의 특성을 이용해서 정렬을 수행할 수 있다.

기본적으로 파이썬은 heapq 라이브러리를 그대로 사용하게 되면 최소 힙(min heap)으로 구현되어있다.

즉, 우선순위가 낮은 데이터부터 차례대로 꺼내지게 된다(오름차순 정렬).

 

import heapq

# 오른차순 힙 정렬(Heap Sort)
def heapsort(iterable):
	h = []
	result = []
	# 모든 원소를 차례대로 힙에 삽입
	for value in iterable:
		heapq.heappush(h, value)
	# 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
	for i in range(len(h)):
		result.append(heapq.heappop(h))
	return result

result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])

 

 

1-1-2. 힙 라이브러리 사용 예제: 최대 힙

파이썬에서는 별도로 최대 힙을 지원해주지 않는다.

따라서 데이터를 힙에 넣을 때 마이너스(-)를 붙여서 넣고 데이터를 꺼낼 때 마이너스(-)를 붙여서 꺼내면 최대 힙과 같은 효과를 볼 수 있다(내림차순 정렬).

 

import heapq

# 내림차순 힙 정렬(Heap Sort)
def heapsort(iterable):
	h = []
	result = []
	# 모든 원소를 차례대로 힙에 삽입
	for value in iterable:
		heapq.heappush(h, -value)
	# 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
	for i in range(len(h)):
		result.append(-heapq.heappop(h))
	return result

result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(result)  # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

 

2. 다익스트라 알고리즘: 개선된 구현 방법

  • 단계마다 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 힙(Heap) 자료구조를 이용한다.
  • 다익스트라 알고리즘이 동작하는 기본 원리는 동일하다.
    • 현재 가장 가까운 노드를 저장해놓기 위해서 힙 자료구조를 추가적으로 이용한다는 점이 다른다.
    • 현재의 최단 거리가 가장 짧은 노드를 선택해야 하므로 최소 힙을 사용한다.

 

3. 다익스트라 알고리즘: 동작 과정 살펴보기 (우선순위 큐)

 

4. 다익스트라 알고리즘: 개선된 구현 방법(Python)

import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)  # 무한을 의미하는 값으로 10억을 설정

# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트 만들기
graph = [[] for i in range(n + 1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보를 입력받기
for _ in range(m):
	a, b, c = map(int, input().split())
	# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
	graph[a].append((b, c))

def dijkstra(start):
	q = []
	# 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
	heapq.heappush(q, (0, start))
	distance[start] = 0
	while q:  # 큐가 비어있지 않다면
		# 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
		dist, now = heapq.heappop(q)
		# 현재 노드가 이미 처리된 적이 있는 노드라면 무시
		if distance[now] < dist:
			continue
		# 현재 노드와 연결된 다른 인접한 노드들을 확인
		for i in graph[now]:
			cost = dist + i[1]
			# 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
			if cost < distance[i[0]]:
				distance[i[0]] = cost
				heapq.heappush(q, (cost, i[0]))

# 다익스트라 알고리즘을 수행
dijkstra(start)

# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n + 1):
	# 도달할 수 없는 경우, 무한(INFINITY)이라고 출력
	if distance[i] == INF:
		print("INFINITY")
	# 도달할 수 ㅇ있는 경우 거리를 출력
	else:
		print(distance[i])

5. 다익스트라 알고리즘: 개선된 구현 방법 성능 분석

  • 힙 자료구조를 이용하는 다익스트라 알고리즘의 시간 복잡도는 O(ElogV)이다.
  • 노드를 하나씩 꺼내 검사하는 반복문(while문)은 노드의 개수 V 이상의 횟수로는 처리되지 않는다.
    • 결과적으로 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총횟수는 최대 간선의 개수(E)만큼 연산이 수행될 수 있다.
  • 직관적으로 전체 과정은 E개의 원소를 우선순위 큐에 넣었다가 모두 빼내는 연산과 매우 유사하다.
    • 시간 복잡도를 O(ElogE)로 판단할 수 있다.
    • 중복 간선을 포함하지 않는 경우에 이를 O(ElogV)로 정리할 수 있다.
      • O(ElogE) → O(ElogV^2) → O(2ElogV) → O(ElogV)
반응형