세그먼트 트리 (Segment Tree)

Notice

Recent Posts

Recent Comments

Archives

Tags more

Today

Total

관리 메뉴

Byeo

세그먼트 트리 (Segment Tree) 본문

알고리즘 (Algorihtm)/공통

세그먼트 트리 (Segment Tree)

BKlee 2021. 7. 2. 01:23

위 예시처럼 12개의 원소가 있는 배열 예제에서는 상단에 최대 15개의 부분합 node가 필요합니다. 즉, $2^{\lceil{log_2(N)}\rceil}$만큼의 node가 먼저 필요합니다. 여기에 leaves가 추가되어야 하므로 최종적으로는 다음과 같은 길이의 배열이 필요합니다.

$2^{\lceil{log_2(N)}\rceil+1}$

이제 배열의 크기는 대강 정했으니, 생성해보죠! 이 과정을 그림으로 나타내면 다음과 같이 그려볼 수 있습니다.

먼저, 표기를 간단히 약속하고 갑시다! 원 위에 좌측 상단은 1차원 배열 내에서의 index, 그리고 left ~ right는 각각 함수 인자 left right를 의미합니다.

가장 먼저 처음으로 불렸을 때는 다음과 같겠죠.

이 상황에서 left와 right는 같지 않으므로 Init(cur*2, left, mid) 을 먼저 호출할 것입니다.

역시 left와 right가 같지 않으므로 계속 left child를 재귀호출하여 다음과 같은 상황까지 도달하게 되겠죠.

이제 index 16에 접근했을 때, left와 right는 모두 0으로 같아졌습니다! 이 때, node[16] = arr[0]으로 값을 넣어줍니다. (node[cur] = arr[left])

이제 다시 node 8으로 돌아와서 Init(cur_2, left, mid)의 함수가 종료되었으므로 Init(cur_2+1, mid+1, right)을 호출하게 될거에요.

여기서 left와 right가 같으므로 앞선 과정처럼 node[17] = arr[1] 을 넣어주게 됩니다.

이제 node[8]에서 left child에 대한 init, right child에 대한 init이 모두 끝났으므로 다음 식을 계산할 수 있습니다.

return node[cur] = Init(cur*2, left, mid) + Init(cur*2+1, mid+1, right);
//return node[cur] = 10 + 7

이 과정에서 depth가 다른 leaf node가 생길 수 있습니다. 위 예제를 반복하다 보면 아래 그림과 같이 홀수 개의 정보를 포함한 node가 생길 수 밖에 없습니다.

여기서 6~6은 left와 right가 동일하므로 child를 생성하지 않고 값을 저장합니다. (node[11] = arr[6])

이 재귀 과정을 반복하면 최종적으로 다음과 같이 완성할 수 있습니다!

이제 Segment tree의 준비는 끝났습니다.

이 과정은 tree의 node 수 만큼 순회를 요구하므로 $O(N)$ 의 시간복잡도를 갖습니다.

2) 검색하기 (Search)

검색은 필요한 부분만 재귀적으로 호출하면서 합을 구해나갈 수 있습니다. 첫 예제를 다시 살펴보죠.

직관적으로 우리가 구하고자 하는 1~8 구간의 부분합은 위에서 빨간색으로 색칠 된 숫자들의 합을 구하면 됩니다. 해당 부분들을 잘 살펴보면 우리의 목표 범위를 모두 커버하고 있다는 것을 알 수 있죠.

검색은 DFS처럼 재귀적으로 호출하되, 중간과정의 node가 계산에 필요한 node들의 합을 가지고 있다면 중단할 수 있습니다.

//cur : current node#
//left, right : 검색하고자 하는 구간
//start, end : node[cur]가 가지고 있는 정보의 구간
int Search(int cur, int left, int right, int start, int end){
    if(left<=start && right>=end) return node[cur];
    int mid = (start+end)/2;
    int sum = 0;
    if(left<=mid) sum += Search(cur*2, left, right, start, mid);
    if(right>mid) sum += Search(cur*2+1, left, right, mid+1, end);
    return sum;
}

left~right, start~end 의미를 잘 이해하면 쉽게 파악할 수 있습니다. 직관적이지 않을 수 있으니 다음 그림과 함께 살펴보죠.

1차원 좌표에서 빨간색 막대는 해당 node에서 제외 시켜야 할 정보를 의미합니다.
막대에서 빨간색이 있다면 mid를 기준으로 나눠서 더 잘게 조사해야 합니다.

1~8의 부분합을 검색하기 위해 가장 먼저, root node인 1번부터 살펴보도록 하죠.

1번 노드를 보면 해당 node가 가지고 있는 103이란 값은 0(start)~12(end) 의 부분합입니다. 우리가 검색하고자 하는 영역 1(left)~8(right)외에도 필요 없는 정보를 갖고 있으므로 자세히 쪼개서 더 살펴보아야 합니다.

특히, mid값 6을 기준으로 좌 우 모두 살펴봐야 하므로 left child, right child 모두 살펴보죠.

2번 node 부터 살펴볼까요? 이 node가 갖고 있는 정보는 0(Start) ~ 6(End) 의 부분합입니다. 그런데 우리가 필요한 정보는 1(Left)~8(Right)까지 이므로 0~1은 필요가 없습니다. 결국, 더 나눠야 합니다. 여기서 우리가 필요한 정보는 또 left child, right child 모두 갖고 있으므로 둘 다 살펴봐야 합니다.

이제 3번 node를 살펴보죠. 7~8의 부분합만 필요한데, 7~12의 정보를 갖고 있습니다. 따라서 더 쪼개야 하겠죠.

단, right child는 9~12라서 우리가 구하고자 하는 구간이 아닙니다. 그러므로 right child는 검사할 필요가 없게 됐어요!

나눠 보았습니다.

4번 노드는 여전히 mid를 기준으로 양쪽에 필요한 정보가 있으므로 쪼개야 합니다.

5번 노드는 불필요한 정보가 없습니다! 5번 노드의 정보는 4(start)~6(end)의 부분합인데, 우리가 찾고자 하는 1(left)~

8(right)에 속하므로 더 이상 child를 탐색할 필요가 없습니다.

6번 노드는 여전히 불필요한 정보가 존재하여 더 나눠야 합니다. 마찬가지로 right child는 살펴볼 필요가 없겠죠.

이제 그림은 아마 다음처럼 변하겠죠.

마지막으로 node 8번에서 right child만 선택하면 종료됩니다.

3) 수정하기 (Update)

수정하는 과정은 Init과 매우 유사합니다! 다만, update해야 하는 query는 구간이 아니고 1개일 경우만 해당합니다.

(구간을 동시에 업데이트 하는 알고리즘은 lazy propagation segment tree이 있다고 합니다.)

Init은 left child, right child 둘 다 호출했다면, 1개의 원소만 update해야 하는 상황에서는 둘 중 하나만 부르면 됩니다. 바꿀 index가 left child인지, right child인지만 파악한 뒤 호출하면 됩니다.

// cur : 현재 node
// index : 수정하고자 하는 위치
// val : 바꿀 값
// left, right : node[cur]가 담당하는 부분합 구간
void Update(int cur, int index, int val, int left, int right){
  if(left==right){
    node[cur] = val;
    return;
    }
    int mid = (left+right)/2;
    if(index <= mid) Update(cur*2, index, val, left, mid);
    if(index > mid) Update(cur*2+1, index, val, mid+1, right);
    node[cur] = node[cur*2] + node[cur*2+1];
}

만약 위 예제에서 4번 index의 값을 60으로 바꾸고 싶다고 하죠.

Root 노드부터 시작해서 바꾸고자 하는 index leaf node를 따라 들어가면 아래의 경로와 같을 겁니다. Index를 찾는 원리는 Search 할 때, 구간이 1개일 때와 같은 원리입니다.

이제 leaf node를 찾았다면 해당 값을 update 해줍니다.

이제 함수를 종료한 뒤 parent node에서 갱신 된 node와 기존의 node를 더해서 자신의 node를 갱신해주면 됩니다.

이러한 재귀함수를 끝까지 반복하면 결과는 다음과 같이 나올거에요.

완성!

예제) BOJ 2042

BOJ2042 : 구간 합 구하기

이 문제는 그 동안 분석했던 생성하기(Init), 검색하기(Search), 수정하기(Update)를 하나의 class에 묶어서 사용하면 됩니다!

문제에서는 1,000,000개의 원소들을 관리해야 하므로, $2^{\lceil{log_2(1,000,000)}\rceil+1} = 2^{21} = 2,097,152$ 만큼 필요합니다.

만약 이런 계산이 귀찮다면 원소 개수x4로 넓게 잡으시면 됩니다!

#include<stdio.h>
typedef long long int LLI;

class Tree{
        public:
        LLI node[2097152];

        LLI Init(int cur, LLI* arr, int left, int right){
                if(left==right){
                        node[cur] = arr[left];
                        return node[cur];
                }
                int mid = (left+right)/2;
                return node[cur] = Init(cur*2, arr, left, mid) + Init(cur*2+1,arr, mid+1, right);
        }
        LLI Search(int cur, int left, int right, int start, int end){
                if(left<=start && right>=end) return node[cur];
                int mid = (start+end)/2;
                LLI sum = 0;
                if(left<=mid) sum += Search(cur*2, left, right, start, mid);
                if(right>mid) sum += Search(cur*2+1, left, right, mid+1, end);
                return sum;
        }
        void Update(int cur, int index, LLI val, int left, int right){
                if(left==right){
                        node[cur] = val;
                        return;
                }
                int mid = (left+right)/2;
                if(index <= mid) Update(cur*2, index, val, left, mid);
                if(index > mid) Update(cur*2+1, index, val, mid+1, right);
                node[cur] = node[cur*2] + node[cur*2+1];
        }
};

int N,M,K;
LLI arr[1000000];
int main(){
        scanf("%d %d %d",&N,&M,&K);
        Tree* t = new Tree();
        for(int i=0 ; i<N ; i++){
                scanf("%lld",&arr[i]);
        }
        t->Init(1, arr, 0, N-1);

        int query;
        LLI a, b;
        for(int i=0 ; i<M+K ; i++){
                scanf("%d %lld %lld",&query, &a,&b);
                a--;
                if(query==1){
                        t->Update(1, a, b, 0, N-1);
                }else if(query==2){
                        b--;
                        printf("%lld\n",t->Search(1, a, b, 0, N-1));
                }
        }
        return 0;
}

※문제를 풀면서 주의할 점

수의 범위가 $-2^{63}$ ~ $2^{63}$이므로 integer로 해결할 수 없습니다.
문제에서는 index가 1번부터 시작하므로, 기존의 코드와 호환을 위해서는 1을 빼주어 0번부터 시작하도록 작성해야 합니다.

'알고리즘 (Algorihtm) > 공통' 카테고리의 다른 글

이분 매칭 (Bipartite Matching) 알고리즘 (0)	2024.01.14
최소신장트리 (Minimum Spanning Tree) - 크루스칼 알고리즘 (1)	2023.10.29
최소신장트리 (Minimum Spanning Tree) - 프림 알고리즘 (0)	2023.10.29
VScode 설치, 원격 서버 접속 (0)	2023.10.15
스위핑 (Sweeping) (0)	2021.07.20