티스토리 뷰

728x90
반응형

목차

     

    문제

     

    소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 

    소설의 모든 장을 쓰고 나서는 각 장이 쓰인 파일을 합쳐서 최종적으로 소설의 완성본이 들어있는 한 개의 파일을 만든다. 

    이 과정에서 두 개의 파일을 합쳐서 하나의 임시파일을 만들고, 

    이 임시파일이나 원래의 파일을 계속 두 개씩 합쳐서 소설의 여러 장들이 연속이 되도록 파일을 합쳐나가고,

    최종적으로는 하나의 파일로 합친다.

    두 개의 파일을 합칠 때 필요한 비용(시간 등)이 두 파일 크기의 합이라고 가정할 때,

    최종적인 한 개의 파일을 완성하는데 필요한 비용의 총합을 계산하시오.

    예를 들어, C1, C2, C3, C4가 연속적인 네 개의 장을 수록하고 있는 파일이고, 파일 크기가 각각 40, 30, 30, 50이라고 하자. 

    이 파일들을 합치는 과정에서, 먼저 C2와 C3를 합쳐서 임시파일 X1을 만든다. 

    이때 비용 60이 필요하다. 

    그다음으로 C1과 X1을 합쳐 임시파일 X2를 만들면 비용 100이 필요하다. 

    최종적으로 X2와 C4를 합쳐 최종파일을 만들면 비용 150이 필요하다. 

    따라서, 최종의 한 파일을 만드는데 필요한 비용의 합은 60+100+150=310이다. 

    다른 방법으로 파일을 합치면 비용을 줄일 수 있다. 

    먼저 C1과 C2를 합쳐 임시파일 Y1을 만들고, C3와 C4를 합쳐 임시파일 Y2를 만들고, 

    최종적으로 Y1과 Y2를 합쳐 최종파일을 만들 수 있다. 이때 필요한 총비용은 70+80+150=300이다.

    소설의 각 장들이 수록되어 있는 파일의 크기가 주어졌을 때, 

    이 파일들을 하나의 파일로 합칠 때 필요한 최소비용을 계산하는 프로그램을 작성하시오.

     

    입력

     

    프로그램은 표준 입력에서 입력 데이터를 받는다. 

    프로그램의 입력은 T개의 테스트 데이터로 이루어져 있는데, T는 입력의 맨 첫 줄에 주어진다.

    각 테스트 데이터는 두 개의 행으로 주어지는데, 

    첫 행에는 소설을 구성하는 장의 수를 나타내는 양의 정수 K (3 ≤ K ≤ 500)가 주어진다. 

    두 번째 행에는 1장부터 K장까지 수록한 파일의 크기를 나타내는 양의 정수 K개가 주어진다. 

    파일의 크기는 10,000을 초과하지 않는다.

     

    출력

     

    프로그램은 표준 출력에 출력한다. 

    각 테스트 데이터마다 정확히 한 행에 출력하는데, 모든 장을 합치는데 필요한 최소비용을 출력한다.

     

    풀이

     

    이 문제는 파일의 순서를 유지하면서 두 개씩 합치는 과정을 반복할 때, 최소 비용이 얼마인지 구하는 문제이다.

     

    동적계획법을 오랜만에 풀려니 일단 전략을 세우는 것 자체가 쉽지 않았다.

     

    연산의 순서에 따라 비용이 달라지고, 무작정 작은 것부터 더해서는 답이 나오지 않기 때문에 그리디 알고리즘은 사용할 수 없다.

     

    따라서 가능한 모든 조합을 계산한 뒤 그중 최솟값을 출력해야 하는데,

     

    여기가 바로 DP가 등장하는 시점이다.

     

    또한 처음에는 합치는 과정을 함수로 독립시켜서 풀었었는데, 다른 풀이를 보다 보니 누적합을 사용하는 게 더 좋아 보여서

     

    누적합도 끼워 넣었다.

     

    문제 풀이 과정은 아래와 같다.

     

    1. 입력으로 t, 그리고 k와 k개의 문자가 t번 반복되며 주어진다. 이를 정수와 배열에 저장한다.
    2. 배열 s를 만들어 주어진 파일의 누적합을 채워 넣는다. 파일의 순서가 바뀌지 않으므로 쉽게 채워 넣을 수 있다.
    3. 메모이제이션을 위한 2차원 테이블 DP를 초기화한다.
    4. 여기서 dp[j][m]은 j번째부터 m번째까지 파일을 합칠 때의 최소 비용이다. 같은 파일을 합치는 경우는 당연히 0이다.
    5. DP 테이블을 채워나간다. 이때 나는 어쩔 수 없이 삼중 for문을 사용했다.

      1. 이때 i는 합칠 파일의 개수를
      2. j는 파일의 시작 인덱스를
      3. m은 파일의 끝 인덱스를 각각 나타낸다.
      4. 이어서 x를 이용해 j부터 m까지 모든 분할에 대해 최소비용을 계산한 뒤, dp[j][m]에 저장한다.
    6.  배열을 모두 채웠다면 dp[1][k]에 모든 파일을 합칠 때의 최소 비용이 되며, 이를 출력한다.

     

    Java

     

    import java.io.BufferedReader;
    import java.io.IOException;
    import java.io.InputStreamReader;
    import java.util.StringTokenizer;
    
    public class Main {
    
    	public static void main(String[] args) throws IOException {
    
    		BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
    
    		int t = Integer.parseInt(br.readLine());
    
    		while (t > 0) {
    
    			int k = Integer.parseInt(br.readLine());
    			int[] files = new int[k + 1];
    			int[][] dp = new int[k + 1][k + 1];
    			int[] s = new int[k + 1];
    
    			StringTokenizer st = new StringTokenizer(br.readLine());
    			for (int i = 1; i <= k; i++) {
    				files[i] = Integer.parseInt(st.nextToken());
    			}
    
    			for (int i = 1; i <= k; i++) {
    				s[i] = s[i - 1] + files[i];
    			}
    
    			for (int i = 2; i <= k; i++) {
    				for (int j = 1; j <= k - i + 1; j++) {
    
    					int m = i + j - 1;
    					dp[j][m] = Integer.MAX_VALUE;
    
    					for (int x = j; x < m; x++) {
    						int cost = dp[j][x] + dp[x + 1][m] + s[m] - s[j - 1];
    						dp[j][m] = Math.min(dp[j][m], cost);
    					}
    				}
    			}
    
    			System.out.println(dp[1][k]);
    
    			t--;
    		}
    	}
    }

     

    Python

     

    import sys
    
    t = int(sys.stdin.readline().rstrip())
    
    while t > 0:
        k = int(sys.stdin.readline().rstrip())
        files = [0] + list(map(int, sys.stdin.readline().rstrip().split()))
        dp = [[0 for _ in range(k + 1)] for _ in range(k + 1)]
        s = [0 for _ in range(k + 1)]
    
        for i in range(1, k + 1):
            s[i] = s[i - 1] + files[i]
    
        for i in range(2, k + 1):
            for j in range(1, k - i + 2):
                m = i + j - 1
    
                dp[j][m] = float("inf")
    
                for x in range(j, m):
                    cost = dp[j][x] + dp[x + 1][m] + s[m] - s[j - 1]
                    dp[j][m] = min(dp[j][m], cost)
    
        print(dp[1][k])
    
        t -= 1

     

    Performance

     

    삼중 for문이 등장한 시점에서 파이썬으로 풀릴 거라고는 기대조차 하지 않았다.

     

    어떻게는 시간복잡도를 줄여보려고 했지만 그러려면 또 아예 다른 알고리즘을 적용해야 한다고 해서,

     

    일단은 PyPy3으로 만족하기로 했다.

    반응형
    댓글
    공지사항
    최근에 올라온 글
    최근에 달린 댓글
    Total
    Today
    Yesterday
    링크
    «   2024/05   »
    1 2 3 4
    5 6 7 8 9 10 11
    12 13 14 15 16 17 18
    19 20 21 22 23 24 25
    26 27 28 29 30 31
    글 보관함