본문 바로가기

알고리즘 & 코딩 테스트

[프로그래머스] Lv.2 테이블 해시 함수 문제 해결 과정(Java)

문제 설명

완호가 관리하는 어떤 데이터베이스의 한 테이블은 모두 정수 타입인 컬럼들로 이루어져 있습니다. 테이블은 2차원 행렬로 표현할 수 있으며 열은 컬럼을 나타내고, 행은 튜플을 나타냅니다.
첫 번째 컬럼은 기본키로서 모든 튜플에 대해 그 값이 중복되지 않도록 보장됩니다. 완호는 이 테이블에 대한 해시 함수를 다음과 같이 정의하였습니다.

  1. 해시 함수는 col, row_begin, row_end을 입력으로 받습니다.
  2. 테이블의 튜플을 col번째 컬럼의 값을 기준으로 오름차순 정렬을 하되, 만약 그 값이 동일하면 기본키인 첫 번째 컬럼의 값을 기준으로 내림차순 정렬합니다.
  3. 정렬된 데이터에서 S_i를 i 번째 행의 튜플에 대해 각 컬럼의 값을 i로 나눈 나머지들의 합으로 정의합니다.
  4. row_begin ≤ i ≤ row_end 인 모든 S_i를 누적하여 bitwise XOR 한 값을 해시 값으로서 반환합니다.

테이블의 데이터 data와 해시 함수에 대한 입력 col, row_begin, row_end이 주어졌을 때 테이블의 해시 값을 return 하도록 solution 함수를 완성해 주세요.


제한 사항
  • 1 ≤ data의 길이 ≤ 2,500
  • 1 ≤ data의 원소의 길이 ≤ 500
  • 1 ≤ data[i][j] ≤ 1,000,000
    • data[i][j]는 i + 1 번째 튜플의 j + 1 번째 컬럼의 값을 의미합니다.
  • 1 ≤ col ≤ data의 원소의 길이
  • 1 ≤ row_begin  row_end  data의 길이

입출력 예
data  col row_begin row_end result
[[2,2,6],[1,5,10],[4,2,9],[3,8,3]] 2 2 3 4

 


입출력 예 설명
  • 정해진 방법에 따라 튜플을 정렬하면 {4, 2, 9}, {2, 2, 6}, {1, 5, 10}, {3, 8, 3} 이 됩니다.
  • S_2 = (2 mod 2) + (2 mod 2) + (6 mod 2) = 0 입니다.
  • S_3 = (1 mod 3) + (5 mod 3) + (10 mod 3) = 4 입니다.
  • 따라서 해시 값은 S_2 XOR S_ 3 = 4 입니다.

 이 문제를 다 읽어보고 나서 다른 부분은 수월하게 진행됐는데, xor연산을 어떻게 처리할 지에 대한 고민이 있었다. 그래서 처음에 생각한 방식은 이랬다.

  1. S_i까지 다 구한 값들을 Integer.toBinaryString()으로 변환
  2. xor 연산을 위해 변환된 이진수 문자열들 중 가장 길이가 긴 문자열 맞춤
  3. 각 자릿수에 맞게 xor연산을 수행

 이렇게 생각하고 나서 코드를 작성했다

//각 자릿수끼리 수행한 xor연산의 결과를 추가후 반환하는 메서드
private int findXorValue(int[] arr) {
    StringBuilder sb = new StringBuilder();
    //이진수 문자로 저장
    String[] binaryStrings = convertBinaryString(arr);

    //각 자릿수에 대해서 xor 연산의 결과를 StrinBuilder에 저장
    for(int i = 0; i < binaryStrings[0].length(); i++) {
        char c = binaryStrings[0].charAt(i);
        for(int j = 1; j < binaryStrings.length; j++) {
            c = c == binaryStrings[j].charAt(i) ? '0' : '1';
        }
        sb.append(c);
    }

    //이진수 문자열을 정수로 반환
    return Integer.parseInt(sb.toString(), 2);
}


//S_i의 값을 이진수로 바꾼 후, 문자열의 길이를 맞추는 메서드
private String[] convertBinaryString(int[] arr) {
    String[] binaryStrings = new String[arr.length];
    int max = 0; //변환한 이진수 문자열 중 가장 긴 길이

    for(int i = 0; i < arr.length; i++) {
        binaryStrings[i] = Integer.toBinaryString(arr[i]);
        max = Math.max(max, binaryStrings[i].length());
    }

    //이진수 문자열의 길이를 맞추기
    fitLength(binaryStrings, max);

    return binaryStrings;
}

//변환된 이진수 문자열 중 길이가 가장 긴 문자열로 다른 문자열들 맞추는 메서드
private void fitLength(String[] arr, int max) {
    StringBuilder sb = new StringBuilder();
    int index = 0;

    //가장 긴 문자열 길이에 맞춰서 앞자리에 0 추가하기
    for(String s : arr) {
        for(int i = 0; i < max - s.length(); i++) {
            sb.append("0");
        }
        sb.append(s);
        arr[index++] = sb.toString();
        sb.setLength(0);
    }
}

근데.. 이걸 하고 나서 다른 사람의 풀이를 확인해 보니 ^라는 연산자로 수행을 한 것이 보였다.(아 당했다)

 

^가 xor연산을 수행해 주는 비트 연산자였던 것이었다. 정처기 공부하면서 봤던 건데 이걸 까먹고 있었다니... 그래서 S_i의 값까지만 구해주고 ^연산을 통해서 answer 값을 반환해 주었다.

 

 아무튼 이번 문제를 통해서 확실하게 각인이 되었다. ^는 xor 연산자!


전체 코드

import java.util.Arrays;

class Solution {

    public int solution(int[][] data, int col, int row_begin, int row_end) {
        int answer = 0;
        
        //튜플 정렬
        Arrays.sort(data, (c1, c2) -> c1[col-1] == c2[col-1] ? c2[0] - c1[0] : c1[col-1] - c2[col-1]);
        
        //각 튜플의 S_i를 구하기
        int arr[] = getS_i(data, row_begin, row_end);
        
        //구한 S_i의 xor 연산 수행하기  
        for(int i : arr) {
            answer = answer^i;
        }
        
           
        return answer;
    }
    
    private int[] getS_i(int[][] data, int row_begin, int row_end) {
        int index = 0;
        int[] s_arr = new int[row_end - row_begin + 1];
        
        // 각 튜플에 대해서 S_i 값을 저장 후 반환하기
        for(int i = row_begin-1; i < row_end; i++) {
            for(int j = 0; j < data[i].length; j++) {
                data[i][j] %= (i+1);
                s_arr[index] += data[i][j];
            }
            index++;
        }
        return s_arr;
    }
}
300x250