데이터 조인 또는 통합(Union)

Tableau Prep Builder에서 데이터를 결합하는 데 사용할 수 있는 방법은 조인 및 유니온의 두 가지입니다.

데이터 조인

분석하려는 데이터는 대체로 특정 필드로 관련된 테이블 모음으로 구성됩니다. 조인은 이러한 공통 필드에서 관련 데이터를 결합하는 방법입니다. 조인을 사용한 데이터 결합 결과는 대개 데이터의 필드를 추가하여 가로로 확장되는 테이블입니다.

조인은 흐름의 어디에서나 수행할 수 있는 작업입니다. 흐름의 초기에 조인을 수행하면 데이터 집합을 파악하기 쉽고 주의가 필요한 영역을 바로 노출시킬 수 있습니다.

조인을 만들려면 다음 작업을 수행합니다.

  1. 다음 방법 중 하나를 사용하여 두 테이블을 조인합니다.

    • 흐름 패널에 두 개 이상의 테이블을 추가한 다음 조인 옵션이 표시될 때까지 관련 테이블을 선택하여 다른 테이블로 끌어 놓거나 아이콘을 클릭하고 메뉴에서 조인 추가를 선택합니다.

    • 아이콘을 클릭하고 메뉴에서 조인 추가를 선택한 후 수동으로 다른 입력을 조인에 추가하고 조인 절을 추가합니다.
    • 참고: Tableau Prep Builder 버전 2019.1.3 이상에서 테이블 관계가 정의되고 관련 필드를 포함하는 테이블에 연결하는 경우 조인 추가를 선택하고 관련 테이블 목록에서 조인을 선택할 수 있습니다. Tableau Prep Builder에서는 두 테이블 간의 관계를 구성하는 필드를 기반으로 조인을 만듭니다.

      테이블 관계가 있는 커넥터에 대한 자세한 내용은 기존 테이블 관계를 사용하여 데이터 조인을 참조하십시오.

    흐름에 새 조인 단계가 추가되고 프로필 패널이 조인 프로필을 표시하도록 업데이트됩니다.

  2. 조인을 검토하고 구성하려면 다음을 수행합니다.

    1. 조인 결과 요약을 검토하여 조인 유형 및 조인 조건의 결과로 포함되거나 제외된 필드 수를 확인합니다.

    2. 조인 유형에서 벤 다이어그램을 클릭하여 원하는 조인 유형을 지정합니다.

    3. 적용된 조인 절에서 더하기 아이콘을 클릭하거나 기본 조인 조건으로 선택된 필드에서 조인 절을 지정하거나 편집합니다. 조인 조건에서 선택한 필드는 조인의 테이블 간에서 공통되는 필드입니다.

    4. 또는 조인 절 권장 사항에 표시된 권장 조인 절을 클릭하여 해당 절을 적용된 조인 절 목록에 추가할 수 있습니다.

조인 결과 검사

조인 프로필의 요약에는 조인에 필요한 데이터가 포함되었는지 여부를 확인할 수 있도록 도와 주는 조인 관련 메타데이터가 표시됩니다.

  • 적용된 조인 절: 기본적으로 Tableau Prep Builder는 조인되는 테이블의 공통 필드명을 기반으로 첫 번째 조인 절을 정의합니다. 필요에 따라 조인 절을 추가하거나 제거합니다.

  • 조인 유형: 기본적으로, 조인을 만드는 경우 Tableau Prep Builder는 테이블 간에 Inner 조인을 사용합니다. 연결하는 데이터에 따라 Left, Inner, Right 또는 Outer 조인을 사용할 수 있습니다.

  • 조인 결과 요약: 조인 결과 요약에는 조인의 테이블에서 포함되거나 제외된 값의 분포가 표시됩니다.

    • 포함됨 막대를 클릭하여 분리하고 조인에 포함된 조인 프로필의 데이터를 확인합니다.

    • 제외됨 막대를 클릭하여 분리하고 조인에서 제외된 조인 프로필의 데이터를 확인합니다.

    • 포함됨제외됨 막대의 임의 조합을 클릭하여 누적된 관점에서 데이터를 확인합니다.

  • 조인 절 권장 사항: 권장 조인 절 옆에 있는 더하기 아이콘을 클릭하여 해당 절을 적용된 조인 절 목록에 추가합니다.

  • 조인 절 패널: 조인 절 패널에서 조인 절의 각 필드에 있는 값을 확인할 수 있습니다. 조인 절의 조건을 충족하지 못하는 값은 빨간색 텍스트로 표시됩니다.

  • 조인 결과 패널: 조인 결과 패널에 변경하려는 값이 표시되는 경우 이 패널에서 값을 편집할 수 있습니다.

일반적인 조인 문제

데이터 조인 후 예상한 결과가 나오지 않는 경우 필드 값을 추가로 정리해야 할 수 있습니다. 다음 문제는 Tableau Prep Builder가 값을 일치하지 않는 항목으로 읽고 조인에서 제외하는 결과를 야기합니다.

  • 대/소문자 불일치: My Sales와 my sales

  • 맞춤법 불일치: Hawaii와 Hawai'i

  • 맞춤법 오류 또는 입력 오류: My Company Health와 My Company Heath

  • 이름 변경: Sam Smith와 Sam Smith Jr.

  • 약어: My Company Limited와 My Company Ltd

  • 추가 구분 기호: Honolulu와 Honolulu (Hawaii)

  • 추가 공백: 문자 사이의 추가 공백 탭 공백 또는 추가 선행 또는 후행 공백이 포함됩니다.

  • 마침표 사용 불일치: Returned, not needed와 Returned, not needed.

그러나 필드 값에 이러한 문제가 있더라도 조인 절에서 필드 값을 직접 인라인으로 수정하거나 조인 결과 요약에서 제외됨 막대를 클릭하여 제외된 값을 작업한 후 프로필 카드 메뉴에서 정리 작업을 사용할 수 있습니다.

조인 단계에서 사용할 수 있는 다양한 정리 옵션에 대한 자세한 내용은 정리 작업 적용을 참조하십시오.

불일치 필드 수정 및 기타

조인 절에서 불일치 필드를 바로 수정할 수 있습니다. 값을 두 번 클릭하거나 마우스 오른쪽 단추로 클릭한 다음 수정하여 새 값을 입력하려는 필드의 상황에 맞는 메뉴에서 값 편집을 선택합니다. 데이터 변경 내용은 추적되고 조인 단계 오른쪽에 있는 변경 패널에 추가됩니다.

여러 값을 선택하여 조인 절 패널에서 유지, 제외 또는 필터링하거나 조인 결과 패널에서 다른 정리 작업을 적용할 수 있습니다. 변경하는 필드 자체와 조인 프로세스에서 필드의 위치에 따라 변경은 조인 전이나 후에 적용되어 수정된 결과를 제공합니다.

정리 필드에 대한 자세한 내용은 정리 작업 적용을 참조하십시오.

데이터 통합(Union)

Union은 한 테이블의 행을 다른 테이블에 추가하여 데이터를 결합하는 방법입니다. 예를 들어 한 테이블의 새 거래를 다른 테이블의 이전 거래 목록에 추가할 수 있습니다. Union으로 통합할 테이블들이 필드 수와 필드명이 동일하고 필드의 데이터 유형이 동일한지 확인하십시오.

: 성능을 극대화하기 위해 단일 유니온에는 최대 10개의 입력을 사용할 수 있습니다. 10개를 초과하는 파일이나 테이블을 유니온해야 하는 경우 입력 단계에서 파일을 유니온하십시오. 이 유형의 유니온에 대한 자세한 내용은 파일 및 데이터베이스 테이블에 대해 와일드카드 유니온 사용을 참조하십시오.

조인과 유사하게 Union 작업은 흐름의 아무 위치에서나 사용할 수 있습니다.

Union을 만들려면 다음 작업을 수행합니다.

  1. 흐름 패널에 테이블을 두 개 이상 추가한 후 관련 테이블을 선택하고 다른 테이블로 끌어 유니온 옵션이 표시되게 합니다. 또는 아이콘을 클릭하고 메뉴에서 Union 추가를 선택할 수도 있습니다. 흐름 패널에 새 Union 단계가 추가되고 프로필 패널이 Union 프로필을 표시하도록 업데이트됩니다.

  2. 유니온에 다른 테이블을 추가하려면 테이블을 유니온된 테이블로 끌어와 추가 옵션이 표시되게 합니다.

  3. Union 프로필에서 Union 관련 메타데이터를 검토합니다. Union에서 테이블을 제거하고 일치하지 않는 필드의 세부 정보를 확인할 수 있습니다.

Union 결과 검사

Union을 만든 후 Union 결과를 검사하여 Union의 데이터가 예상한 데이터인지 확인합니다. Union 프로필에는 Union의 데이터를 확인하는 데 사용할 수 있는 많은 영역이 있습니다.

  • 유니온 메타데이터 검토: 유니온 프로필에는 몇 가지 유니온 관련 메타데이터가 표시됩니다. 여기에서 유니온을 구성하는 테이블, 결과 필드 수 및 일치하지 않은 필드를 확인할 수 있습니다.

  • 각 필드의 색상 검토: 유니온 요약에 나열된 각 필드의 옆과 유니온 프로필의 각 필드 위에 일련의 색상이 표시됩니다. 색상은 Union의 각 테이블에 해당합니다.

    필드에 대해 모든 테이블 색상이 표시되면 해당 필드에 유니온이 올바르게 수행된 것입니다. 테이블 색상이 누락되면 일치하지 않은 필드가 있다는 의미입니다.

    일치하지 않은 필드는 유사한 데이터가 있지만 어떤 면에서 다른 필드입니다. 일치하지 않는 필드의 목록은 유니온 요약과 해당 필드가 발생한 테이블에서 볼 수 있습니다. 필드의 데이터를 더 자세히 살펴보려면 일치하지 않은 필드만 표시 확인란을 선택하여 유니온 프로필에서 일치하지 않은 필드를 분리합니다.

    이러한 필드를 수정하려면 아래 “일치하지 않는 필드 수정” 섹션의 제안 사항 중 하나를 따릅니다.

일치하지 않는 필드 수정

Union의 테이블이 일치하지 않는 경우 Union에서 불필요한 필드가 생성됩니다. 불필요한 필드는 적절한 컨텍스트에서 제외되는 유효한 데이터입니다.

필드 불일치 문제를 해결하려면 일치하지 않는 필드를 함께 병합해야 합니다.

필드가 일치하지 않는 이유는 많습니다.

  • 대응하는 필드의 이름이 다른 경우: 테이블 간의 대응하는 필드가 서로 이름이 다른 경우 유니온 권장 사항을 사용하거나, 불일치 필드 목록에서 수동으로 필드를 병합하거나, 유니온 프로필에서 필드명을 바꿔 일치하지 않는 필드를 함께 병합할 수 있습니다.

    유니온 권장 사항을 사용하려면 다음을 수행합니다.

    1. 불일치 필드 목록에서 일치하지 않은 필드를 클릭합니다. 제안된 일치 항목이 있으면 일치하는 필드가 노란색으로 하이라이트됩니다.

      제안된 일치 항목은 데이터 유형 및 필드명이 유사한 필드를 기반으로 합니다.

    2. 하이라이트된 필드를 마우스오버하고 더하기 단추를 클릭하여 필드를 병합합니다.

    불일치 필드 목록에서 수동으로 필드를 병합하려면 다음을 수행합니다.

    1. 목록에서 하나 이상의 필드를 선택합니다.

    2. 선택한 필드를 마우스 오른쪽 단추로 클릭합니다. 병합이 유효한 경우 필드 병합 메뉴 옵션이 나타납니다.

      필드를 마우스 오른쪽 단추로 클릭할 때 사용 가능한 옵션이 없음이 나타나는 것은 병합할 수 있는 필드가 없기 때문입니다. 예를 들어 동일한 입력의 두 필드를 병합해 보십시오.

    3. 필드 병합을 클릭하여 선택한 필드를 병합합니다.

    유니온 프로필 패널에서 필드명을 바꾸려면 필드명을 마우스 오른쪽 단추로 클릭하고 필드명 바꾸기를 클릭합니다.


  • 대응하는 필드의 이름이 같지만 유형이 다른 경우: 기본적으로, 대응하는 필드의 이름은 일치하지만 필드의 데이터 유형이 일치하지 않는 경우 Tableau Prep Builder는 필드 중 하나의 데이터 유형을 변경하여 서로 호환되게 만듭니다. Tableau Prep Builder가 이 변경을 수행한 경우 병합된 필드의 상단에 데이터 유형 변경 아이콘이 표시됩니다.

    Change Data Type Icon

    하지만 Tableau Prep Builder가 올바른 데이터 유형을 선택하지 못하는 경우도 있습니다. 이런 일이 발생한 경우 병합을 실행 취소하려면 데이터 유형 변경 아이콘을 마우스 오른쪽 단추로 클릭하고 서로 다른 유형을 사용하여 입력 분리를 선택합니다.


    그런 다음 필드 중 하나의 데이터 유형을 변경한 후 추가 필드 병합 옵션의 제안 사항에 따라 필드를 다시 병합할 수 있습니다.

  • 대응하는 테이블의 필드 수가 서로 다른 경우: 테이블을 Union으로 통합하려면 Union의 각 테이블에 동일한 수의 필드가 있어야 합니다. Union에서 불필요한 필드가 발생하는 경우 필드를 기존 필드로 병합하십시오.

추가 필드 병합 옵션

필드 병합의 경우 위 섹션에서 설명한 방법뿐만 아니라 다음 방법 중 하나를 사용하여 필드를 병합할 수도 있습니다. 출력 단계를 제외한 모든 단계에서 필드를 병합할 수 있습니다.

같은 파일의 필드를 병합하는 방법에 대한 자세한 내용은 필드 병합을 참조하십시오.

필드를 병합하려면 다음 작업 중 하나를 수행합니다.

  • 한 필드를 다른 필드 위로 끌어 놓습니다. 병합할 필드 놓기 표시기가 나타납니다.

  • 여러 필드를 선택하고 선택된 항목 중 하나를 마우스 오른쪽 단추로 클릭하여 상황에 맞는 메뉴를 연 다음 필드 병합을 클릭합니다.

  • 여러 필드를 선택한 다음 상황을 인식하는 툴바에서 필드 병합을 클릭합니다.

의견을 주셔서 감사합니다! 피드백을 제출하는 동안 오류가 발생했습니다.