이 페이지가 도움이 되셨나요?
아니요

데이터 검사 및 필터링

수행해야 하는 변경 사항과 흐름에 포함하는 작업의 효과를 보다 잘 이해하려면 데이터의 구성을 정확하게 파악해야 합니다.

데이터에 대한 크기 세부 정보 보기

데이터에 연결한 후 흐름에 테이블을 추가하고 단계를 추가합니다. 프로필 패널을 사용하여 데이터의 현재 상태와 구조를 확인하고 null 및 이상값을 파악할 수 있습니다.

  • 필드 및 행 수: 프로필 패널 왼쪽 위에서 흐름의 특정 시점에 데이터의 필드 및 행 수를 요약하여 보여 주는 정보를 찾을 수 있습니다. 수는 가장 가까운 1000 단위 숫자로 반올림됩니다. 아래 예제에서 데이터 집합에는 21개 필드와 3,000개 행이 있습니다.

    필드 및 행 수를 마우스오버하면 정확한 행 수를 확인할 수 있습니다(이 예의 경우 2848).


  • 데이터 집합 크기: 입력 패널의 데이터 샘플 탭에서 포함할 행 수를 지정하여 데이터의 하위 집합으로 작업하십시오.

  • 샘플링됨: 데이터를 사용하여 직접 상호 작용할 수 있도록 Tableau Prep Builder는 원시 데이터의 하위 집합으로 작업합니다. 행 수는 데이터 유형과 렌더링되는 필드 수에 따라 결정됩니다. 문자열은 정수보다 많은 저장 공간을 차지하므로 데이터 집합에 문자열 필드 10개 있는 경우 정수 필드 10개가 있는 경우보다 더 적은 수의 행이 반환됩니다. 샘플링됨 표시기는 프로필 패널에서 크기 세부 정보 옆에 표시되어 데이터 집합의 하위 집합임을 나타냅니다. 데이터 샘플에 대한 자세한 내용은 데이터에 연결에서 "데이터 샘플 크기 설정"을 참조하십시오.

  • 고유 값 수: 각 필드 머리글 옆의 숫자는 해당 필드에 포함된 고유 값을 나타냅니다. 수는 가장 가까운 1000 단위 숫자로 반올림됩니다. 아래 예제에서 Description(설명) 필드에 3,000개 고유 값이 표시되지만 이 숫자를 마우스오버하면 정확한 고유 값 수를 확인할 수 있습니다.



데이터에 할당된 데이터 유형 검토

Tableau Desktop과 마찬가지로 흐름 패널에 연결을 끌어 놓으면 Tableau Prep Builder가 필드의 데이터를 해석하여 자동으로 데이터 유형을 할당합니다. 다양한 데이터베이스가 서로 다른 방식으로 데이터를 처리할 수 있기 때문에 Tableau Prep Builder의 해석이 항상 올바른 것은 아닙니다.

데이터 유형을 변경하려면 데이터 유형 아이콘을 클릭하고 상황에 맞는 메뉴에서 올바른 데이터 유형을 선택하십시오. 문자열 또는 정수 데이터 유형을 날짜 또는 날짜 및 시간으로 변경할 수 있으며 Tableau Prep Builder는 이러한 데이터 유형을 변경하기 위해 Auto DateParse를 트리거합니다. Tableau Desktop과 마찬가지로 변경이 성공적이지 않은 경우 필드에 Null 값이 대신 표시되며 변경을 위한 계산을 만들 수 있습니다.

DateParse에 대한 자세한 내용은 Tableau Desktop 및 웹 작성 도움말에서 필드를 날짜 필드로 변환을 참조하십시오.

데이터에 데이터 역할 할당

유효하지 않은 필드 값을 쉽게 식별할 수 있도록 필드에 데이터 유형을 할당하는 것과 같은 방식으로 데이터 역할을 할당할 수 있습니다. 이렇게 하면 데이터 값이 나타내는 대상을 Tableau Prep Builder가 알게 되므로 자동으로 값의 유효성을 확인하고 해당 역할에 유효하지 않은 값을 하이라이트할 수 있게 됩니다.

데이터 역할은 Tableau Prep Builder에 필드 값이 의미하거나 나타내는 대상을 알려 줍니다. 예를 들어 지리적 데이터에 대한 필드 값이 있는 경우 City(구/군/시) 데이터 역할을 할당할 수 있으며 Tableau Prep Builder는 필드의 값을 알려진 영역 값 또는 패턴의 집합과 비교하여 일치하지 않는 값을 식별할 수 있습니다.

참고: 각 필드는 독립적으로 분석되므로 Country(국가) "USA"의 State(시/도) "Washington"에서 City(구/군/시) 값 "Portland"는 유효한 구/군/시 및 시/도 조합이 아니지만 유효한 구/군/시 이름이기 때문에 이러한 방식으로 식별되지 않습니다.

Tableau Prep Builder는 다음과 같은 데이터 역할을 지원합니다.

  • 이메일

  • URL

  • 지리적 역할(최신 지리적 데이터에 기반하며 Tableau Desktop에서 사용되는 것과 동일한 데이터)

    • 공항
    • 지역 번호(미국)
    • CBSA/MSA
    • 구/군/시
    • 하원의원 선거구(미국)
    • 국가/지역
    • NUTS 유럽
    • 주/시/도
    • ZIP 코드/우편 번호

필드의 데이터 역할을 설정하려면 다음 작업을 수행합니다.

  1. 프로필 패널, 결과 패널 또는 데이터 그리드에서 필드의 데이터 유형을 클릭합니다.

  2. 필드의 데이터 역할을 선택합니다.

    Tableau Prep Builder는 필드의 데이터 값을 선택한 데이터 역할에 대한 알려진 영역 값이나 패턴(이메일 또는 URL)과 비교하여 일치하지 않는 모든 값에 빨간색 느낌표 마크를 표시합니다.

  3. 필드의 드롭다운 화살표를 클릭하고 값 표시 섹션에서 모든 값을 표시하거나 데이터 역할에 대해 유효하거나 유효하지 않은 값만 표시하는 옵션을 선택합니다.

  4. 필드의 기타 옵션 메뉴에 있는 정리 옵션을 사용하여 유효하지 않은 모든 값을 수정합니다. 필드 값을 정리하는 방법에 대한 자세한 내용은 정리 작업 적용을 참조하십시오.

값 분포 또는 고유 값 보기

기본적으로 Tableau Prep Builder는 필드의 숫자, 날짜 및 날짜/시간 값을 버킷으로 그룹화합니다. 버킷을 구간차원이라고도 합니다. 구간차원을 사용하면 값의 분포를 전체적으로 확인할 수 있고 이상값과 null 값을 빠르게 식별할 수 있습니다. 구간차원 크기는 필드의 최소값과 최대값을 기반으로 계산되며 null 값은 항상 분포의 상단에 표시됩니다.

예를 들어 주문 및 배송 날짜는 연도별로 요약되거나 "구간차원"으로 처리됩니다. 각 구간차원은 1년(시작 연도의 1월부터 다음 연도의 1월까지)을 나타내며 연도에 따라 레이블이 지정됩니다. 2018년과 2019년의 후반부에 해당하는 판매 날짜와 배송 날짜가 있기 때문에 해당 값의 다음 연도에 대한 구간차원이 만들어집니다.

불연속형(또는 범주형) 데이터 필드가 많은 행을 포함하거나 스크롤 기능 없이는 필드에 표시할 수 없을 정도로 큰 분포를 가진 경우 필드 오른쪽에 요약 분포를 표시할 수 있습니다. 분포를 클릭하고 특정 값을 목표로 스크롤할 수 있습니다.

데이터에 숫자 또는 날짜 필드가 포함된 경우 값의 상세(불연속형) 버전을 표시하거나 값의 요약(연속형) 버전을 표시하도록 전환할 수 있습니다. 요약 뷰에는 필드의 값 범위와 특정 값의 발생 빈도가 표시됩니다.

이 전환 기능을 사용하면 고유 값(예: 필드의 “3” 레코드 수) 또는 값 분포(예: 필드의 모든 “3” 레코드 합계)를 확인할 수 있습니다.

뷰를 전환하려면

  1. 프로필 패널, 결과 패널 또는 데이터 그리드에서 숫자 또는 날짜 필드의 기타 옵션 메뉴를 클릭합니다.

  2. 상황에 맞는 메뉴에서 세부 정보를 선택하여 값의 상세 버전을 표시하거나 요약을 선택하여 값의 분포 버전을 표시합니다.

값 및 필드 정렬

프로필 카드의 정렬 옵션을 사용하여 구간차원(값의 개수는 분포 막대로 표현됨)을 오름차순이나 내림차순으로 정렬하거나 개별 필드 값을 사전순으로 정렬할 수 있습니다.

프로필 패널, 결과 패널 또는 데이터 그리드에서 필드의 순서를 다시 정렬하려면 데이터 그리드에서 필드나 프로필 카드를 선택하여 끌고 검정색 대상 선이 나타나면 원하는 위치에 놓습니다. 프로필 패널과 데이터 그리드는 동기화되므로 필드가 두 위치에 동일한 순서로 나타납니다.

(맨 위로 이동)


흐름에서 필드 및 값 하이라이트

Tableau Prep Builder를 사용하면 흐름 데이터에서 필드와 값을 쉽게 찾을 수 있습니다. 흐름 패널의 흐름 전체에서 필드가 시작된 위치와 사용되는 위치를 추적하거나 프로필 카드 또는 데이터 그리드에서 개별 값을 클릭하여 관련 값이나 동일한 값을 하이라이트합니다.

흐름의 필드 추적

Tableau Prep Builder 버전 2018.3.3 이상에서는 누락된 값을 추적하거나 예상한 결과가 나타나지 않을 때 흐름 문제를 해결하는 데 도움이 되도록 흐름에서 필드가 시작된 위치를 비롯하여 필드가 사용되는 모든 위치를 하이라이트할 수 있습니다.

정리 단계의 프로필 패널이나 다른 단계 유형의 결과 패널에서 필드를 클릭하면 흐름 패널에서 해당 필드가 사용되는 경로가 하이라이트됩니다.

참고: 이 옵션은 입력 또는 출력 단계 유형에는 사용할 수 없습니다.

관련 값 보기

하이라이트 기능을 사용하면 전체 필드에서 관련 값을 찾을 수 있습니다. 프로필 패널 또는 결과 패널의 프로필 카드에서 값을 클릭하면 다른 필드의 모든 관련 값이 파란색으로 하이라이트됩니다. 파란색은 선택한 값과 다른 필드에 있는 값 간의 관계 분포를 보여 줍니다.

예를 들어 관련 값을 하이라이트하려면 프로필 패널에서 필드의 값을 클릭합니다. 다른 필드의 관련 값이 파란색으로 바뀌며 파란색으로 하이라이트된 막대의 비율은 연관성의 정도를 나타냅니다.

동일한 값 하이라이트

데이터 그리드에서 값을 선택하면 모든 동일한 값이 하이라이트됩니다. 이러한 하이라이트를 통해 데이터의 패턴이나 불규칙성을 식별할 수 있습니다.

(맨 위로 이동)


필드 및 값 검색

프로필 패널 또는 결과 패널에서 특별히 관심이 있는 필드나 값을 검색하고 데이터를 필터링하는 데 검색 결과를 사용할 수 있습니다.

필드를 검색하려면 툴바에 있는 검색 상자에 검색어 전체 또는 일부를 입력합니다.

필드의 값을 검색하려면

  1. 필드의 검색 아이콘 을 클릭하고 값을 입력합니다.

  2. 고급 검색 옵션을 사용하려면 검색 옵션... 단추를 클릭합니다.

  3. 검색 결과를 사용하여 데이터를 필터링하려면 이 항목만 유지 또는 제외를 선택합니다.

    흐름 패널에서 영향을 받는 단계 위에 필터 아이콘이 나타납니다.

(맨 위로 이동)


값 필터링

값을 필터링하는 쉬운 방법은 프로필 카드나 데이터 그리드에서 값을 선택하고 마우스 오른쪽 단추를 클릭한 다음 이 항목만 유지 또는 제외를 선택하는 것입니다. 값 편집을 선택하여 인라인으로 값을 편집할 수도 있습니다.

흐름의 모든 단계에서 데이터를 필터링할 수 있습니다. 필터를 추가하려면 프로필 카드나 데이터 그리드에서 기타 옵션메뉴를 클릭합니다.

참고: 필터를 적용하려면 데이터 그리드 기타 옵션 메뉴에서 프로필 패널 숨기기 단추를 클릭한 다음 필터링하려는 필드의 기타 옵션을 클릭합니다.

각 데이터 유형에 사용할 수 있는 필터

데이터 유형 사용할 수 있는 필터
문자열 계산, 와일드카드 일치, Null 값
숫자 계산, 값 범위, Null 값
날짜 및 시간 계산, 값 범위, 기준 날짜, Null 값

계산 필터 사용

계산을 선택하면 필터 추가 대화 상자가 열립니다. 계산을 입력하고 올바른지 확인한 다음 저장을 클릭합니다.

값 범위 필터 사용

값 범위를 선택하면 범위를 지정하거나 최소값 또는 최대값을 설정할 수 있습니다.

날짜 범위 필터 사용

날짜 범위를 선택하면 날짜 범위를 지정하거나 최소 또는 최대 날짜를 설정할 수 있습니다.

기준 날짜 필터 사용

기준 날짜를 선택하면 연도, 분기, 월, 주 또는 일을 기준으로 날짜 범위를 필터링할 수 있습니다. 또한 특정 날짜에 상대적인 고정 일을 구성할 수 있으며 null 값을 포함할 수 있습니다.

와일드카드 일치 필터 사용

와일드카드 일치를 선택하면 필드 값을 필터링하여 조건과 일치하는 값만 유지하거나 제외할 수 있습니다. 필터 편집기에서 이 항목만 유지 또는 제외 탭을 선택하고 일치시킬 값을 입력한 다음 찾으려는 값을 반환하는 조건을 설정합니다.

필터링된 결과는 필터 편집기의 왼쪽 패널에 표시되므로 결과를 검토하고 실험할 수 있습니다. 원하는 결과를 얻었으면 완료를 클릭하여 변경 내용을 적용합니다.

Null 값 필터 사용

Null 값을 선택하면 선택한 필드의 값을 필터링하여 Null 값만 표시하거나 모든 Null 값을 제외할 수 있습니다.