데이터에 연결

Tableau Prep Builder를 사용하여 데이터를 정리하고 준비하려면 Tableau Desktop에서와 마찬가지로 데이터에 연결하여 새 흐름을 시작하십시오. 기존 흐름을 열고 중단한 부분을 선택할 수도 있습니다.

시작 페이지에서 가장 최근의 흐름을 확인하고 액세스할 수 있으므로 진행 중인 작업을 쉽게 찾을 수 있습니다. 데이터에 연결한 후 입력 단계의 다양한 옵션을 사용하여 흐름에서 사용할 데이터를 식별하십시오.

흐름 시작 또는 열기

Tableau Prep Builder는 Tableau 데이터 추출(.tde 또는 .hyper)뿐만 아니라 자주 사용되는 데이터 유형에 대한 연결을 지원합니다. Tableau Desktop에서 지원되는 커넥터는 사용자의 Tableau Prep Builder 버전에서 아직 지원되지 않을 수 있습니다. 그러나 새 버전마다 새 커넥터가 추가되었으므로 연결 패널에서 어떤 커넥터를 사용할 수 있는지 확인하십시오.

참고: 커넥터가 지원되지 않는 버전에서 흐름을 열면 흐름이 열리지만 오류가 발생하거나 데이터 연결을 제거하기 전에는 실행할 수 없게 됩니다.

현재 Tableau Desktop에서 하는 것처럼, 사용자 지정 SQL 쿼리를 사용하여 데이터에 연결할 수도 있습니다. 자세한 내용은 Tableau Desktop 및 웹 작성 도움말에서 사용자 지정 SQL 쿼리에 연결을 참조하십시오.

데이터에 연결할 수 있는지 여부를 확인하려면 Tableau Prep Builder를 열고 연결 추가 단추를 클릭하여 데이터의 커넥터가 왼쪽 패널의 연결 아래에 나열되는지 확인하십시오.

참고: 일부 커넥터에서는 데이터에 연결하려면 먼저 드라이버를 다운로드하여 설치해야 합니다. 드라이버 다운로드 링크와 설치 지침에 대해서는 Tableau 웹 사이트의 드라이버 다운로드 페이지를 참조하십시오.

새 흐름 시작

  1. Tableau Prep Builder를 열고 연결 추가 단추를 클릭합니다.

  2. 커넥터 목록에서 파일 유형이나 데이터를 호스팅하는 서버를 선택합니다. 메시지가 표시되면 로그인하는 데 필요한 정보를 입력하고 데이터에 액세스합니다.

  3. 연결 패널에서 다음 작업 중 하나를 수행합니다.

    • 파일에 연결되었으면 테이블을 두 번 클릭하거나 흐름 패널에 끌어 놓아 흐름을 시작합니다.

      단일 테이블인 경우 Tableau Prep Builder는 흐름에 데이터가 추가될 때 흐름 패널에 자동으로 입력 단계를 만듭니다.

    • 데이터베이스에 연결되었으면 데이터베이스 또는 스키마를 선택한 다음 테이블을 두 번 클릭하거나 흐름 패널에 끌어 놓아 흐름을 시작합니다.

기존 흐름 열기

기존 흐름을 열려면 시작 페이지에서 다음 작업 중 하나를 수행합니다.

  • 최근 흐름에서 흐름을 선택합니다.

  • 흐름 열기를 클릭하여 흐름 파일을 찾아 엽니다.

파일 > 새로 만들기를 클릭하여 새 작업 영역을 엽니다.

SAP HANA에 연결(버전 2019.2.1 이상)

Tableau Prep Builder에서는 Tableau Desktop과 마찬가지로 SAP HANA를 사용하여 데이터에 연결할 수 있지만 몇 가지 차이점이 있습니다. Tableau Desktop에서 사용하는 동일한 절차를 사용하여 데이터베이스에 연결합니다. 자세한 내용은 SAP HANA를 참조하십시오. 테이블을 연결하고 검색한 후에는 테이블을 캔버스로 끌어와 흐름을 구축하기 시작합니다.

흐름을 열 때 변수 및 매개 변수를 묻는 기능은 Tableau Prep Builder에서 지원되지 않습니다. 대신 입력 패널에서 변수 및 매개 변수 탭을 클릭하고 사용할 변수 및 피연산자를 선택한 다음 미리 설정된 값 목록에서 선택하거나 사용자 지정 값을 선택하여 데이터베이스를 쿼리하고 필요한 값을 반환합니다.

참고: Tableau Prep Builder 버전 2019.2.2부터 초기 SQL을 사용하여 연결을 쿼리할 수 있으며 한 변수에 여러 값이 있는 경우 드롭다운 목록에서 필요한 값을 선택할 수 있습니다.

변수를 더 추가할 수도 있습니다. 변수 섹션에서 더하기 단추 를 클릭하고 변수 및 피연산자를 선택한 다음 사용자 지정 값을 입력합니다.

참고: 이 커넥터는 Tableau Prep Conductor 버전 2019.1에서 지원되지 않습니다. 이 커넥터를 사용하는 흐름을 만드는 경우 흐름을 게시할 수 있지만 Tableau Server의 일정 기능을 사용하여 흐름을 실행할 수 없습니다. 대신 명령줄 인터페이스를 사용하여 흐름을 실행하고 데이터를 최신 상태로 유지할 수 있습니다. 명령줄에서 흐름 실행에 대한 자세한 내용은 명령줄에서 출력 파일 새로 고침을 참조하십시오. 버전 호환성에 대한 자세한 내용은 Tableau Prep 버전 호환성을 참조하십시오.

ODBC를 사용하여 연결(버전 2019.2.2 이상)

연결 패널에 나열되지 않는 데이터 원본에 연결해야 하는 경우 SQL 표준을 지원하고 ODBC API를 구현하는 기타 데이터베이스(ODBC) 커넥터를 사용하여 원하는 데이터 원본에 연결할 수 있습니다. 기타 데이터베이스(ODBC) 커넥터를 사용하여 데이터에 연결하는 것은 Tableau Desktop에서 사용하는 방법과 비슷하지만 몇 가지 차이점이 있습니다.

  • 연결에 DSN(데이터 원본 이름) 옵션만 사용할 수 있습니다.

  • Tableau Server에서 흐름을 게시하고 실행하려면 일치하는 DSN을 사용하여 서버를 구성해야 합니다.

    참고: 명령줄(Tableau Prep Builder)에서 기타 데이터베이스(ODBC) 커넥터를 포함하는 흐름을 실행하는 것은 현재 지원되지 않습니다.

  • Windows와 MacOS 모두에서 단일 연결 환경을 사용합니다. ODBC 드라이버의 연결 특성을 묻는 기능(Windows)은 지원되지 않습니다.

  • Tableau Prep Builder는 64비트 드라이버만 지원합니다.

연결 전 확인 사항

기타 데이터베이스(ODBC) 커넥터를 사용하여 데이터에 연결하려면 데이터베이스 드라이버를 설치하고 데이터 원본 이름(DSN)을 설정 및 구성해야 합니다. Tableau Server에 흐름을 게시하고 실행하려면 서버에도 일치하는 DSN을 구성해야 합니다.

중요: Tableau Prep Builder는 64비트 드라이버만 지원합니다. 드라이버가 두 버전을 동시에 설치하도록 허용하지 않는 경우 32비트 드라이버가 이미 설치되고 구성되어 있다면 먼저 32비트 드라이버를 제거한 다음 64비트 버전을 설치해야 할 수도 있습니다.

  1. ODBC 데이터 원본 관리자(64비트)(Windows)를 사용하거나 ODBC Manager 유틸리티(MacOS)를 사용하여 DSN을 만듭니다.

    Mac에 유틸리티가 설치되어 있지 않은 경우 www.odbcmanager.net 등에서 다운로드하여 사용하거나 odbc.ini 파일을 수동으로 편집할 수 있습니다.

  2. ODBC 데이터 원본 관리자(64비트)(Windows) 또는 ODBC Manager 유틸리티(MacOS)에서 새 데이터 원본을 추가하고 데이터 원본의 드라이버를 선택한 다음 마침을 클릭합니다.

  3. ODBC 드라이버 설치 대화 상자에서 서버 이름, 포트, 사용자 이름 및 암호와 같은 구성 정보를 입력합니다. 테스트(대화 상자에 옵션이 있는 경우)를 클릭하여 연결이 올바르게 설정되었는지 확인한 다음 구성을 저장합니다.

    참고: Tableau Prep Builder는 연결 특성을 묻는 기능을 지원하지 않으므로 DNS를 구성할 때 이 정보를 설정해야 합니다.

    이 예제에서는 MySQL 커넥터의 구성 대화 상자를 보여 줍니다.

기타 데이터베이스(ODBC)를 사용하여 연결

  1. Tableau Prep Builder를 열고 연결 추가 단추를 클릭합니다.

  2. 커넥터 목록에서 기타 데이터베이스(ODBC)를 선택합니다.

  3. 기타 데이터베이스(ODBC) 대화 상자의 드롭다운 목록에서 DSN을 선택하고 사용자 이름 및 암호를 입력합니다. 그런 다음 로그인을 클릭합니다.

  4. 연결 패널의 드롭다운 목록에서 데이터베이스를 선택합니다.

초기 SQL을 사용하여 연결 쿼리(버전 2019.2.2 이상)

데이터베이스가 초기 SQL 명령을 지원하는 경우 데이터베이스에 연결되면 실행되는 초기 SQL 명령을 지정할 수 있습니다. 예를 들어 Amazon Redshift에 연결하는 경우 입력 단계에서 필터를 추가하는 것처럼 데이터베이스에 연결할 때 필터를 적용하는 SQL 문을 입력할 수 있습니다. SQL 명령은 데이터가 샘플링되어 Tableau Prep Builder에 로드되기 전에 적용됩니다.

데이터를 새로 고치고 초기 SQL 명령을 다시 실행하려면 다음 중 하나를 수행하십시오.

•초기 SQL 명령을 변경하고 연결을 다시 설정할 입력 단계를 새로 고칩니다.

• 흐름을 실행합니다. 초기 SQL 명령은 모든 데이터 처리보다 먼저에 실행됩니다.

• Tableau Server에서 실행되도록 흐름의 일정을 예약합니다. 초기 SQL은 데이터 로드 환경의 일부로 흐름이 실행될 때마다 실행됩니다.

  1. 연결 패널의 목록에서 초기 SQL을 지원하는 커넥터를 선택합니다.
  2. 초기 SQL 표시 링크를 클릭하여 대화 상자를 확장하고 SQL 문을 입력합니다.

중요: Tableau Prep Builder에서 초기 SQL에 대한 매개 변수가 아직 지원되지 않습니다. Tableau Desktop에서 하는 것처럼 매개 변수를 입력하려고 하면 오류가 발생합니다.

Tableau 데이터 추출 작업

Tableau 데이터 추출에 연결하면 Tableau Prep Builder는 추출 및 hyper 확장의 패키지를 해제하며, 결과 원시 데이터에 흐름 작업을 적용하면서 많은 임시 공간을 사용하게 됩니다.

즉, 더 많은 RAM과 상당히 큰 파일을 수용할 수 있는 디스크 공간이 필요할 수 있습니다. 예를 들어 18개 열과 120만 개 행이 있는 360MB 크기(압축 해제 시 8.5GB)의 추출 파일에는 최대 32GB RAM, 16개 코어 및 압축 해제 상태의 파일을 지원하는 데 사용할 수 있는 500GB 디스크 공간이 필요합니다.

입력 단계에서 데이터 새로 고침

흐름에서 작업을 시작한 후 입력 파일 또는 테이블에서 데이터가 변경되면 입력 단계를 새로 고쳐 새 데이터를 가져올 수 있습니다.

파일 입력 단계 유형

파일 입력 단계를 새로 고치려면 다음 중 하나를 수행합니다.

  • 흐름 패널의 상단 메뉴에서 새로 고침 단추를 클릭하여 모든 입력 단계를 새로 고칩니다. 단일 입력 단계를 새로 고치려면 새로 고침 단추 옆에 있는 드롭다운 화살표를 클릭하고 목록에서 입력 단계를 선택합니다.

  • 흐름 패널에서 새로 고치려는 입력 단계를 마우스 오른쪽 단추로 클릭하고 메뉴에서 새로 고침을 선택합니다.

파일, 데이터베이스 또는 Tableau 추출 입력 단계 유형

데이터베이스 또는 Tableau 추출 입력 단계를 새로 고치려면 다음 중 하나를 수행합니다.

  • 연결을 편집합니다.

    참고: 성능을 유지하기 위해 Tableau Prep Builder는 대규모 데이터 집합을 샘플링합니다. 데이터가 샘플링된 경우 프로필 패널에 새 데이터가 표시되거나 표시되지 않을 수 있습니다. 입력 단계의 데이터 샘플 탭에서 데이터가 샘플링되는 방식에 대한 설정을 변경할 수 있지만 이렇게 하면 성능이 영향을 받을 수 있습니다. 데이터 샘플 크기 설정에 대한 자세한 내용은 데이터 샘플 크기 설정을 참조하십시오.

    1. 연결 패널에서 데이터 원본을 마우스 오른쪽 단추로 클릭하거나 Ctrl-클릭(MacOS)한 다음 편집을 선택합니다.

    2. 데이터베이스에 로그인하거나 파일 또는 Tableau 추출을 다시 선택하여 연결을 다시 설정합니다.

  • 입력 단계를 제거했다가 흐름에 다시 추가합니다.

    1. 흐름 패널에서 새로 고치려는 입력 단계를 마우스 오른쪽 단추로 클릭하고 메뉴에서 제거를 선택합니다.

      이렇게 하면 흐름이 일시적으로 오류 상태가 됩니다.

    2. 업데이트된 파일에 다시 연결합니다.

    3. 흐름에서 입력 단계를 추가하려는 두 번째 단계 상단에 있는 흐름 패널로 테이블을 끕니다. 테이블을 추가 옵션에 끌어 놓아 흐름에 다시 연결합니다.

데이터 해석기를 사용하여 파일 정리

Microsoft Excel 파일로 작업할 경우 데이터 해석기를 사용하면 관련 없는 정보를 제거할 수 있을 뿐만 아니라 데이터의 하위 테이블을 감지할 수 있으므로 분석할 데이터를 쉽게 준비할 수 있습니다. 데이터 해석기를 설정하면 이러한 하위 테이블이 감지되어 연결 패널의 테이블 섹션에 새 테이블로 나열됩니다.

그러면 이 테이블을 흐름 패널에 끌어 놓을 수 있습니다. Tableau Prep Builder 버전 2018.1.2 이상을 사용하는 경우 여러 파일 탭에서 와일드카드 유니온 옵션을 선택하여 검색된 모든 하위 테이블을 흐름에 포함시킬 수 있습니다. 입력 단계에서 와일드카드 유니온을 사용하는 것에 대한 자세한 내용은 입력 단계에서 파일 및 데이터베이스 테이블 유니온을 참조하십시오.

데이터 해석기를 해제하면 이러한 테이블이 연결 패널에서 제거됩니다. 또한 테이블이 이미 흐름에 사용된 경우 누락된 데이터로 인해 흐름 오류가 발생하게 됩니다.

참고: 현재 데이터 해석기는 Excel 스프레드시트의 하위 테이블만 검색하며 텍스트 파일 및 스프레드시트의 시작 행 지정을 지원하지 않습니다.

아래 예제에서는 연결 패널의 Excel 스프레드시트에서 데이터 해석기를 사용한 결과를 보여 줍니다. 데이터 해석기가 추가로 두 개의 하위 테이블을 검색했습니다.

데이터 해석기 전 데이터 해석기 후

데이터 해석기를 사용하려면 다음 단계를 완료하십시오.

  1. 데이터에 연결을 선택한 다음 Microsoft Excel을 선택합니다.

  2. 파일을 선택하고 열기를 클릭합니다.

  3. 데이터 해석기 사용 확인란을 선택합니다.

  4. 새 테이블을 흐름 패널에 끌어 놓아 흐름에 테이블을 포함시킵니다. 이전 테이블을 제거하려면 이전 테이블의 입력 단계를 마우스 오른쪽 단추로 클릭하고 제거를 선택합니다.

입력 단계에서 파일 및 데이터베이스 테이블 유니온

단일 데이터 원본에서 여러 파일 또는 데이터베이스 테이블로 작업하는 경우 와일드카드 검색을 테이블 사용하여 파일 또는 테이블을 검색한 다음 입력 단계에 모든 파일 또는 테이블 데이터를 포함하도록 데이터를 유니온할 수 있습니다. 파일을 유니온하려면 파일이 동일한 상위 또는 하위 디렉터리에 있어야 합니다.

데이터 테이블을 유니온하려면 테이블이 동일한 데이터베이스에 있어야 하며 데이터베이스 연결이 와일드카드 검색을 사용하는 유니온을 지원해야 합니다. 다음 데이터베이스는 이 유형의 유니온을 지원합니다.

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

유니온을 만든 후 파일 또는 테이블을 추가하거나 제거한 경우 입력 단계를 새로 고쳐 흐름을 새 데이터나 변경된 데이터로 업데이트할 수 있습니다.

참고: 현재 이 기능은 Excel 및 .csv(텍스트) 파일과 위에 나와 있는 특정 데이터베이스에 저장된 데이터 테이블에만 적용됩니다. Tableau 데이터 추출에서는 이 옵션을 사용할 수 없습니다.

파일에 대한 와일드카드 유니온은 Tableau Prep Builder 버전 2018.1.2 이상에서 사용할 수 있습니다. 데이터베이스 테이블에 대한 와일드카드 유니온은 Tableau Prep Builder 버전 2018.3.1 이상에서 사용할 수 있습니다. 이전 버전에서 이 유형의 유니온을 사용하는 흐름 연결을 편집하면 오류가 발생할 수 있습니다.

서로 다른 데이터 원본에서 데이터를 Union으로 통합해야 하는 경우 Union 단계를 사용하여 작업을 수행할 수 있습니다. Union 단계 만들기에 대한 자세한 내용은 데이터 조인 또는 통합(Union)을 참조하십시오.

유니온 파일

기본적으로 Tableau Prep Builder는 연결한 .csv 파일과 동일한 디렉터리에 있는 모든 .csv 파일이나 연결한 Excel 파일의 모든 시트를 유니온합니다. 데이터 해석기를 사용하여 Excel 파일을 정리하고 Tableau Prep Builder 버전 2018.1.2 이상을 사용하는 경우 와일드카드 검색을 사용하여 데이터 해석기가 찾은 모든 하위 테이블을 유니온하고 추가할 수 있습니다.

기본 Union을 변경하려면 다음 조건을 사용하여 Union에 포함하려는 파일이나 시트를 찾습니다.

  • 검색 위치: 파일 검색에 사용할 디렉터리를 선택합니다. 상위 폴더의 하위 디렉터리에 있는 파일을 포함하려면 하위 폴더 포함 확인란을 선택합니다.

  • 파일: 와일드카드 검색 조건과 일치하는 파일을 포함할지, 아니면 제외할지 여부를 선택합니다.

  • 일치 패턴(xxx*): 와일드카드 검색 패턴을 입력하여 파일 이름에 해당하는 문자가 있는 파일을 찾습니다. 예를 들어 ord*을 입력하면 해당하는 파일 이름을 포함하는 모든 파일이 반환됩니다. 지정된 디렉터리의 모든 파일을 포함하려면 이 필드를 빈 상태로 두십시오.

와일드카드 검색을 사용하여 파일을 Union으로 통합하려면

  1. 연결 추가 단추를 클릭하고 연결에서 텍스트 파일(.csv 파일의 경우) 또는 Microsoft Excel(Excel 파일의 경우)을 클릭한 다음 파일을 선택하여 엽니다.

  2. 입력 패널에서 여러 파일 탭을 선택한 다음 와일드카드 Union을 선택합니다.

    아래 예제에서는 일치 패턴을 사용한 와일드카드 Union을 보여 줍니다. 흐름 패널의 Orders_Central 입력 단계에 있는 파일 아이콘의 더하기 기호는 해당 단계에 와일드카드 Union이 포함된다는 것을 나타냅니다. Union에 포함된 파일은 포함된 파일 아래에 나열됩니다.

  3. 검색, 파일 및 일치 패턴 옵션을 사용하여 Union으로 통합하려는 파일을 찾습니다.

  4. 적용을 클릭하여 파일을 Union으로 통합합니다.

흐름에 새 단계를 추가한 경우 데이터 집합에 추가된 모든 파일을 프로필 패널의 파일 경로 필드에서 확인할 수 있습니다. 이 필드는 자동으로 추가됩니다.

데이터베이스 테이블 유니온(버전 2018.3.1 이상)

  1. 연결 추가 단추를 클릭하고 연결 아래에서 와일드카드 유니온을 지원하는 데이터베이스에 연결합니다.

  2. 테이블을 흐름 패널로 끌어옵니다.

  3. 입력 패널에서 다중 테이블 탭을 선택한 다음 와일드카드 유니온을 선택합니다.

  4. 검색, 테이블일치 패턴 옵션을 사용하여 유니온하려는 테이블 찾습니다.

    연결 패널의 테이블 섹션에 표시되는 테이블만 유니온에 포함시킬 수 있습니다. 와일드카드 검색은 테이블을 찾기 위해 다른 스키마나 다른 데이터베이스 연결을 검색하지 않습니다.

  5. 적용을 클릭하여 테이블 데이터를 유니온합니다.

    흐름에 새 단계를 추가한 경우 데이터 집합에 추가된 모든 테이블을 프로필 패널의 테이블 이름 필드에서 확인할 수 있습니다. 이 필드는 자동으로 추가됩니다.

유니온 후 필드 병합

입력 단계에서 유니온을 만든 후 필드를 병합할 수도 있습니다. 입력 또는 출력 단계를 제외한 모든 후속 단계에서 이 작업을 수행할 수 있습니다. 자세한 내용은 추가 필드 병합 옵션을 참조하십시오.

입력 단계에서 데이터 조인

Tableau Prep Builder 버전 2019.1.3 이상에서는 관계 데이터가 있는 테이블을 포함하는 데이터베이스에 연결할 때 Tableau Prep Builder가 테이블의 고유 식별자로 식별되는 필드와 관련 필드로 식별되는 필드를 검색하고 표시할 수 있습니다. 그뿐만 아니라 이러한 필드의 관련 테이블 이름을 표시할 수 있습니다.

연결된 키라는 새 열이 입력 패널에 표시되고 다음과 같은 관계가 있는 경우 표시됩니다.

  • 고유 식별자. 이 필드는 테이블의 각 행을 고유하게 식별합니다. 테이블에는 여러 개의 고유 식별자가 있을 수 있습니다. 필드의 값은 고유해야 하며 비워 두거나 null일 수 없습니다.

  • 관련 필드. 이 필드는 테이블과 데이터베이스의 다른 테이블을 연결합니다. 테이블에는 여러 개의 관련 필드가 있을 수 있습니다.

  • 고유 식별자 및 관련 필드 둘 모두. 필드는 이 테이블의 고유 식별자이며 데이터베이스의 다른 테이블과도 관련됩니다.

이러한 관계를 활용하여 관련 테이블을 신속하게 찾아 흐름에 추가하거나 입력 단계에서 조인을 만들 수 있습니다. 이 기능은 테이블 관계가 정의된 지원되는 모든 데이터베이스 커넥터에서 사용할 수 있습니다.

  1. 고유 식별자 또는 관련 필드(외래 키)와 같은 필드에 대한 관계 데이터가 포함된 데이터베이스(예: Microsoft SQL Server)에 연결합니다.
  2. 입력 패널에서 관련 필드로 표시되거나 고유 식별자 및 관련 필드 둘 모두로 표시된 필드를 클릭합니다.

    관련 테이블 목록이 표시된 대화 상자가 열립니다.

  3. 추가 또는 조인하려는 테이블을 마우스오버하고 더하기 단추를 클릭하여 흐름에 테이블을 추가하거나 조인 단추를 클릭하여 선택한 테이블과의 조인을 만듭니다.

    조인을 만들면 Tableau Prep Builder는 정의된 필드 관계를 사용하여 테이블을 조인하고 조인을 만드는 데 사용할 조인 절의 미리 보기를 보여줍니다.

  4. 또는 흐름 패널의 메뉴에서 관련 테이블을 조인할 수 있습니다. 더하기 아이콘이 나타날 때까지 단계를 마우스오버한 다음 조인 추가를 선택하여 관련 테이블 목록을 표시합니다. Tableau Prep Builder에서는 두 테이블 간의 관계를 구성하는 필드를 기반으로 조인을 만듭니다.

    참고: 테이블에 정의된 테이블 관계가 없으면 이 옵션을 사용할 수 없습니다.

조인 작업에 대해 자세한 내용은 데이터 조인을 참조하십시오.

데이터 집합 구성

흐름에 포함할 데이터 집합의 양을 결정하려면 데이터 집합을 구성하면 됩니다. 데이터에 연결하거나 테이블을 흐름 패널에 끌어 놓으면 입력 단계가 자동으로 흐름에 추가됩니다. 입력 단계는 항상 흐름의 첫 번째 단계입니다. 입력 단계를 마우스 오른쪽 단추로 클릭하여 입력 단계의 이름을 바꾸거나 입력 단계를 제거할 수 있습니다. Excel 또는 텍스트 파일에 연결한 경우 입력 단계에서 데이터를 새로 고칠 수도 있습니다.

입력 단계에서 데이터 집합의 메타데이터 프로필을 확인할 수 있습니다. 여기에서 필드를 검색하고, 샘플 값을 확인하고, 데이터 집합의 크기를 줄이기 위해 포함할 필드를 선택하거나, 작업할 데이터 샘플을 선택하거나, 선택한 필드 또는 행에 필터를 적용하는 등 다양한 작업을 수행할 수 있습니다.

또한 필드의 데이터 유형 또는 필드명을 변경하여 필드 속성을 구성할 수도 있습니다. 텍스트 파일의 경우 텍스트 설정을 구성할 수도 있습니다.

참고: 대괄호를 포함하는 필드 값은 자동으로 중괄호로 변경됩니다.

사용자 지정 SQL 쿼리에 연결

데이터베이스가 사용자 지정 SQL 사용을 지원하는 경우 연결 패널의 하단에 사용자 지정 SQL이 표시됩니다. 사용자 지정 SQL을 두 번 클릭하여 사용자 지정 SQL 탭을 여십시오. 이 탭에서 데이터를 사전 선택하는 쿼리를 입력하고 원본별 작업을 사용할 수 있습니다. 쿼리에서 데이터 집합이 검색된 후 흐름에 데이터를 추가하기 전에 포함할 필드를 선택하거나, 필터를 적용하거나, 데이터 유형을 변경할 수 있습니다.

사용자 지정 SQL 사용에 대한 자세한 내용은 Tableau Desktop 및 웹 작성 도움말에서 사용자 지정 SQL 쿼리에 연결을 참조하십시오.

흐름에 포함할 필드 선택

입력 패널에 데이터 집합의 필드 목록이 표시됩니다. 검색 필드를 사용하여 목록에서 필드를 찾은 다음 확인란을 사용하여 포함하거나 제외할 필드를 선택합니다. 모든 필드를 흐름에 포함하거나 흐름에서 제외하려면 그리드 왼쪽 상단에 있는 확인란을 전환합니다.

필드 속성 구성

텍스트 파일로 작업하는 경우 연결을 편집하고 텍스트 파일의 필드 구분 기호와 같은 텍스트 속성을 구성할 수 있는 텍스트 설정 탭이 표시됩니다. 연결 패널에서 파일 연결을 편집할 수도 있습니다.

텍스트 또는 Excel 파일로 작업하는 경우 흐름을 시작하기 전이라도 잘못 유추된 데이터 유형을 수정할 수 있습니다. 흐름을 시작한 후에는 프로필 패널의 후속 단계에서 언제라도 데이터 유형을 변경할 수 있습니다.

텍스트 파일의 텍스트 설정 구성

텍스트 파일을 구문 분석하는 데 사용되는 설정을 변경하려면 다음 옵션 중에서 선택합니다.

  • 첫 번째 행이 머리글 포함(기본값): 첫 번째 행을 필드 레이블로 사용하려면 이 옵션을 선택합니다.

  • 필드명 자동 생성: Tableau Prep Builder가 필드 머리글을 자동으로 생성하게 하려면 이 옵션을 선택합니다. 필드 명명 규칙은 Tableau Desktop과 동일한 모델을 따릅니다. 예를 들어 F1, F2 등이 사용됩니다.

  • 필드 구분 기호: 열을 구분하는 데 사용할 문자를 목록에서 선택합니다. 사용자 지정 문자를 입력하려면 기타를 선택합니다.

  • 텍스트 한정자: 파일에서 값을 둘러싸는 문자를 선택합니다.

  • 문자 집합: 텍스트 파일 인코딩을 설명하는 문자 집합을 선택합니다.

  • 로캘: 파일 구문 분석에 사용할 로캘을 선택합니다. 이 설정은 사용할 소수 자릿수 및 1000단위 구분 기호를 나타냅니다.

데이터 유형 변경

필드의 데이터 유형을 변경하려면 다음 작업을 수행합니다.

  1. 필드의 데이터 유형을 클릭합니다.

  2. 메뉴에서 새 데이터 유형을 선택합니다.

필드명 변경

필드명을 변경하려면 필드명 열에서 이름을 선택한 다음 필드에 새 이름을 입력합니다. 주석은 필드 그리드와 입력 단계 왼쪽에 있는 흐름 패널에 추가됩니다. 변경 내용은 변경 패널에서도 추적됩니다.

데이터 샘플 크기 설정

기본적으로 Tableau Prep Builder는 흐름에 포함되는 데이터를 데이터 집합의 대표적인 샘플로 제한하여 최대 성능을 유지합니다. 데이터 샘플은 데이터 집합의 총 필드 수와 해당 필드의 데이터 유형을 기반으로 최적의 행 수를 계산하여 결정합니다. 그런 다음 Tableau Prep Builder는 가능한 한 빨리 계산된 양에 해당하는 행 수를 위부터 읽어들입니다.

샘플이 계산되고 반환되는 방식에 따라 결과 데이터 샘플에 필요한 모든 행이 포함되거나 포함되지 않을 수 있습니다. 필요한 데이터가 보이지 않는 경우 데이터 샘플 설정을 변경하여 쿼리를 다시 실행할 수 있습니다.

참고: 데이터가 샘플링된 경우 프로필 패널에 샘플링됨 표시기가 표시되고 추가하는 모든 단계에서 유지됩니다. 수행한 모든 변경 사항은 흐름에서 작업하는 샘플에 적용됩니다. 흐름을 실행하면 전체 데이터 집합에 모든 변경 사항이 적용됩니다.

데이터 샘플 설정을 변경하려면 입력 단계를 선택한 다음 데이터 샘플 탭의 다음 옵션 중에서 선택합니다.

  • 기본 샘플 양(기본값): Tableau Prep Builder가 반환할 총 행 수를 계산합니다.

  • 모든 데이터 사용: 크기에 관계없이 데이터 집합의 모든 행을 검색합니다. 이 설정을 사용하면 성능이 저하되거나 Tableau Prep Builder가 시간 초과될 수 있습니다.

    참고: 성능을 유지하기 위해 이 설정과 관계없이 집계, 조인, 유니온 및 피벗 단계 유형에는 1백만 개 행의 데이터 샘플 제한이 항상 적용됩니다.

  • 고정된 행 수: 데이터 집합에서 반환할 행 수를 선택합니다. 권장 행 수는 1백만 개 이하입니다. 1백만 개를 초과하는 행 수를 설정하면 성능이 저하될 수 있습니다.

  • 빠른 선택(기본값): 데이터베이스가 가능한 한 빨리 요청된 행 수를 반환합니다. 이는 처음 N개 행이거나 이전 쿼리에서 데이터베이스가 메모리에 캐시한 행일 수 있습니다.

  • 임의 샘플: 데이터베이스가 요청된 행 수를 반환하지만 데이터 집합의 모든 행을 조사하여 모든 행 중에서 대표적인 샘플을 반환합니다. 이 옵션을 사용하면 데이터를 처음 검색할 때 성능이 저하될 수 있습니다.

입력 단계의 필드에 필터 적용

필드를 필터링하려면 다음 작업을 수행합니다.

  1. 툴바에서 값 필터링을 클릭합니다.

  2. 계산 에디터에 필터 조건을 입력합니다.

흐름의 다른 단계에서 추가적인 필터링 기능을 사용할 수 있습니다. 자세한 내용은 값 필터링을 참조하십시오.

의견을 주셔서 감사합니다! 피드백을 제출하는 동안 오류가 발생했습니다. 다시 시도하거나 메시지를 보내주십시오.