メインコンテンツまでスキップ
waffle.svg
Domo Knowledge Base

ETL操作 - データの結合

Version 6

 

はじめに

このトピックでは、ETL変換フローでデータ結合を行う方法を2種類説明します。「行の追加」では、複数のDataSet行を1つのDataSetとして追加します。「データの結合」では、2つのDataSet列を結合することができます。

ETL DataFlowの作成については、「ETL DataFlowを作成する」をご覧ください。

Deta Cemterについては、「Data Centerのレイアウト」をご覧ください。

行の追加

行を追加する操作では、複数のDataSetから(同様な列とデータ構造を持つ)行を 1 つのDataSetに追加し、同時に重複する行を含むすべての一致データを表示させることができます。

注記:データ行の追加は、同じデータ構造とデータタイプになっている入力DataSetからのみ行うことができます。行の追加では、データ構造が一致しない場合、一致しないデータに対応する列を追加で作成します。例えば、整数の列にテキストを追加しようとすると、整数の列とテキストの列の2つの列が作成されます。  

ビデオ - ETLで行を追加する

 

例えば、この変更フローを使用し...

... 行を追加する操作を行うと、このデータと...

このデータを...

... このように変換可能です...

設定は以下を使用します。

注記:プレビュー時、変換されたデータでは行が必ずしも期待する順序の並びとならない場合があります。表カードでデータを表示する際に、行の順序を制御することができます。

行の追加設定は、

  1. キャンバスで、[行の追加] をクリックします。

  2. (オプション)操作名称を変更するには、をクリックして名称を入力します。

  3. 列を含めるオプションを選択します。

    オプション

    説明

    DataSetから列を含める

    選択したDataSetから列を含めます。

    すべての列を含める

    すべての入力DataSetから固有の列を含めます。

    シェアされた列のみ含める

    各入力DataSetで使用されている列のみを含めます。

  4. 各DataSetに実行される変更点を確認します。

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてから [プレビュー] タブをクリックします。

データの結合

データの結合では、特定の列(複数可)にある共通の値を使用し、2つのDataSetまたはデータ「ストリーム」の列を1つのDataSetに結合することができます。列は、両方の入力DataSetに必ず存在し、同じデータ構造である必要があります

注記:ルックアップ列に一致する列のETLの結合では、大文字と小文字を区別します。

ビデオ - ETLでの結合タイプ比較

 

ビデオは 3 パートあります - Magic ETLでの複数結合 

パート1(全3パート)

 パート2(全3パート)

パート3(全3パート)

 

 

例えば、この変換を用い...

... データの結合を行うと、このデータと...

このデータを...

... このように変換可能です...

設定は以下を使用します。

 注記:

  • 変換したデータでは、Domoは指定した一致する列の名前に「_1」を追加します。
  • プレビュー時、変換されたデータでは行が必ずしも期待する順序の並びとならない場合があります。表カードでデータを表示する際に、行の順番を制御することができます。 

データを結合のを設定は

  1. キャンバスで、[データを結合] をクリックします。

  2. (オプション)操作名称を変更するには、をクリックして名称を入力します。

  3. データの結合で使用する列を決定します。 

    注記:1) 行の結合に使用する特定の列が、両方のDataSetに存在し、同じデータ構造である必要があります。 2) Domoでは、最初の入力DataSet列を、識別列、2番目の入力DataSet列を一致列と呼びます。 3) 内部結合、左外側結合、および両外側結合の場合、最初の入力DataSet(左側)としてユニーク値を持つプライマリまたは「ルックアップテーブル」を指定します。(識別列内の値の重複は、10,000回を超えることはできません)。
  4. 最初の入力DataSet(左側)を選択し、識別列を選択します。
    識別列は、2 番目の入力DataSetの一致する列と対になっている必要があります。

  5. 2番目の入力DataSet(右側)を選択して、一致する列を選択します。
    一致列は、最初の入力DataSetの識別列と対になっている必要があります。

  6. 結合タイプのアイコンをクリックし、実行する結合のタイプを選択します。

    結合タイプ

    説明

     
    内部

    双方の入力DataSetの一致する行のみ含めます。


    左外側

    最初の入力DataSet(左側)のすべての行とそれに一致する2番目の入力DataSet(右側)の行を含めます。


    右外側

    2番目の入力DataSet(右側)のすべての行とそれに一致する最初の入力DataSet(左側)の行を含めます。


    両外側

    両方の入力DataSetのすべての行を含めます。

  7. (条件付き)別の列の対を指定する場合は、[別の列を一致] をクリックした後、列の対を設定します。

ヒント:操作による変換後のデータプレビューを行う場合は、プレビューを実行し、キャンバスで該当の操作をクリックした後、[プレビュー] タブをクリックします。