ETL操作 - データの結合
はじめに
このトピックでは、ETL変換フローでデータ結合を行う方法を2種類説明します。「行の追加」では、複数のDataSet行を1つのDataSetとして追加します。「データの結合」では、2つのDataSet列を結合することができます。
ETL DataFlowの作成については、「ETL DataFlowを作成する」をご覧ください。
Deta Cemterについては、「Data Centerのレイアウト」をご覧ください。
行の追加
行を追加する操作では、複数のDataSetから(同様な列とデータ構造を持つ)行を 1 つのDataSetに追加し、同時に重複する行を含むすべての一致データを表示させることができます。
ビデオ - ETLで行を追加する
例
例えば、この変更フローを使用し...
... 行を追加する操作を行うと、このデータと...
このデータを...
... このように変換可能です...
設定は以下を使用します。
行の追加設定は、
-
キャンバスで、[行の追加] をクリックします。
-
(オプション)操作名称を変更するには、
をクリックして名称を入力します。
-
列を含めるオプションを選択します。
オプション
説明
DataSetから列を含める
選択したDataSetから列を含めます。
すべての列を含める
すべての入力DataSetから固有の列を含めます。
シェアされた列のみ含める
各入力DataSetで使用されている列のみを含めます。
-
各DataSetに実行される変更点を確認します。
データの結合
データの結合では、特定の列(複数可)にある共通の値を使用し、2つのDataSetまたはデータ「ストリーム」の列を1つのDataSetに結合することができます。列は、両方の入力DataSetに必ず存在し、同じデータ構造である必要があります。
ビデオ - ETLでの結合タイプ比較
ビデオは 3 パートあります - Magic ETLでの複数結合
パート1(全3パート)
パート2(全3パート)
パート3(全3パート)
例
例えば、この変換を用い...
... データの結合を行うと、このデータと...
このデータを...
... このように変換可能です...
設定は以下を使用します。
注記:
- 変換したデータでは、Domoは指定した一致する列の名前に「_1」を追加します。
- プレビュー時、変換されたデータでは行が必ずしも期待する順序の並びとならない場合があります。表カードでデータを表示する際に、行の順番を制御することができます。
データを結合のを設定は
-
キャンバスで、[データを結合] をクリックします。
-
(オプション)操作名称を変更するには、
をクリックして名称を入力します。
-
データの結合で使用する列を決定します。
注記:1) 行の結合に使用する特定の列が、両方のDataSetに存在し、同じデータ構造である必要があります。 2) Domoでは、最初の入力DataSet列を、識別列、2番目の入力DataSet列を一致列と呼びます。 3) 内部結合、左外側結合、および両外側結合の場合、最初の入力DataSet(左側)としてユニーク値を持つプライマリまたは「ルックアップテーブル」を指定します。(識別列内の値の重複は、10,000回を超えることはできません)。 -
最初の入力DataSet(左側)を選択し、識別列を選択します。
識別列は、2 番目の入力DataSetの一致する列と対になっている必要があります。 -
2番目の入力DataSet(右側)を選択して、一致する列を選択します。
一致列は、最初の入力DataSetの識別列と対になっている必要があります。 -
結合タイプのアイコンをクリックし、実行する結合のタイプを選択します。
結合タイプ
説明
内部双方の入力DataSetの一致する行のみ含めます。
左外側最初の入力DataSet(左側)のすべての行とそれに一致する2番目の入力DataSet(右側)の行を含めます。
右外側2番目の入力DataSet(右側)のすべての行とそれに一致する最初の入力DataSet(左側)の行を含めます。
両外側両方の入力DataSetのすべての行を含めます。
-
(条件付き)別の列の対を指定する場合は、[別の列を一致] をクリックした後、列の対を設定します。