メインコンテンツまでスキップ
waffle.svg
Domo Knowledge Base - 日本人

ETL DataFlow を作成する

Version 3

はじめに

単に DataSet をキャンバスにドラッグし、DataSet をどのように結合そして変換するか、それを指定する操作を追加してゆくだけです。 膨大な数の操作が利用できます。 列の結合や行のフィルタリング、そしてテキストの置き換えなどを行うことができます。

重要:DataFlow の入力 DataSet は、PDP のポリシーで制限させることはできません。利用可能な全ての行は DataFlow を経由する必要があります。 このため、PDPポリシーは、DataFlow が生成する出力 DataSet に適用させる必要があります。
 

PDP ポリシーが有効になっている入力 DataSet を使って DataFlow を構築すると、以下の条件の最低ひとつを満たしていない限り、DataFlow には不具合が発生します:

  • あなたは「管理者」セキュリティプロフィールを保有している。

  • あなたは DataSet の所有者である。

  • あなたは、「全ての行」ポリシーの一部を構成している。 これは、DataSet の全ての行にアクセスできるものです。

DataFlow で PDP を使用する方法に関しては、 PDP と DataFusion / DataFlowを参照してください。 

 

ETL DataFlows の使用の基礎を学びます。

パート 1 (全 3 パート)

注記:

  • この製品トレーニングビデオは、Domo のお客様とクライアント様のみを対象としています。
  • トレーニングビデオにアクセスできない場合、または再生ができない場合は、Domo サポートにお問い合わせください。 

ETL DataFlows の作成

このセクションの手順を使用して、ETL DataFlows の作成を支援します。

  1. Domoで、 >データセンターをクリックします。

  2. ウインドウ上部の Magic 変換ツールバーの ETL をクリックします。

    ヒント: ETL エディタは、Domo のどこからでも App ツールバーのを選択し、データ > ETL を選択することでも開くことができます。
  3. 入力DataSetを追加・設定するには、以下を行います:

    1. 操作パネルでDataSetを展開し、キャンバスに入力DataSetをドラッグする。

    2. 入力DataSet操作をクリックし、変換するDataSetを選択する。

  4. 出力DataSetを追加します。次を行います:

    1. 操作パネルのDataSetで、キャンバスに出力DataSetをドラッグする。
      出力DataSet操作の設定は、操作を接続した後で行うことができます。

  5. 、入力DataSetを変換 (クリーン、集計、結合等)するには、その他の操作を操作パネルからキャンバスにドラッグします

  6. 変換の流れにおける処理の順番を決定するため、変換操作間のつながりを明確にします。

  7. それぞれの操作をクリックし、オプションを指定して設定します。 

    ヒント:操作に関するヘルプをキャンバス内で表示するには、操作をクリックしをクリックします。 また、複数のアクションを一度に選択するには、キャンバスをクリックし、マウスポインタをアクションの上にドラッグします。 複数の操作を選択したら、それをまとめて好きな場所へドラッグできます。 また、画面左側のパネルにある消去をクリックすることでも、選択したアクションを消去することができます。
  8. 以下を行って、出力DataSet操作を設定します:

    1. 出力DataSet操作に別の操作をつなげる。

    2. 出力DataSet操作をクリックし、出力する新しいDataSetの名前を指定する。

  9. (オプション)変換フロー実行時のための設定を行います。
    デフォルトでは、変換フローは手動で実行した時のみ実行されます。

  10. ETL DataFlow の名前と詳細を指定します。

  11. [保存]をクリックしてETL DataFlowを保存し、必要に応じてバージョンの説明を入力して[保存]をクリックして確認します。

DataFlow を保存する際、このバージョンのエントリーが DataFlow の詳細ビュー内のバージョンタブに追加されます。 保存する際に説明を入力した場合は、DataFlow のエントリーにその説明が表示されます。 バージョンについては、 DataFlow のバージョン履歴を閲覧するを参照してください。

これは一般的には、データが実際には変更されていないからです。つまり更新されていないのです。 そのため、DataSet は更新済みとは表示されません。

DataFlows を作成するためのベストプラクティス

それぞれのDataFlowは...

  • 変換の各ステップにわかりやすい名前を付けます。

  • マージまたは操作される入力DataSetsの説明と作成されるDataSetを含み、またデータの所有者を示す必要があります。

  • 出力DataFlowと同じ名前にすることができます。これにより、どのDataSetsがどのDataFlowによって作成されるのかを簡単に識別できます。