メインコンテンツまでスキップ
waffle.svg
Domo Knowledge Base - 日本人

ETL 操作:データを編集

Version 11

この記事では、ETL の全ての データを編集 操作の詳細を説明します。これには、次が含まれます:

  • 行をフィルター

  • 重複を削除

  • テキストを置換

  • 列の値を選択

  • テキストフォーマット

  • 値マッパ

ETL DataFlow の作成については、ETL DataFlow を作成するを参照してください。

データセンターについては、データセンターのレイアウトを参照してください。

行をフィルター

行にフィルターをかける操作では、指定したルールに基づいて行を含めたり除外したりできます。

例えば、行にフィルターをかける操作により以下のデータを…

... 以下のように変換されます...

... その際に以下の設定を使用します:

行をフィルターをかける操作を設定するには、

  1. キャンバスで行をフィルター操作をクリックします。

  2. (オプション) 操作の名前を変更するには、をクリックして名前を入力します。

  3. 含める行は、定義したルールの全てに合う行か、またはどれかに合う行なのかを選択します。

  4. 各フィルタールールについて、以下を実行します。

    1. フィルター対象の列を選択します。

    2. 使用する演算を選択します。
       フィルターをかける列のデータのタイプに応じて演算アイテムがリストに表示されます。

    3. 指定した列の値か指定した値に比較するかを選択してから、以下のいずれかを実行します。

      • (条件付き)列に対して比較する場合、使用する列を選択します。

      • (条件付き)指定した値に対して比較する場合、使用する値を入力します。

    4. (条件付き)別のルールを追加するには、フィルタールールを追加をクリックします。

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてからプレビュータブをクリックします。

重複を削除

重複を削除する操作では、特定の列に基づき、重複している行を削除することができます。

トレーニングビデオ - 重複を削除の操作を使用する

重複を削除 の操作を使ってデータを変換する方法を学びましょう。 

 

注記:この製品トレーニングビデオは、Domo のお客様とクライアント様のみを対象としています。

 

例えば、重複を削除する操作により、以下のデータが...

... 以下のように変換されます...

... その際に以下の設定を使用します:

注記:同じ基本利益の値を持つ重複した行が削除されました。

重複を削除する操作を設定するには

  1. 操作を適用したい値を含む列がDataSetにあることを確認します。

  2. キャンバスで重複を削除操作をクリックします。

  3. (オプション) 操作の名前を変更するには、をクリックして名前を入力します。

  4. 重複した値があり削除したい列それぞれに対し、以下を行います。

    1. 列を選択します。
      例:「Product Base Margin (製品基本利益)」 

    2. 比較の際に、大文字と小文字の区別をするかを選択します。

    3. (条件付き)列を追加するには、列の比較を追加をクリックします。

注記:行を削除するには、全ての列は複製である必要があります

 

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてからプレビュータブをクリックします。

テキストを置換

テキストの置き換え操作により、テキスト値の全てのアイテムを他のテキスト値に置き換えることができます(いわゆる、検索・置き換え)。 これには、Java の正規表現を使用することができます。 Java の正規表現を作成する方法の詳細に関しては、https://docs.oracle.com/javase/tutorial/essential/regex/を参照してください。

ヒント:テキストを置換の操作を使って値を置き換える前(または後)に、列のタイプ設定の操作を使用して日付または数値列をテキストとして設定することができます。

その他の操作を使用してテキスト値を置き換える方法については、列値を設定値マッパーを参照してください。

例えば、テキストを置き換える操作で、「Product Container」列の「Jumbo Box」のテキスト値を…

... 「Ginormous」というテキスト値に

... その際に以下の設定を使用します:

テキストを置き換える操作を設定するには、

  1. キャンバスでテキストを置換操作をクリックします。

  2. (オプション) 操作の名前を変更するには、をクリックして名前を入力します。

  3. 検索する列を選択します。

  4. 検索したいテキスト値を入力します。
    例:「Jumbo Box」 

  5. (オプション)使用する検索設定を指定するには、フィールドでde_options.pngをクリックします。

    オプション

    説明

    完全一致

    完全に一致する単語だけを検索します。

    大文字と小文字を区別

    大文字と小文字を区別して値を検索します。

    RegExを使用する

    Java の正規表現を使用して検索、置き換えを実行します。

  6. 置き換えたいテキスト値を入力します。
    例:「Ginormous」 

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてからプレビュータブをクリックします。

列の値を選択

列の値を設定する操作では、列の値を、他の列の値と入れ替えることができます。

注記: 

  • 入れ替えることができるのは、同じデータタイプの列の値のみです。 例えば、文字列の値を持つ列から、別の文字列の値を持つ列にコピーすることができます。
  • 列は、両方とも既にDataSetに存在している必要があります

その他の操作を使用してテキスト値を置き換える方法については、テキストの置換値マッパーを参照してください。

例えば、列の値を設定する操作は、このデータを…

... 以下のように変換されます...

... その際に以下の設定を使用します:

列の値を設定する操作を設定するには

  1. 操作を適用したい値を含む列がDataSetにあることを確認します。

  2. キャンバスで、列の値を設定操作をクリックします。

  3. (オプション) 操作の名前を変更するには、をクリックして名前を入力します。

  4. 入れ替えたい値がある各列で、以下を実行します。

    1. 入れ替えたい値がある列を選択します。
      例:「Product Base Margin (製品基本利益)」 

    2. 入れ替えたい値のある列を選択します。
      例:「Net Margin (純利益)」 

    3. (条件付き)列を追加するには、列を追加をクリックします。

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてからプレビュータブをクリックします。

テキストフォーマット

テキストフォーマット操作では、テキストの書式を設定したり(小文字のみにする、大文字のみにする、最初の文字のみ大文字にする)、数字を抜いた書式にしたり、数字以外を全て削除したりすることができます。

例えば、テキストフォーマット操作は、以下のデータを…

... 以下のように変換されます...

... その際に以下の設定を使用します:

テキストフォーマット操作を設定するには、

  1. キャンバスで、テキストフォーマット操作をクリックします。

  2. (オプション) 操作の名前を変更するには、をクリックして名前を入力します。

  3. フォーマットする列それぞれに対し、以下を行います:

    1. テキスト列を選択する。

    2. 小文字・大文字のタイプを選択する。

    3. 数字を削除するか、数字以外を全て削除するかを選択する。

  4. (条件付き)列を追加するには、列を追加をクリックします。

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてからプレビュータブをクリックします。

値マッパ

値マッパー操作では、入力した一組の文字列値に従って、指定した列の文字列値を検索して置き換えることができます。 (値マッパーは、略語を置き換えたり、言語コードを変換したりするなどに使用できます。)置き換える値は、既存の列を上書きするか、または新しい列に書き出すかを選ぶことができます。

その他の操作を使用してテキスト値を置き換える方法の詳細については、テキストの置換列値の設定を参照してください。

例えば、値マッパー操作は、以下のデータを…

... 以下のように変換されます...

... その際に以下の設定を使用します:

注記: この例では、値が新しい列に書き出されています。 設定された場合、元の列の値を上書きさせることもできます。

値マッパー操作を設定するには

  1. キャンバスで値マッパー操作をクリックします。

  2. (オプション) 操作の名前を変更するには、をクリックして名前を入力します。

  3. 検索対象の列を選択します。

  4. 指定した列の値を上書きするか、新しい列に値を書き出すかを選択します。

    1. (条件付き)新しい列に値を書き出す場合、その列の名前を入力します。

  5. 行に一致する値が見つからなかった場合に、元の値を書き込むかデフォルトの値を書き込むかを選択します。

    1. (条件付き)デフォルトの値を書き込む時は、その値を入力します。

  6. 値マッパーで検索するそれぞれの値について、検索する値と置き換える値を入力します。

  7. (条件付き)マッピングを追加したい場合は、マッピングを追加をクリックします。

ヒント:操作によって変換されたデータをプレビューするには、プレビューを実行し、キャンバス内の操作をクリックしてからプレビュータブをクリックします。