Amazon Redshiftコネクター
はじめに
Amazon Redshiftは、ホスト型Data Warehouseプロジェクトで、大型クラウドコンピューティングプラットフォームであるAmazon Web Servicesの一部です。Redshiftは、列型DBMS原理で保存された大規模なDataSet上の分析ワークロードを取り扱います。DomoのAmazon Redshiftコネクターを使用すると、Redshiftのデータベースからデータを取得し、カスタマイズされたレポートを作成できます。取得するデータの指定は、SQLクエリの入力で行います。Redshift APIに関する詳細は、ウェブサイト(http://docs.aws.amazon.com/redshift/..._commands.html)を参照してください。
Amazon Redshiftコネクターは「データベース」コネクターです。つまり、クエリを使用してデータベースからデータを取得します。データセンターでは、ウィンドウ上部のツールバーで [データベース] をクリックすることで、これを含む他のデータベースコネクターのページにアクセスできます。
Redshiftデータベースには、Data Centerから接続します。このトピックでは、Redshiftコネクターユーザーインターフェース別のフィールドとメニューについて説明します。DataSetの追加や更新スケジュールの設定、DataSet情報の編集に関する一般的な情報は「データコネクターを使用してDataSetを追加する」で説明しています。
主な使用事例 |
Redshift Dara Warehouseまたはデータマートからデータを引き出す。 |
主なメトリクス |
これは、Redshiftインスタンスに保存されたデータ次第です。 |
社内における主な権限 |
|
平均導入時間 |
設定と、引き出すデータ量により、5時間から40時間です。 |
使いやすさ(1~10の段階。1が「最も使いやすい」) |
6 |
ベストプラクティス
結果セットのサイズをできる限り制限します。データの取得速度を高めるには、「フェッチサイズ」を増加できます。ただし、あまり大きなサイズにすると、コネクター実行の失敗が発生し、Redshiftインスタンスのパフォーマンスに問題が生じる可能性があります。まずは10000から始めるのが適切でしょう。
必要条件
Redshiftデータベースに接続し、DataSetを作成するには、以下が必要です。
-
Redshiftデータベースのログインに使用するユーザー名とパスワード
-
データベースサーバーのホスト名(例:db.company.com)。
-
データベースのポート番号
-
データベース名
CA証明書テキストまたはURLパスは、[証明書書式]メニューでそれぞれ[証明書文字列]または[URLパス] を選択する場合のみ必要になります。
Redshiftアカウントを作成する
Redshiftユーザーアカウントを作成するには、Redshiftデータベース管理者(DBA)に連絡し、以下を行ってもらいます。
デフォルトでは、クラスターを起動したときに作成したマスターユーザーのみがクラスターの初期データベースにアクセスできます。他のユーザーにアクセス権を付与するには、1つ以上のユーザーアカウントを作成する必要があります。データベースのユーザーアカウントは、個々のデータベースに属するものではなく、クラスターのすべてのデータベースでグローバルに使用できます。
CREATE USERコマンドを使用して、データベースの新規ユーザーを作成します。新規ユーザーを作成する際に、新規ユーザーの名前とパスワードを指定します。パスワードは必須です。8から64文字で、また大文字と小文字、数字がそれぞれ1つ以上含まれている必要があります。
例えば、ユーザー名をGUESTにし、パスワードをABCd4321にする場合、次のコマンドを使います。
create user guest password 'ABCd4321';
IPアドレスをホワイトリスト登録する
Redshiftデータベースに接続する前に、接続先となるデータベースサーバーのポートで以下のIPアドレスをホワイトリストに登録する必要があります。IPアドレスの詳細なリストは、「コネクターのIPアドレスをホワイトリスト化する」を参照してください。
Redshiftデータベースに接続する
このセクションでは、Redshiftコネクターページの[認証情報]および[詳細]ペインのオプションについて説明します。このページの他のペインの項目である[スケジュール設定]や[DataSetの名前と説明]に関しては、ほとんどのタイプのコネクターで共通しています。詳細については「データコネクターを使用してDataSetを追加する」を参照してください。
[認証情報]ペイン
このペインには、データベースに接続する認証情報の入力フィールドが含まれています。以下の表では、各フィールドに必要な内容を説明しています。
フィールド |
説明 |
---|---|
JDBCドライバー |
接続に使用するJDBCドライバーを選択します。 |
ホスト |
SQLデータベースに接続するためのホスト文字列を入力します。例://examplecluster.cpdbcwb2mzr4.us-east-2.redshift.amazonaws.com |
データベース |
SQLデータベース名を入力します。 |
ユーザー名 |
Redshiftユーザー名を入力します。 |
パスワード |
Redshiftパスワードを入力します。 |
データベースポート |
データベースのポート番号を入力します。 |
証明書書式 |
証明書書式を選択します。証明書を含めない場合は、[証明書なし]を選択します。[証明書文字列] を選択する場合は、証明書用テキストを[証明書]フィールドに貼り付ける必要があります。[URLパス]を選択する場合は、証明書がある場所のURLを[証明書]フィールドに入力します。 |
証明書 |
CA証明書用テキストを貼り付けるか、証明書がある場所のURLを入力します。これは任意です。証明書を含めない場合は、[証明書書式]メニューで[証明書なし]を選択します。 |
有効なRedshift認証情報を一度入力しておくと、同じアカウントを使用して随時、新しいRedshift DataSetを作成することができます。コネクターのアカウントはData Centerの[アカウント]タブで管理できます。このタブの詳細については、「コネクターのユーザーアカウントを管理する」を参照してください。
[詳細]ペイン
このペインで、SQLクエリを作成して、データベースからデータを取得します。指定のデータベース表と列を選択し、どの列をレポートに表示するかを指定することもできます。
メニュー |
説明 |
---|---|
クエリ |
必要なデータを選択するために使用するStructured Query Language(SQL)クエリを入力します。例: select * from Employee |
データベース表 |
レポートに表示するデータベース表を選択します。 |
表の列 |
レポートに表示する表の列をすべて選択します。 |
クエリヘルパー |
必要な場合は、このクエリを修正します。 |
その他のペイン
スケジュール設定、再試行、オプションの更新など、このページにないセクションに記載のコネクターインターフェースについては、「 データコネクターを使用してDataSetを追加する」を参照してください。
トラブルシューティング
接続問題が発生した場合は...
-
pgAdminを使用して接続を確認します。
-
必要なすべてのDomo IPがホワイトリスト登録されていることを確認します(上述の「IPアドレスをホワイトリスト登録する」を参照)。
-
SQLクエリでプロファイルを実行します。
よくある質問
データはどのような頻度で更新できますか?
必要に応じて更新できます。
注意すべきAPI制限はありますか?
制限は使用するサーバー構成によって異なります。
クエリの記述の際に注意すべき点はありますか?
すべての単語、表名、フィールド名が正しく記述されていることを確認してください。クエリのヘルプについては、[クエリヘルパー]フィールドを参照してください。