PowerShell からRedshift のデータに接続してデータの取得・更新・挿入・削除・CSV エクスポートを実行する方法

加藤龍彦
加藤龍彦
デジタルマーケティング
CData PowerShell Cmdlets を使って、Redshift のデータに接続、データの取得・更新・挿入・削除・CSV エクスポートを実行する方法を紹介します。

CData Cmdlets for Redshift を使えば、PowerShell からRedshift に手軽に連携して、データのCRUD やエクスポートを実行できます。

本記事では、Redshift への接続方法からCSV エクスポート、データの操作までサンプルコード付きで解説していきます。

Redshift への接続を設定

それでは、まずはRedshift への接続設定からはじめていきましょう。接続設定にはCData Redshift Cmdlets が必要となります。右側のサイドバーから製品の全機能が使える30日間の無償トライアルがダウンロードできるので、ぜひご利用ください。

インストールが完了したら、プロファイルに以下の行を追加してください。次のPowerShell セッションでモジュールがロードされます。

    Import-Module RedshiftCmdlets;

Connect-Redshift コマンドを使ってRedshift との接続を設定します。各接続プロパティの取得方法は次に説明します。

    $conn = Connect-Redshift  -User "$User" -Password "$Password" -Database "$Database" -Server "$Server" -Port "$Port"

Amazon Redshift への接続

それでは、早速Amazon Redshift に接続していきましょう。データに接続するには、以下の接続パラメータを指定します。

  • Server:Amazon Redshift データベースをホスティングしているサーバーのホスト名またはIP アドレス
  • Database:Amazon Redshift クラスター用に作成したデータベース
  • Port(オプション):Amazon Redshift データベースをホスティングしているサーバーのポート。デフォルトは5439です

これらの値は、以下のステップでAWS マネージメントコンソールから取得できます。

  1. Amazon Redshift コンソールを開きます(http://console.aws.amazon.com/redshift)
  2. Clusters ページで、クラスター名をクリックしてください
  3. Configuration タブの"Cluster Database Properties" セクションからプロパティを取得します。接続プロパティの値は、ODBC URL で設定された値と同じになります

Amazon Redshiftへの認証

CData 製品では幅広い認証オプションに対応しています。標準認証情報からIAM クレデンシャル、ADFS、Ping Federate、Microsoft Entra ID(Azure AD)、Azure AD PKCE まで利用可能です。

標準認証

ログイン資格情報を使用してAmazon Redshift に接続するには、以下のプロパティを設定してみましょう。
  • AuthSchemeBasic
  • User:認証するユーザーのログイン情報
  • Password:認証するユーザーのパスワード

その他の認証方法については、ヘルプドキュメントをご確認ください。

これで接続設定は完了です。

Redshift のデータを取得してCSV にパイプライン

接続が完了したので、Orders テーブルデータを取得して結果をCSV ファイルにエクスポートします。

Select-Redshift -Connection $conn -Table Orders | Select -Property * -ExcludeProperty Connection,Table,Columns | Export-Csv -Path c:\myOrdersData.csv -NoTypeInformation

このコードでは、Select-Redshift から取得した結果をSelect-Object に流して、Export-Csv に渡す前にいくつかのプロパティを除外しています。これは、CData Cmdlets が接続情報、テーブル、およびカラム情報を結果セットのそれぞれの行に挿入するためです。それらの情報を表示したくない場合に、Export-Csv コマンドに渡す前に除外を先に行い、そのあとでCSV ファイルにエクスポートします。

それでは、続いてデータの削除や挿入・更新を実行してみます。

データの削除

以下のように、フィルタリングで合致するレコードを削除することができます。

Select-Redshift -Connection $conn -Table Orders -Where "ShipCountry = USA" | Remove-Redshift

データの挿入と更新

データの挿入や更新を使って、加工やクレンジングも行えます。以下の手順では、CSV ファイルのデータを読み込んで挿入対象のオブジェクトに同じレコードが存在するかを確認した上で、存在する場合にはデータを更新、存在しない場合にはデータの挿入を行います。

Import-Csv -Path C:\MyOrdersUpdates.csv | %{
  $record = Select-Redshift -Connection $Redshift -Table Orders -Where ("Id = `'"+$_.Id+"`'")
  if($record){
    Update-Redshift -Connection $redshift -Table Orders -Columns ("ShipName","ShipCity") -Values ($_.ShipName, $_.ShipCity) -Where ("Id = `'"+$_.Id+"`'")
  }else{
    Add-Redshift -Connection $redshift -Table Orders -Columns ("ShipName","ShipCity") -Values ($_.ShipName, $_.ShipCity)
  }
}

おわりに

このように、CData Cmdlets を使えばPowerShell でのRedshift のデータへの連携をシンプルに実現できます。ぜひCData PowerShell Cmdlets の30日間無償トライアルをダウンロードして、シンプルかつパワフルなデータ連携をお試しください。

はじめる準備はできましたか?

Amazon Redshift Cmdlets の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Amazon Redshift Icon Amazon Redshift Cmdlets お問い合わせ

Amazon Redshift データにリアルタイムアクセスできる簡単に使えるPowerShell Cmdlets セット。DataCmdlets を使って、SQL サーバーと同じようにリアルタイムデータを簡単に読み出し、書き込み、更新、および削除できます。