PowerShell からAmazon Athena のデータに接続してデータの取得・更新・挿入・削除・CSV エクスポートを実行する方法

加藤龍彦
加藤龍彦
デジタルマーケティング
CData PowerShell Cmdlets を使って、Amazon Athena のデータに接続、データの取得・更新・挿入・削除・CSV エクスポートを実行する方法を紹介します。

CData Cmdlets for AmazonAthena を使えば、PowerShell からAmazon Athena に手軽に連携して、データのCRUD やエクスポートを実行できます。

本記事では、Amazon Athena への接続方法からCSV エクスポート、データの操作までサンプルコード付きで解説していきます。

Amazon Athena への接続を設定

それでは、まずはAmazon Athena への接続設定からはじめていきましょう。接続設定にはCData Amazon Athena Cmdlets が必要となります。右側のサイドバーから製品の全機能が使える30日間の無償トライアルがダウンロードできるので、ぜひご利用ください。

インストールが完了したら、プロファイルに以下の行を追加してください。次のPowerShell セッションでモジュールがロードされます。

    Import-Module AmazonAthenaCmdlets;

Connect-AmazonAthena コマンドを使ってAmazon Athena との接続を設定します。各接続プロパティの取得方法は次に説明します。

    $conn = Connect-AmazonAthena  -AccessKey "$AccessKey" -SecretKey "$SecretKey" -Region "$Region" -Database "$Database" -S3StagingDirectory "$S3StagingDirectory"

Amazon Athena 接続プロパティの取得・設定方法

それでは、早速Athena に接続していきましょう。

データに接続するには、以下の接続パラメータを指定します。

  • DataSource:接続するAmazon Athena データソース。
  • Database:接続するAmazon Athena データベース。
  • AWSRegion:Amazon Athena データがホストされているリージョン。
  • S3StagingDirectory:クエリの結果を保存するS3 フォルダ。

Database またはDataSource が設定されていない場合、CData 製品はAmazon Athena の利用可能なデータソースからすべてのデータベースのリスト化を試みます。そのため、両方のプロパティを設定することでCData 製品のパフォーマンスが向上します。

Amazon Athena の認証設定

CData 製品は幅広い認証オプションに対応しています。詳しくはヘルプドキュメントの「はじめに」を参照してみてください。

AWS キーを取得

IAM ユーザーの認証情報を取得するには、以下のステップお試しください。

  1. IAM コンソールにサインインします。
  2. ナビゲーションペインでユーザーを選択します。
  3. ユーザーのアクセスキーを作成または管理するには、ユーザーを選択してからセキュリティ認証情報タブに移動します。

AWS ルートアカウントの資格情報を取得するには、以下のステップをお試しください。

  1. ルートアカウントの認証情報を使用してAWS 管理コンソールにサインインします。
  2. アカウント名または番号を選択します。
  3. 表示されたメニューでMy Security Credentials を選択します。
  4. ルートアカウントのアクセスキーを管理または作成するには、Continue to Security Credentials をクリックし、[Access Keys]セクションを展開します。

その他の認証オプションについては、ヘルプドキュメントの「Amazon Athena への認証」を参照してください。

これで接続設定は完了です。

Amazon Athena のデータを取得してCSV にパイプライン

接続が完了したので、Customers テーブルデータを取得して結果をCSV ファイルにエクスポートします。

Select-AmazonAthena -Connection $conn -Table Customers | Select -Property * -ExcludeProperty Connection,Table,Columns | Export-Csv -Path c:\myCustomersData.csv -NoTypeInformation

このコードでは、Select-AmazonAthena から取得した結果をSelect-Object に流して、Export-Csv に渡す前にいくつかのプロパティを除外しています。これは、CData Cmdlets が接続情報、テーブル、およびカラム情報を結果セットのそれぞれの行に挿入するためです。それらの情報を表示したくない場合に、Export-Csv コマンドに渡す前に除外を先に行い、そのあとでCSV ファイルにエクスポートします。

それでは、続いてデータの削除や挿入・更新を実行してみます。

データの削除

以下のように、フィルタリングで合致するレコードを削除することができます。

Select-AmazonAthena -Connection $conn -Table Customers -Where "CustomerId = 12345" | Remove-AmazonAthena

データの挿入と更新

データの挿入や更新を使って、加工やクレンジングも行えます。以下の手順では、CSV ファイルのデータを読み込んで挿入対象のオブジェクトに同じレコードが存在するかを確認した上で、存在する場合にはデータを更新、存在しない場合にはデータの挿入を行います。

Import-Csv -Path C:\MyCustomersUpdates.csv | %{
  $record = Select-AmazonAthena -Connection $AmazonAthena -Table Customers -Where ("Id = `'"+$_.Id+"`'")
  if($record){
    Update-AmazonAthena -Connection $amazonathena -Table Customers -Columns ("Name","TotalDue") -Values ($_.Name, $_.TotalDue) -Where ("Id = `'"+$_.Id+"`'")
  }else{
    Add-AmazonAthena -Connection $amazonathena -Table Customers -Columns ("Name","TotalDue") -Values ($_.Name, $_.TotalDue)
  }
}

おわりに

このように、CData Cmdlets を使えばPowerShell でのAmazon Athena のデータへの連携をシンプルに実現できます。ぜひCData PowerShell Cmdlets の30日間無償トライアルをダウンロードして、シンプルかつパワフルなデータ連携をお試しください。

はじめる準備はできましたか?

Amazon Athena Cmdlets の無料トライアルをダウンロードしてお試しください:

 ダウンロード

詳細:

Amazon Athena Icon Amazon Athena Cmdlets お問い合わせ

PowerShell Cmdlets は、Amazon Athena へのリアルタイム連携機能を提供します。Cmdlets を使ってデータに直接連携し、DB と同感覚でデータを扱うことができます。