DBeaver でAzure Data Lake Storage のデータに接続
NOTE: DBeaver Community Edition 23.1 以降では、レガシーODBC ドライバーが廃止されています。代わりに CData JDBC Driver を使用できます(詳細はJDBC 経由で DBeaver からAzure Data Lake Storage に接続する方法をご参照ください)。ODBC ドライバーを使用する必要がある場合は、DBeaver のドキュメントをご確認ください。
CData ODBC Driver for Azure Data Lake Storage は、ODBC 標準経由でAzure Data Lake Storage のリアルタイムデータにアクセスし、使い慣れた SQL クエリで各種 BI、レポート、ETL ツールからAzure Data Lake Storage のデータを利用可能にします。この記事では、DBeaver のクエリブラウザなどのビジュアルツールを使ってAzure Data Lake Storage のデータを操作する方法を解説します。
CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、DBeaver でのリアルタイムAzure Data Lake Storage データ操作において卓越したパフォーマンスを実現します。DBeaver からAzure Data Lake Storage に複雑な SQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされた SQL 操作を直接Azure Data Lake Storage にプッシュし、サポートされていない操作(多くの場合 SQL 関数や JOIN 操作)は組み込みの SQL エンジンを使用してクライアント側で処理します。また、動的メタデータクエリ機能を内蔵しているため、Azure Data Lake Storage のデータを効率的に管理・分析できます。
Azure Data Lake Storage への接続設定
まだ設定していない場合は、データソース名(DSN)で必要な接続プロパティを指定します。DSN の設定は Microsoft ODBC データソースアドミニストレーターを使用して行えます。これはドライバーインストールの最終ステップでもあります。Microsoft ODBC データソースアドミニストレーターを使用して DSN を作成・設定する方法については、ヘルプドキュメントの「はじめに」の章をご参照ください。
Azure Data Lake Storage 接続プロパティの取得・設定方法
Azure Data Lake Storage Gen2 への接続
それでは、Gen2 Data Lake Storage アカウントに接続していきましょう。接続するには、以下のプロパティを設定します。
- Account:ストレージアカウントの名前
- FileSystem:このアカウントに使用されるファイルシステム名。例えば、Azure Blob コンテナの名前
- Directory(オプション):レプリケートされたファイルが保存される場所へのパス。パスが指定されない場合、ファイルはルートディレクトリに保存されます
Azure Data Lake Storage Gen2への認証
続いて、認証方法を設定しましょう。CData 製品では、5つの認証方法をサポートしています:アクセスキー(AccessKey)の使用、共有アクセス署名(SAS)の使用、Azure Active Directory OAuth(AzureAD)経由、Azure サービスプリンシパル(AzureServicePrincipal またはAzureServicePrincipalCert)経由、およびManaged Service Identity(AzureMSI)経由です。
アクセスキー
アクセスキーを使用して接続するには、まずADLS Gen2ストレージアカウントで利用可能なアクセスキーを取得する必要があります。
Azure ポータルでの手順は以下のとおりです:
- ADLS Gen2ストレージアカウントにアクセスします
- 設定でアクセスキーを選択します
- 利用可能なアクセスキーの1つの値をAccessKey 接続プロパティにコピーします
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:AccessKey
- AccessKey:先ほどAzure ポータルで取得したアクセスキーの値
共有アクセス署名(SAS)
共有アクセス署名を使用して接続するには、まずAzure Storage Explorer ツールを使用して署名を生成する必要があります。
接続の準備ができたら、以下のプロパティを設定してください。
- AuthScheme:SAS
- SharedAccessSignature:先ほど生成した共有アクセス署名の値
その他の認証方法については、 href="/kb/help/" target="_blank">ヘルプドキュメントの「Azure Data Lake Storage Gen2への認証」セクションをご確認ください。
最後に、ドライバーの DSN 設定画面で「Map To WVarchar」接続プロパティを False に設定します。この設定により、文字列型が SQL_VARCHAR にマッピングされ、SQL_WVARCHAR 型が NULL として表示されるのを防ぐことができます。
DBeaver でAzure Data Lake Storage ODBC データソースに接続
- DBeaver アプリケーションを開き、Database メニューから New Database Connection オプションを選択します。
- 「Connect to a database」ウィンドウで ODBC を選択し、Next をクリックします。
- Database/Schema フィールドに DSN 名(デフォルトでは CData Azure Data Lake Storage Source)を入力します。この名前は JDBC URL にも自動的に追加されます。
- Test Connection ボタンをクリックします。DBeaver が DSN を検出すると「Connected」メッセージが表示され、接続が成功した場合はドライバーの詳細情報も表示されます。
Azure Data Lake Storage のデータをクエリ
これで、データソース接続から公開されているテーブルの情報をクエリできるようになりました。データベース構造を展開して、すべてのテーブルを表示できます。テーブル名を右クリックして View data を選択すると、そのテーブルのデータを取得できます。データは Data タブに表示されます。
無償トライアルと詳細情報
これで DBeaver からリアルタイムのAzure Data Lake Storage データに接続できました。詳細については、CData ODBC Driver のページをご覧ください。30日間の無償トライアルをダウンロードして、今すぐ DBeaver でAzure Data Lake Storage のリアルタイムデータを活用してみましょう。