【ノーコード】SAS でHacker News データを可視化・分析する方法

古川えりか
古川えりか
コンテンツスペシャリスト
複雑なSAS × Hacker Newsの連携をノーコードで実現。SASからHacker Newsへのデータアクセス方法からデータの取得・可視化まで詳しく解説。データサイエンス業務を大幅に効率化できます。



SAS は、高度なアナリティクス、多変量解析、BI、データ管理、予測分析のためのソフトウェアです。SAS とCData ODBC Driver for API を合わせて使うことで、SAS からリアルタイムHacker News のデータへデータベースライクにアクセスできるようになり、レポーティング、分析能力を向上できます。本記事では、SAS でHacker News のライブラリを作成し、リアルタイムHacker News に基づいたシンプルなレポートを作成します。

CData ODBC ドライバーは、ドライバーに組み込まれた最適化されたデータ処理により、SAS でリアルタイムHacker News のデータを送受信する場合に圧倒的なパフォーマンスを提供します。SAS からHacker News に複雑なSQL クエリを発行すると、ドライバーはフィルタや集計などのサポートされているSQL 操作をHacker News に直接プッシュし、組み込みSQL エンジンを利用して、サポートされていない操作(一般的にはSQL 関数とJOIN 操作)をクライアント側で処理します。組み込みの動的メタデータクエリを使用すると、SAS でHacker News を簡単にビジュアライズおよび分析できます。

CData ODBC ドライバとは?

CData ODBC ドライバは、以下のような特徴を持ったリアルタイムデータ連携ソリューションです。

  1. Hacker News をはじめとする、CRM、MA、会計ツールなど多様なカテゴリの270種類以上のSaaS / オンプレミスデータソースに対応
  2. 多様なアプリケーション、ツールにHacker News のデータを連携
  3. ノーコードでの手軽な接続設定
  4. 標準 SQL での柔軟なデータ読み込み・書き込み

CData ODBC ドライバでは、1.データソースとしてHacker News の接続を設定、2.SAS 側でODBC Driver との接続を設定、という2つのステップだけでデータソースに接続できます。以下に具体的な設定手順を説明します。

CData ODBC ドライバのインストールとHacker News への接続設定

まずは、本記事右側のサイドバーからAPI ODBC Driver の無償トライアルをダウンロード・インストールしてください。30日間無償で、製品版の全機能が使用できます。

以下は、Hacker News に接続するための情報と、Windows およびLinux 環境でDSN を構成するためのステップです。

HackerNews への接続

HackerNews API(Firebase 製)は、認証が不要なパブリック API です。認証情報なしですぐに接続してデータをクエリできます。

以下の接続プロパティを設定して接続を確立してください:

  • AuthScheme:None に設定します。

接続文字列の例:

Profile=C:\profiles\HackerNews.apip;AuthScheme=None

DSN を構成する際に、Max Rows プロパティを定めることも可能です。これによって返される行数を制限するため、ビジュアライゼーション・レポートのデザイン時のパフォーマンスを向上させるのに役立ちます。

Windows

未指定の場合は、初めにODBC DSN(data source name)で接続プロパティを指定します。ドライバーのインストールの最後にアドミニストレーターが開きます。Microsoft ODBC Data Source Administrator を使用して、ODBC DSN を作成および構成できます。

Linux

Linux 環境にCData ODBC Driver for API をインストールする場合、ドライバーのインストールによりシステムDSN が事前定義されます。システムデータソースファイル(/etc/odbc.ini) を編集し、必要な接続プロパティを定義することで、DSN を変更できます。

/etc/odbc.ini

[CData API Sys]
Driver = CData ODBC Driver for API
Description = My Description
Profile = C:\profiles\HackerNews.apip
AuthScheme = None

これらの構成ファイルの使用に関する具体的な情報については、ヘルプドキュメントを参照してください。

SAS でHacker News ライブラリを作成

CData ODBC Driver for API に基づくライブラリを追加することで、SAS でHacker News に接続します。

  1. SAS を開き、[Explorer]ペインで[Libraries]を展開します。
  2. [Active Libraries]ウィンドウで右クリックし、[New]を選択します。
  3. ライブラリに名前を付け(odbclib)、Engine としてODBC を選択し、ライブラリをセッション間で保持する場合は[Enable at startup]をクリックします。
  4. Data Source を以前構成したDSN に設定し、[OK]をクリックします。 Creating a library for Hacker News in SAS.

Hacker News クエリからビューを作成

SAS は、ローコードのポイントアンドクリッククエリツールを使用するか、PROC SQL とカスタムSQL クエリのプログラムを使うことで、データのクエリをネイティブにサポートします。SAS でビューを作成すると、ビューがクエリされるたびに定義クエリが実行されます。これは、レポート、チャート、分析について常にリアルタイムHacker News のデータにクエリを実行することを意味します。

クエリツールの使用

  1. SAS で[Tools]->[Query]と進みます。
  2. データをプルするテーブルソースとテーブルを選択し、[OK]をクリックします。 Selecting table(s) to visualize.
  3. カラムを選択し、右クリックしてフィルタリング、順序付け、グループ化などを追加します。 Selecting columns(s) to visualize and configuring the query.
  4. [SQL Query Tool]ウィンドウを右クリックして[Show Query]を選択し、[Create View]をクリックして、クエリの結果を含むローカルビューを作成します。ビューに名前を付け、[OK] をクリックします。 Create a local view to work with Hacker News のデータ.

PROC SQL の使用

  1. SAS で、[Editor]ウィンドウに移動します。
  2. PROC SQL を使用してデータをクエリし、ローカルビューを作成します。
    Note:このステップにより、[Work]ライブラリにビューが作成されます。オプションとして、create view ステートメントでライブラリを指定できます。
    proc sql;
      create view topstories_view as
      select
        ,
        
      from
        odbclib.topstories
      where
         = '';
    quit;
    
  3. [Run]->[Submit]とクリックしてクエリを実行し、ローカルビューを作成します。

SAS のHacker News のデータに関するレポートまたはビジュアライズ

ローカルビューを作成すると、パワフルなSAS 機能を使用してHacker News のデータをレポート、ビジュアライズ、またはその他の方法で分析できます。PROC PRINT を使用して簡単なレポートを印刷し、PROC GCHART を使用してデータに基づいた基本的なグラフを作成しましょう。

HTML を印刷

  1. SAS で、[Editor]ウィンドウに移動します。
  2. PROC PRINT を使用してHacker News TopStories データのHTML レポートを印刷します。
    proc print data=topstories;
      title "Hacker News TopStories Data";
    run;
    
    A simpleHacker News のデータreport.

チャートを印刷

  1. SAS で、[Editor]ウィンドウに移動します。
  2. PROC GCHART を使用してTopStories データのチャートを作成します。
    proc gchart data=topstories;
      pie  / sumvar=
          value=arrow
          percent=arrow
          noheading
          percent=inside plabel=(height=12pt)
          slice=inside value=none
          name='TopStoriesChart';
    run;
    
    A simpleHacker News のデータchart.

Hacker News からSAS へのデータ連携には、ぜひCData ODBC ドライバをご利用ください

このようにCData ODBC ドライバと併用することで、270を超えるSaaS、NoSQL データをコーディングなしで扱うことができます。30日の無償評価版が利用できますので、ぜひ自社で使っているクラウドサービスやNoSQL と合わせて活用してみてください。

CData ODBC ドライバは日本のユーザー向けに、UI の日本語化、ドキュメントの日本語化、日本語でのテクニカルサポートを提供しています。

はじめる準備はできましたか?

API Driver で Hacker News のライブデータに接続

Hacker News に接続