# Google BigQuery 入門ハンズオンガイド

  • このラボでは、Google Cloud のサーバーレスデータウェアハウスである BigQuery を使用して、データセットの作成、外部 CSV ファイルの読み込み(テーブル作成)、そして SQL クエリによるデータ分析までの基本的な流れを学習します。

# ラボへのリンク

Introduction to BigQuery (opens new window)

# 事前準備:サンプルデータのダウンロード

まず以下にアクセスして、CSVファイルをあなたのパソコンに保存しておいてください。

https://storage.googleapis.com/whizlabs-downloads/sampledata.csv


# タスク

# タスク 1: Google Cloud コンソールにサインインする

  1. ラボ画面の [コンソールを開く] (Open Console) ボタンを右クリックし、シークレットウィンドウで開きます(Edgeの場合はIn Private Window)。

    プライベートウィンドウが使用できない設定になっている場合は、通常の左クリックをすることで別のタブが開きます。(すでに別のGoogleアカウントでログインしている場合はログアウトする必要があります)

  2. Google Cloud のサインイン画面が表示されます。
    • メールアドレス: ラボ画面に表示されている「ユーザー名 (Username)」をコピーして貼り付け、[次へ] をクリックします。
    • パスワード: ラボ画面の「パスワード (Password)」をコピーして貼り付け、[次へ] をクリックします。
  3. 利用規約の同意画面が表示された場合は [理解しました][同意して続行] をクリックして進みます。
  4. 画面を日本語化します。右上の三つの点のボタンをクリック → Preferences → 左メニューのLanguage and regionLanguage日本語に変更 → Saveボタンを順に選択していくと日本語に画面が切り替わります。

# タスク 2: BigQuery データセットを作成する

  1. 画面上部の検索窓に bigquery と入力して BigQuery を検索し、選択します。(ようこその画面が出たら完了で閉じます。)
  2. BigQuery のエクスプローラ(左側のパネル)で、あなたの プロジェクトIDstudent-XXXXのような表記)を見つけます。
  3. プロジェクトIDの右横にある 3つのドット(︙) メニューをクリックし、[データセットを作成] を選択します。
  4. データセット作成画面で以下の通り設定します。
設定項目 備考
データセット ID whizlabs_bq_dataset スペースが入らないように注意
ロケーションタイプ 「マルチリージョン」 デフォルト
リージョン US (米国の複数のリージョン) デフォルト
  1. [データセットを作成] ボタンをクリックします。
  2. エクスプローラパネルでプロジェクトIDの下に、作成した whizlabs_bq_dataset が表示されていることを確認します。

# タスク 3: ソースファイルをアップロードしてテーブルを作成する

作成したデータセットの中に、CSVファイルからデータを取り込んでテーブルを作ります。

  1. 作成したデータセット whizlabs_bq_dataset の右横にある 3つのドット(︙) メニューをクリックし、[テーブルを作成] を選択します。

  2. テーブル作成画面で以下の設定を行います。

    • ソース:
      • テーブルの作成元: 「アップロード」 を選択。
      • ファイルを選択: [参照] をクリックし、事前準備でダウンロードしておいた CSV ファイルを選択します。
    • 送信先:
      • テーブル名: user_details (必ずこの名前を入力してください)
    • スキーマ:
      • 「自動検出」 (Auto detect) のチェックボックスにチェックを入れます。
  3. その他の設定はデフォルトのまま、画面下の [テーブルを作成] ボタンをクリックします。

  4. エクスプローラパネルでデータセットを展開すると、user_details テーブルが作成されています。

  5. テーブル名をクリックし、右側の画面で [プレビュー] タブをクリックして確認します。取り込んだデータが表示されていれば成功です。

# タスク 4: SQLクエリを実行してデータを分析する

BigQuery の強力な機能である SQL クエリを使って、特定の条件(年齢が32歳以上)のユーザーを抽出します。

  1. 画面上部の [+] ボタンをクリックし、[新しいタブ] を開きます。

  2. クエリエディタ(SQLを入力する場所)が開きます。

  3. 以下の SQL コードをコピーして貼り付けます。

    SELECT username
    FROM `<project_id>.whizlabs_bq_dataset.user_details` 
    WHERE age > 32
    

    重要: <project_id> の部分は、実際のあなたの プロジェクトID に書き換えてください。(< > の部分は消します。プロジェクトIDは student-XXXXX と左側に記載されているものです。)

    例: プロジェクトIDが student-00865 の場合:

    FROM \student-00865.whizlabs_bq_dataset.user_details`(バッククォート \ はそのまま)

  4. [実行] (Run) ボタンをクリックします。(ヒントが表示される場合がありますが、×で閉じます)

  5. 画面下の [クエリ結果] セクションに、条件に一致したユーザー名のリストが表示されれば成功です。

# タスク 5: ラボの検証と終了

すべての学習が完了したら、Google Cloudのウィンドウを閉じ、ラボ画面の [ラボを終了 (End Lab)] ボタンをクリックし、確認画面で終了を選択してください。