コンテンツ

【GCP】BigQuery + Looker Studioでデータを分析・可視化してみた

2023/11/23に公開

2023/12/16

GCP
BigQuery
Looker Studio
【GCP】BigQuery + Looker Studioでデータを分析・可視化してみた

はじめに

本ハンズオンでは、Google Cloud Platform(GCP)の強力なデータ分析ツールであるBigQueryと、可視化ツールであるLooker Studioを組み合わせて、データの分析と可視化を行います。

読者としては以下のような方々を想定しています。

  • データ分析や可視化に興味を持つ方
  • BigQueryやLooker Studioに関心を抱いている方
  • GCPでデータ分析基盤を構築しようとしている方

本記事のゴール

BigQueryで扱える公開データセットの一つ「COVID-19(新型コロナウイルス感染症)」を今回は分析対象とします。時系列で新型コロナウイルスの感染者や死亡者数の推移を比較していきましょう。

以下は、本ハンズオンで作成するLooker Studioのボードイメージです。

Looker Studioのボードイメージ
Looker Studioのボードイメージ

データ分析基盤の概要

データ分析基盤の概要
データ分析基盤の概要

データ分析の流れは、データレイク、データウェアハウス、BIツールなどの要素が組み合わさっています。それぞれの役割を見ていきましょう。

データレイク

データレイクはさまざまなソースから収集された大量かつ多様なデータを保存する場所です。

データウェアハウス

データウェアハウスは、データレイクから必要なデータを抽出し、トランスフォーメーションやクレンジングなどのデータ加工を行い、データを統合します。

BIツール

BIツールは、データウェアハウスから抽出したデータを可視化します。グラフやチャート、ダッシュボードなどのビジュアル要素を活用してデータを視覚的に表現します。

本ハンズオンで扱う範囲は青点線内のBigQuery、Looker Studioになります。両方ともGoogle Cloudのサービスのため、連携しやすく、シームレスなデータ分析と可視化を実現しています。

⑴データの抽出:BigQuery

Google Cloudにログイン

Google Cloudにログイン
Google Cloudにログイン

まずはGoogle Cloudの各サービスを利用するために、ログインしていきましょう。(Googleアカウントは事前に作成しておいてください)

  1. Google Cloudのウェブサイトにアクセスします。
  2. コンソールボタンをクリックして、Google Cloudのに進みます。

BigQueryにアクセス

  1. コンソール画面が表示されたら、左上のナビゲーションメニューをクリックし、メニュー内の「BigQuery」を選択します。
  2. BigQueryコンソールの「プロジェクトを作成」 ボタンから、プロジェクトを作成します。
  3. プロジェクト作成画面が表示されます。プロジェクト名(今回はbigquery-demo)を入力し、必要に応じて組織を選択します。

公開データセットを確認

公開データセットを確認
公開データセットを確認

今回はBigQueryが用意する公開データセットの「covid19_open_data」を利用します。手順は以下の通りです。

  1. 検索入力欄に「bigquery」と入力し、公開データセットのbigquery-public-dataを選択する。
  2. 一覧から「covid19_open_data」を探して選択する。

データスキーマの確認と抽出

データスキーマの確認と抽出
データスキーマの確認と抽出

スキーマタブを選択してみます。分析対象のテーブルは、COVID-19(新型コロナウイルス感染症)の公開データで、感染者数や死亡者数、ワクチン接種数などを含んでいます。タブバーの「クエリ」を選択し、以下のSQLを実行してみましょう。

SELECT
  date
  ,country_name
  ,new_confirmed
  ,new_deceased
FROM `bigquery-public-data.covid19_open_data.covid19_open_data`
WHERE 
  country_name = 'Japan'
  AND subregion1_code is not null
  AND date BETWEEN '2021-09-01' AND '2022-8-31'

「データを探索」ボタンから「Looker Studioで調べる」を選択する。

Looker Studioで調べる」を選択
Looker Studioで調べる」を選択

⑵データの可視化:Looker Studio

データの可視化:Looker Studio
データの可視化:Looker Studio

それでは、Looker Studioを触っていきましょう。グラフをクリックすると右サイドバーにグラフの設定画面が出てきます。

Looker Studioのグラフの設定画面で以下項目を調整しましょう。

  1. グラフタイプ:時系列グラフを選択。
  2. データソース:covid19_open_dataを選択
  3. ディメンション(見たい切り口):dateを選択
  4. 指標(数値):new_confirmednew_diceasedを選択
⑵データの可視化:Looker Studio
データの可視化:Looker Studio

いかがでしょうか。

時系列グラフで新型コロナウイルスの感染者数、死亡者数を比較することで以下の傾向が見えてきたと思います。

  • 感染者数は、ピーク時には急激な増加を示すことが多い。
  • ロックダウンや制限措置の導入により、感染者数は一時的に減少する傾向がある。
  • 感染者数の増加に伴い、死亡者数も一般的に増加する傾向がある。

最後に

本記事では、GCPのBigQueryとLooker Studioを使用したデータの分析と可視化について解説しました。

BigQueryとLooker Studioを利用すれば、誰でも簡単に膨大なデータを分析&評価できる仕組みを構築できることが分かったと思います。

最後までお読みいただきありがとうございました!

トップへ戻る

目次