St_Hakky’s blog

Data Science / Human Resources / Web Applicationについて書きます

Data Portal(旧Data Studio)を真面目に触ってみたので、参考になった記事とかまとめる

こんにちは。

これまで、自社でRedashをメインで使っていたのですが、GCPの移行を部分的に進めているのもあって、Data Portal(Data Studio)を社内使ってみましたので、そのときに調べた内容とかハマったこととかを上げていきたいと思います。

まだ、使って4日とかその程度なので、間違っている箇所も大いにあると思いますが、その際はコメントいただけますと幸いです。

本家のドキュメント

Google Data Portalとは

f:id:St_Hakky:20200618184904j:plain

Google Data Portal*1は、無料で利用できるBIツールです。Googleアカウントがあれば、利用することができます。

Google DocumentやGoogle Spreadsheet、Google Slideなどと同様に、共同編集機能や共有機能も有しており、またGoogle AnalyticsやBigQueryなどを通して、様々なデータを取り込み、可視化できます。

また、Redashなどと違って、SQLなどを基本的には書く必要がなく、プログラミング不要で使うことができるので、エンジニア以外のメンバーの方にもハードルが低く、導入もスムーズに行うことができると思います。

使ってみての感想

はい、まずそんなに多くのBIツールを使ったことがないワイの感想ですが、Data Studioは中長期的な運用や細かい分析を行うには、少し不便だなぁと思いました。

(多分)使う対象となるユーザー*2

使う対象になるユーザーは、他のBIツールよりも少し狭いかも…?と思いました。大元をたどると当たり前といえば当たり前なのですが、Google analyticsやGoogle Adsenseといったサービスを活用している、マーケティングや広告の運用担当者などが使うとハマるのかな…?と思いました。

逆に、ガリガリSQLを書いて行うようなデータ抽出を伴うようなものなどは難しいかなと思いました。今回、仕事で使ったのは今扱っているサービスで、AIを使ってデータを解析した数値の傾向の監視のためだったので、細かい設定や少し複雑な集計を行う必要があり*3、少しユースケースにあっていなかったのかな、と思いました。

使ってみたり、調べてみたりした中でのメリットとデメリットをまとめてみます。

メリット

Googleの肩の上にうまく乗ることができるユースケースでは、メリットをうまく享受できるな、と思いましたが、それ以外のものや、簡単な集計でも、大人数で運用する場合や、中長期的に運用を考えていくようなケースでは、他のBIツールを検討したほうがいいかなと思います。

  • BI Engine*4の恩恵を受けることができる
  • 様々なデータソースの追加が簡単にでき、またGUIで操作ができるので、SQLが書けない人も使うことができる
  • サンプルで用意されているテンプレートが豊富で、Redashではおよそ不可能なレベルのレポートのデザインのカスタマイズができる*5
  • Google analyticsなどのデータの場合、テンプレートが充実しており、そのテンプレートを使って分析をすることができる
デメリット

「クッソ、Redashなら…Redashならできるのに…!」って思ったことがメインになってしまいました笑

  • データソースとレポートで行う可視化の機能の境界線が曖昧なため、データソースを誤って編集したら、データの意味などがレポート内部で変わってしまい、また影響範囲が読めなくなる
  • データソースをちゃんと管理していないと、データソースの管理が煩雑になっていく
  • 自由度が高すぎて、データを可視化するところ以外のところに労力を使ってしまう*6
  • レポートのところで任意に新しいフィールドの定義を行うことができるので、データソース
  • BI Engineが、Viewやカスタムクエリでは使えなくなる場合がある

使い方の面で参考になった記事

BI Engine

Googleが去年発表した、BI Engineというサービスです。BigQueryのデータを一定ボリュームだけキャッシュしておき、Data Portal上で利用するときに高速にデータにアクセスできるようにするものです。

詳しくは以下の動画と、

youtu.be

以下の記事に書いてあります。

BigQueryでのカスタムクエリー

BigQueryとの連携を今回はメインでやったので、備忘録的に書いておきます。自分でカスタムでクエリーを作って、データを取得することができます。Dateやカスタムのパラメーターをクエリに指定することもできます。

URLでパラメーターを指定する

BIツールとかで、Dashboardで使用する共通パラメーターをURLの中で指定することができたりします。自分が見るパラメーターが固定である場合、それをブックマークしておくと便利です。ただ、Data PortalはデフォルトではURLベースでパラメーターを指定することができないので、以下の記事のような感じで設定する必要があります。

仕事での活用

あんまり組織や業務でData Portalを運用しているのを見つけることができなかったのですが、以下の記事は参考になりました。もし誰か知っている人がいたら教えて欲しいです。


今日はData Portalを使ってみたときに参考になったサイトまとめと、メリットデメリットについて書いてみました。


それでは。

*1:昔は、Google Data Studioとなっていましたが、今はGoogle Data Portalと呼ばれています

*2:多分と言っているのは、まだ使い始めてまもないため笑

*3:時間単位の設定(5分間隔とか)を行う必要があり

*4:あとで出てきます

*5:この点は、絶対にRedashでは勝てないところではあるが、その反面自由度が高すぎて、「ある程度」のレポートを作るのも少し苦労しました

*6:これは個人の感想に近いですが、、、なんかフォントのサイズとかありものでいいのにという感じ笑