とりゅふの森

GCPデータエンジニアとして生きる

【BigQuery】GCPのリリースノートを公開データセットから取得してみる

2021/8/13に、GCPのリリースノートが、BigQueryの公開データセットに追加されました。
bigquery-public-data:google_cloud_release_notes.release_notes というテーブルです。

GCPのリリースノートがBigQueryの公開データセットに追加されました。

通常のリリースノートは、プロダクト別にページが存在しますが、このテーブルでは複数のプロダクトのリリースノートをまとめて取得できるので、複数プロダクトのリリースを追いたい方は、このテーブルを見るのもありかもしれません。
今回はこのテーブルを使ってリリースノートを追えるかどうか、検証してみようと思います。

BigQueryの公開データセットの利用方法はこちらからどうぞ。

www.true-fly.com

テーブル定義

定義は以下の通りです。

カラム
description STRING
release_note_type STRING
published_at DATE
product_id INTEGER
product_name STRING
product_version_name STRING

特定のプロダクトのリリースノートを取得する

product_nameにプロダクト名があるので、この項目で絞り込みができます。
published_atで降順ソートすれば、通常のリリースノート同様に最新のリリースから閲覧できますね。
descriptionに、GA、beta、Previewといった区分が文字列として含まれているので、これらのリリース区分を正規表現で持ってくることも可能です。
下記SQLで、BigQueryのリリースノートを取得してみました。

SELECT 
    published_at,
    product_name,
    product_version_name,
    release_note_type,
    CASE
        WHEN regexp_contains(description, r'\(GA\)|\[GA\]') THEN 'GA'
        WHEN regexp_contains(description, r'\(beta\)|\[beta\]') THEN 'beta'
        WHEN regexp_contains(description, r'\(Preview\)|\[Preview\]') THEN 'Preview'
        ELSE 'Others'
    END AS release_class,
    description,
FROM
    `bigquery-public-data.google_cloud_release_notes.release_notes`
WHERE
    -- 取得したいプロダクト名
    product_name = 'BigQuery'
ORDER BY     
    published_at DESC

結果 f:id:true-fly:20210815221007p:plain

このSQLをプログラムで実行してあげれば、RSSのような機能を実装することができそうですね!
テキストの整形やフィルタリングがSQLで実装できるので、プログラムに不慣れだけど、SQLなら得意って稀有な方にとっては便利かも…?

データポータルでレポート化する

リリースノートといえば定期的にチェックしたいので、データポータルでレポート化するのが良いです。
先程のリリースノートSQLからWHEREの条件を消して、カスタムクエリでデータソースを作成し、レポート化してみました。

GCPのリリースノートをデータポータルでレポート化する

日付を降順で並べ、プロダクト名、リリースノートタイプ、GA、beta、Preview、Othersの区分でフィルタできるようにしました。
GCPのすべてのプロダクトのリリースノートを追いたい!という方はなかなかいないとは思いますが、例えばBigQueryとGoogle Kubernetes Engineのリリースノートだけは追いたい!といった人は、予めフィルタリングしておけば、毎日チェックがしやすくなるかと思います。
フィルタのデフォルト値は、右側のメニューの、コントロールフィールドで、カンマ区切りで指定ができます。

おまけ

データポータルでリリースノートが集計できるようになったので、以下2点を見てみました。

2021年に一番リリースされているGCPプロダクトは?

GAのリリースノートのみに絞り込みしてランキングを出してみました(discriptionに(GA)[GA]の文字列が含まれていることが条件)。
やはりBigQueryと、GKE、Cloud RUNが上位に来るという、GCPユーザーなら納得の結果でした。やはりGCPといえばこの3つのサービスが他のクラウドとの差別化となっているのかもしれません。

2021年GCPプロダクトのリリース回数(GA)

GCPプロダクトで一番リリース回数が多い曜日は?

今度は2019年1月以降で、GAのリリースノートのみに絞り込みし、どの曜日が一番リリース回数が多いのかを見てみました。
結果は以下の通りです。

GCPプロダクトで一番リリース回数が多い曜日は?

なんとなく月曜、水曜日が多いような…?
リリースノートを定期的にチェックするなら、週の初めの方に見るのが吉かもしれませんね。

まとめ

今回はGCPのリリースノートをBigQueryの公開データセットから取得する方法についてご紹介しました。GCPの複数プロダクトのリリースノートを追いたい場合は、今回紹介したように、データポータルでレポート化してみると良いと感じました。
BigQuery公開データセットは、SQLやBIの練習にもうってつけの宝の山なので、また新しいデータが追加されたら、活用ができるかどうかを検証する記事を紹介していこうと思います。
本ブログでは、BigQueryに関する記事もたくさん公開していますので、合わせて是非ご覧ください!

www.true-fly.com