Bigquery

GoogleのBigqueryとは?現役エンジニアが丁寧に解説

のんたん

nontan

京大工学部▶︎京大大学院情報学研究科▶︎日系企業のITエンジニア。研究室ではAI×通信の研究も行いAIにも知見あり。友人とプログラミング初学者向けブログ「はやぶさエンジニア」を運営。近日、Webサービスのリリース予定。26歳大阪在住

★本記事は10分で読み終わることができます。

現役エンジニアである筆者がGoogleが提供するBigqueryを利用してみたい方に向けた丁寧な解説記事となっています。

データ分析を仕事にしている人たちの中で、Googleが提供するBigqueryを利用する方法が主流になりつつあります。

Bigqueryの料金体系から初めの使い方までまとめているので是非参考になればと思います。

未経験くん
Bigqueryって結局なに?
未経験ちゃん
どうやって始めるの?料金はどうなの?

この記事はそんな悩みに答えています。

Biqueryとは

Bigquery

BigQuery とは Google Cloud Platform(GCP) の中の1つのサービスで、ビッグデータ解析サービスです。

データ保存としてデータウェアハウスとしても利用されます。

そもそも「GCPとは、GoogleがYoutubeや検索エンジン、Mapなどのサービスを構築している基盤をユーザ・クライアントに向けて使えるようにしたクラウドサービス」です。

Googleの超エリートエンジニアたちが使っている社内基盤を利用できる素晴らしいサービスですね。

その中でBigqueryは Google 社内で利用していた「Dremel(ドレメル)」という大規模なデータ分析を実行するツールを、外部ユーザー向けに利用できるようにしたサービスが BigQuery となります。

クラウドサービスの特徴であるサーバーレスでスケーラビリティを活かして、安くて高速なデータ処理を実現しています。そして、GCPが提供するサービスとも簡単に連携可能で様々な活用方法があります。

BigqueryはSQLを使える人なら即座に利用できます。下にSQLについて学べるオススメのUdemy講座を載せておきます。

エクセルやGoogle スプレッドシートのデータなどのパソコン内に保存しているファイルをアップロードして解析できるので試してみてください。

Bigqueryの必要な操作は全てWebブラウザで完結しているのでとても簡潔です。

【オススメのUdemy講座】BigQuery で学ぶ非エンジニアのための SQL データ分析入門

体系的にBigqueryを学べるためになる講座なので是非。

11時間の動画教材でBigqueryの使い方からSQLの基礎まで網羅されている素晴らしい講座です。

受講はこちら

Bigqueryのメリット・強みは?

大きく3つの要素があります。

  • スペック面として「高速な処理」
  • 使いやすさ面として「データベースの知識が不要で、エクセルやCSVなどのデータを簡単に取り込める」
  • コスト面として「料金が使った分だけの従量課金」

高速な処理速度

誰しもが最大の利点にデータの処理の高速さをあげていると思います。

Googleは世界最大の検索エンジンを持っていますよね。

Bigqueryは、世界中で検索される文字やサイト、履歴を解析しているGoogleが提供する最強のデータ分析サービスなので最速・最強なのは理解できると思います。

ローカルでデータ分析を実行すると、GB(ギガバイト)レベルは処理可能ですが、TB(テラバイト)レベルのデータ量になるとかなりの処理時間を必要とします。BigQueryは、TBの1000倍であるPB(ペタバイト)レベルのデータ量も爆速で処理を行うことができてしまいます。

GBは数秒です。早すぎてローカルで処理することが嫌になります笑

データベースの知識が不要で、エクセルやCSVなどのデータを簡単に取り込める

次に非常に扱いやすいという点が挙げられます。

データベースを利用するときは、null許容やデータ型、処理の最適化といった知識が必要となってきます。そのほか外部からデータを挿入するような連携もアクセス権限の付与の運営ポリシーを把握する必要があります。

しかし、BigQueryを操作する際に詳細な知識を全く必要せずSQLの知識さえあれば誰でも即座にデータ分析が可能です。データのインポート・取り込みもエクセルをブラウザ上で読み込んであげるだけで完了します。

料金が使った分だけの従量課金

3つ目は、コストが非常に安い点です。

データを分析した分に対してお金がかかる料金体系で、計算のデータ量が以下の画像のように事前にわかるため料金の概算ができるため安心です

Bigqueryの一部切り抜き

あとで詳しく説明しますが、データ分析の計算量として毎月1TBまで無料で利用できます。

毎月の無料枠

無料を越えた後は、料金の目安として1TB(テラバイト)が500円程度となっています。高く思える方もいるかもしれませんがこれは破格の値段です。

スペック面、使いやすさ、コスト面ともに、破壊的なサービスであることがわかると思います。

【BigQueryで学ぶ!SQLの基本:初学者からすらすらデータ抽出できるまで】

受講はこちら

Bigqueryのコスト・料金は?

Bigqueryの料金公式ページはこちらです。

BigQuery には大きく2種類の課金対象があります。

・データ分析の計算量
・ストレージ

それぞれ説明していきますね。

データ分析の計算量

オペレーション料金詳細
クエリ(オンデマンド)$5.00 per TB毎月 1 TB まで無料です。

まずはデータ分析の計算量に対しての料金が上の表になります。

BigqueryではSQLのクエリを直接実行することでデータを分析できます。そのクエリに対して1TBごとに約500円かかります。安すぎますね。

そして毎月1TBまでは無料です。これは企業でない限り使いきれない無料枠ですね笑

ストレージ

ストレージは貯めてるデータと考えてください。

以下の表のアクティブストレージとは「過去90日間で変更があったデータ」、長期保存とは「過去90日間で変更ないデータ」のことをさしています。

オペレーション料金詳細
アクティブストレージ$0.020 per GB毎月 10 GB まで無料。
長期保存$0.010 per GB毎月 10 GB まで無料。

アクティブストレージであれば、1GBに対して約2円がかかります。

上の料金でアクティブストレージでは以下の例ようにお金がかかってきます。

  • 100 MB を保存の月額料金は 0.2円
  • 500 GB を保存の月額料金は1000円
  • 1 TB を 保存の月額料金は 2000円

BigQuery では毎月10GBのデータ保存は無料です。Bigqueryを少し試してみたい人には10GBを十分な大きさなので、無料で利用できますね。

クラウドストレージの中でもこの料金体系はとても安い方です。ビッグデータの保管だけにもBigqueryを利用するのもいいと思います。

より詳しく料金体系と安全に安く使う方法を解説している記事を載せておきますね。

Biqueryを軽く使ってみる(無料枠内)

無料の範囲で触ることができるのでやってみてそんはないと思います!

国の調査データを軽くいじってみましょう。

まずはGCPにGmailでアカウント登録します。詳しく方法は下の記事をみてください。

GCPの登録ができたら下の動画で「Bigqueryの始め方と共にコロナのオープンデータを取り込み、クエリを実行するまで」を解説しています。

まとめ

Bigqueryとは何か理解していただけたでしょうか。

Bigqueryの特徴は以下の3点でしたね。

  • スペック面として「高速な処理」
  • 使いやすさ面として「データベースの知識が不要で、エクセルやCSVなどのデータを簡単に取り込める」
  • コスト面として「料金が使った分だけの従量課金」

是非ともBigqueryを使って爆速で効率よくデータ分析をしてみてくださいね。

  • この記事を書いた人
のんたん

nontan

京大工学部▶︎京大大学院情報学研究科▶︎日系企業のITエンジニア。研究室ではAI×通信の研究も行いAIにも知見あり。友人とプログラミング初学者向けブログ「はやぶさエンジニア」を運営。近日、Webサービスのリリース予定。26歳大阪在住

-Bigquery

© 2021 はやぶさエンジニア Powered by AFFINGER5