Google BigQuery - データセット、テーブル作成編

こんにちは、SSTDの大村です。わが社もクールビズになったのですが、オフィスフロアがだっだ広いので場所によっては冷房が強すぎで寒い席があります。まさに私の席ですが。。。女の割には熱がりのほうなのですが、それでも寒いですね。。

写真は前回に引き続き町田リス園です。そろそろお気づきかと思いますが顔出しパネルが大好きです。でも、この顔出しパネルはなぜか顔を出すところにプラ板がついていて、後ろに子供がいるんですが光の反射でいまいち写りが悪いですね。残念です。

前回はGoogle BigQueryを試してみましたが、今回は自分でデータセットとテーブルを作成してみましょう。

まずはデータセットを作ってみましょう。前回もアクセスしたweb interfaceにアクセスします。プロジェクト名の隣の「▼」をクリックし、「Create new dataset」をクリックします。

データセット名を入力して「OK」を押します。

エラーが出て作れない!

Billingが有効になってないよ!とのことです。Google APIs Consoleにアクセスし、警告マークが出ているBillingメニューをクリックします。

手順に沿って情報を入力してください。クレジットカードが必要です。

Billingが有効になりましたら、再度web interfaceにアクセスします。先ほどと同様にデータセットが作成します。

次にテーブルを作成します。作成したデータセットの横の「▼」を選択し、メニューから「Create new table」をクリックします。

Table IDに「testtable」と入力し、「Next」をクリックします。

Source Formatで「CSV」を選択し、File Uploadでローカルに作成した下記のファイルを選択し、「Next」をクリックします。

Schemaに下記のように記述し、「Next」をクリックします。

id:integer,name:string,time:timestamp

Field delimiterで「Comma」を選択し、「Submit」をクリックします。

しばらく待って、ブラウザのページをリロードするとテーブルが作成されています。左側のサイドメニューからテーブルを選択するとテーブルのスキーマが表示されます。

右側にある「Details」ボタンをクリックするとテーブルの詳細が表示されます。テーブルサイズやレコード数を確認することができます。

最後に前回と同じようにクエリを実行してみます。自分で作ったテーブルにクエリを発行するなんて感無量です。

右側の「Query Table」ボタンを押すとクエリ入力領域が表示されます。はじめからある程度書いてあるので、selectとfromの間に「*」と入力し、「RUN QUERY」ボタンをクリックすると、3行の結果が表示されます。

それでは皆様もたくさんのデータをアップロードしてさまざまな分析を行ってみてください。と、言いたいところですが、ブラウザベースですと大量のデータを扱うのは大変です。そのためにbq commandというコマンドが用意されていますので、次回はその設定方法と利用方法をご紹介したいと思います。

執筆:大村@SSTD