11/2は「No-ops で大量データ処理基盤を簡単に構築する」だった
Google Cloud OnAirって、微妙な時間にやっているんだよね。18:00〜19:00って、ウチでは食事の時間。で、昨日はお行儀悪いけどしゃぶしゃぶ食べて家族と話しながら観てたのです。
GoogleではBig Dataって表記するのね。もうビッグデータって言葉はGoogleには存在しないわけです。でかいデータなんて当たり前というかね、要するにタダのデータだろ、と。
で、扱うデータって、テラバイトなんか当たり前で、ペタバイトとかもある。らしい。Googleのクラウドには全然問題なく格納できてしまうんだけど、その話を聞いたときにすげーなって思ったわけです。
ていうのはね、ストレージデバイスになにを使っているかはわからないけど、それだけの容量の物理デバイスを持ってりゃね、まずどっかのデバイスが故障してもおかしくないわけです。だからGoogleはたぶんそれを防ぐための様々なことをして、論理的にデータが正しいことを保証しているわけ。これって高度なクラウドシステムだからできるわけだけど、Googleの人は平然とペタバイトでも平気だというわけです。
この領域になるとクラウド使うしか方法ないよね。とかしゃぶしゃぶ食べながら思ってたわけです。
BigQueryとかもうすごいよね
で、その大量のデータを検索するのにSQLライクな言語を使うわけだけど、結果が秒単位で出るというのね。これすごい。SQLでBig Dataからみたらゴミみたいな量の検索をイライラしながら待っていた時代とは根本的に違うわけです。
正規化とかさ、そういう感覚も違ってくるよね。まあ、論理的にはちゃんと設計したほうがいいわけだけど、性能とかは考えなくてもいいわけだ。性能考えると変なデータ構成になるのが今までの問題点だったんだけど、そういう心配がない。素直にデータインポートして素直に検索すりゃいい。検索は時間がかからないからいろいろ試せるよね。分析にはもってこいだ。
Data Studioも便利
その分析にグラフとか使うでしょう?そういうときにData Studioなんか使っちゃう。だいだいが大きいデータだからパソコン上のExcelとか使えないわけだね。だからクラウド上の表計算ソフト使うことに必然的になっちゃうわけです。
もうExcelとかOpen OfficeとかNumbersとか使っている場合じゃない。みんなブラウザ上で動くGoogleの表計算ソフト使うってことになる。
今更ながらGoogle Driveの中をみてみたんだけど、スプレッドシートとかドキュメントの他にもいろいろアプリケーションがすでにあるんだね。バックアップとか考えなくてもいいし、誰かと共有しながら更新できちゃうし、もうみんなこれ使おうって感じだな。
まとめ
そんなの常識だろ?って人ももちろんいただろうけど、僕には結構衝撃的だった。もうクラウドとブラウザがあれば十分に仕事ができる時代なんだね。
水道の蛇口をひねって水を出すみたいにアプリケーションが使える時代が来るって言われて久しいけど、未だにパソコンの呪縛から逃れられていなかった。
もうこうなったらChromebookとか持ってね、心を入れ替えてクラウド生活にどっぷり浸かってみたいと思ったりしますよね。