脱・Excel職人宣言。なぜ私は、会社に内緒で「Snowflake」を触り始めたのか?

「〇〇さん、このデータ集計しといて。明日までね」
金曜日の夕方、チャットツールが冷徹に告げます。添付されているのは、基幹システムから吐き出された、100万行に近い未整形のCSVファイルです。
あなたはファイルを開き、VLOOKUP関数を組み、ピボットテーブルを更新する。その瞬間、画面は白くなり、マウスカーソルが回転を始めます。再計算が終わるのを待つだけの、虚無の時間。PCの唸り声を聞きながら、あなたは思うはずです。
「私の仕事は、PCの砂時計を眺めることだったのか」と。
情シスとしてのあなたの時間は、もっと創造的なことに使われるべきです。しかし現実は、現場の「便利屋」として、Excelという名の賽の河原で石を積み続けている。
もし、あなたがこの状況に絶望しているなら、それはチャンスです。なぜなら、その絶望こそが、次のキャリアへの扉を開く鍵だからです。
この連載は、Excel業務に忙殺されているひとり情シスのあなたが、実務を通じて「データエンジニア」という市場価値の高い職種へと変貌を遂げるための、実践的な記録です。
会社に予算がない? 導入予定がない? 関係ありません。会社の汚いデータを実験台にして、こっそりと、しかし着実に、あなたのスキルセットを書き換えてしまいましょう。これは業務命令ではなく、あなた個人のための「R&D(研究開発)」なのです。
■ Excel職人からデータエンジニアへ。転職を見据えた「勝手にDX」検証記
この連載は、教科書的な機能解説ではありません。実務データを使って、「Excel職人」が「データエンジニア」へと変態(トランスフォーム)するまでのロードマップです。
各回のテーマは以下の通り予定しています。
- Vol.1:概念理解(今回) … Snowflakeは「スーパーExcel」である。
- Vol.2:データロード … さらばCSV。100万行を「湖」に放流する。
- Vol.3:データ加工 … VLOOKUPよ、安らかに眠れ。SQL脳への書き換え。
- Vol.4:可視化 … 「紙のレポート」を廃止し、Webアプリ(Streamlit)を作る。
- Vol.5:自動化 … 自分が寝ている間に仕事を終わらせる(Task機能)。
- Vol.6:コスト管理 … クラウド破産を防ぐ「月5000円」運用術。
- Vol.7:キャリア戦略 … この実績を職務経歴書にどう書き、高く売るか。
今回は第1回、まずは武器を知るところから始めます。その武器の名は「Snowflake(スノーフレイク)」です。
■ Excel脳で理解する「Snowflake」の正体
Snowflakeとは何か。公式ドキュメントには「マルチクラスター共有データアーキテクチャ」といった難解な言葉が並んでいますが、今は忘れてください。
Excel職人の感覚で言えば、Snowflakeとはこうです。
「行数制限がなく、複数人で同時に編集しても絶対に壊れず、マクロ(SQL)が爆速で動く、無限容量の共有Excel」
Excelで諦めていたことが、ここでは「当たり前」にできます。100万行のデータも、一瞬で集計が終わります。ファイルが破損して開けなくなることも、誰かが上書きして数式が壊れることもありません。
なぜなら、Snowflakeは最初から「データを扱うこと」だけに特化して設計された、クラウド上の巨大なデータ基盤だからです。
■ なぜ「ただのDB」ではないのか?(分離の魔法)
従来のデータベース(SQL ServerやOracleなど)と何が違うのか。建築的な構造の視点で見ると、その革新性が分かります。
従来のデータベースは、例えるなら「冷蔵庫とキッチンがセットになったワンルームマンション」でした。 食材(データ)を詰め込みすぎると、キッチン(計算処理)が狭くなり、料理ができなくなる。逆に、大量の料理を作ろうとキッチンを広げると、家賃(コスト)が跳ね上がる。この「保存」と「計算」が密結合していることが、これまでの悩みの種でした。
対してSnowflakeは、「巨大倉庫(ストレージ)」と「レンタルキッチン(ウェアハウス)」が完全に分離されています。
倉庫はAmazon S3などのクラウドストレージを利用しており、容量は実質無限です。どれだけデータを放り込んでも溢れることはありません。
そしてキッチン(ウェアハウス)は、必要な時だけ必要なサイズを借りることができます。 普段は小さなキッチンで下ごしらえをし、月末の重たい集計処理の時だけ、ホテルの巨大厨房のようなハイスペックな計算リソースを一瞬だけ借りる。処理が終われば、すぐに返却(停止)する。
この構造のおかげで、以下のメリットが生まれます。
1. 干渉しない 重たい集計処理(料理)をしている横で、社長がレポート画面を見ても(味見)、システムは全く遅くなりません。別のキッチンを使っているからです。
2. サイジングからの解放 情シス最大の悩みである「サーバーのスペック選定」が不要になります。Tシャツのサイズ(XS, S, M...)を選ぶように、ボタン一つでスペックを変更できるからです。
■ リスクゼロで始める「無料トライアル」
「機能がすごいのは分かった。でも、高いんやろ?」
そう思うのも無理はありません。しかし、学習用として始めるなら、コストはゼロです。Snowflakeには30日間(400ドル分)の無料トライアルが用意されています。
クレジットカードの登録すら不要です。必要なのはメールアドレスだけ。 勝手に課金されることはありません。期間が過ぎれば、ただ使えなくなるだけです。
つまり、上司の承認はいりません。稟議書も不要です。これはあなたのプライベートな学習であり、会社の予算を一円も使わないのですから。
さあ、まずはアカウントを作りましょう!
1. 公式サイト(https://www.snowflake.com/ja/) の「無料で開始」ボタンを押す。
2. 必要事項を入力し、「次に進む」ボタンを押します。

3. 2ページ目も必要事項を入力し、入力後、「はじめる」を押します。
必要事項について
- 「Snowflake Edition」:「Enterprise(最も人気)」を選択するのが最もおすすめ。
なぜならSnowflakeならではの強力な機能(Time Travelやゼロコピークローンなど)は、Enterprise Edition以上でなければその真価を試すことができないので。
- 「クラウドプロバイダーの選択」:どれをえらんでもSnowflake自体の性能に変わりはありません。普段利用しているクラウドがあればそれを選んで構いませんが、なければデフォルトのままでも問題ありません。
- 「地域」:日本国内で利用する場合、TokyoまたはOsakaを選ぶとデータ転送の遅延が少なく済みます。

4. ロボット防止のための認証画面、使用目的アンケートが出て、登録したメールアドレスにアクティベーションメールが配信されます。
5. 配信されたメールの「CLICK TO ACTIVE」をクリックすると、ユーザー名、パスワードを設定する画面が開きますので、それぞれ必要事項を入力し「はじめる」を押します。
6. 「Welcome to Snowflake!」画面がでますが、ここでは右下の「Skip for now」ボタンを押して、ウィザードを終了させてください。
これだけで、あなたの手元には世界最先端のデータ基盤が用意されます。
■ 次回予告と準備
アカウントは作成できましたか? 次回(Vol.2)は、いよいよ手元の「汚いCSVデータ」をSnowflakeという湖に流し込みます。
もし、あなたがSQL(データベース言語)に不安があるなら、今のうちに少しだけ予習しておいてください。Excelの世界では「関数」が共通言語でしたが、こちらの世界では「クエリ(SQL)」で会話することになります。
難しく考える必要はありません。ジャズのアドリブ演奏と同じで、基本の型さえ覚えれば、あとは自由にデータを操れるようになります。
Excelという名の閉じた部屋から出て、広大なクラウドの世界へ。 その第一歩を、今日ここから踏み出しましょう。
【学習リソース】
ゼロからのデータ基盤 Snowflake実践ガイド (技術の泉シリーズ)
Snowflakeに関する書籍が少ない中、貴重な日本語解説本です。私はまずこの本から知識を得ました。