Snowflake とは?簡単導入から活用方法、料金体系まで詳細ガイド

デジタルトランスフォーメーション(DX)の世界では、データは貴重な資源となります。しかし、データを活用し、事業価値に転換するには専門的な知識と技術が求められ、そのハードルの高さに頭を悩ませている方も多いのではないでしょうか?

その解決策として注目すべきなのがSaaS型データウェアハウス「Snowflake」です。この記事では、Snowflakeの特性、活用シーン、そしてBigQueryやRedshiftに対する優位性を徹底的に解説します。さらには、料金体系や導入事例もご紹介し、企業がこれからデータの利活用を進めていく上で役立つ情報を詰め込んでいます。

データのサイロ化に頭を悩ませている方も、この記事を通じて新たな可能性を見つけることができるはずです。ぜひ、本記事をご覧いただきデータの利活用の一助となれば幸いです。

Snowflake とは、クラウド型データウェアハウス

Snowflake とは、米Snowflake 社が提供するデータウェアハウスを中心としたクラウド型サービスです。

グローバルで7,290社(2022年10月時点)を超える顧客が導入しており、急成長を続けており、IT アドバイザのガートナー社のマーケットリサーチ(マジック・クアドラント)においても、競合他社と比較し、製品開発の先見性や実行力を高く評価されています。

また、データウェアハウスを中心としたと書きましたが、データの取り込み〜変換を行うデータパイプラインやデータを蓄積するデータレイク、データを共有できるデータシェアリングなど幅広い機能を網羅したプラットフォームであり、これをSnowflake社は「データクラウド」と呼んでいます。

このように、 Snowflake は、データ分析サービスであるプラットフォームだけではなく、ユーザーのデータコンテンツを組み合わせたサービス提供をしております。

具体的には、Snowflakeは、データの取り込みからその変換までを担当するデータパイプライン、データの蓄積場所としてのデータレイク、データシェアリングの機能など、多岐に渡る特長を持つサービスです。これら全ての機能を1つのサービス内で提供しており、その機能性の高さから、Snowflake社はこのプラットフォームを「データクラウド」と名付けています。

利用者は、これらの機能を使うことで、データのサイロ化が解消された上で、自社データだけでなく外部データも活用できるプラットフォームになります。

Snowflake の活用シーン

Snowflake のデータクラウドは、データパイプラインを備えた先進的なデータ分析プラットフォームとして機能します。

このプラットフォームは、どのクラウドにデータが存在していても、シームレスにデータを共有できるクロスクラウド機能を実現しています。その結果、マルチクラウド環境でのデータサイロ(クラウド間のデータ移動が難しく、分析上の問題を引き起こす)の問題を最小化できます。

Snowflake のクロスクラウドを重視する姿勢は、Snowflakeエコシステムの拡大や、ユーザーの既存システムとの連携による可用性向上といったメリットを提供し、金融、製造、ヘルスケア等、様々な業界で採用されています。

データ活用の世界でSnowflake が成長できた理由とは?

Snowflake は、データウェアハウスのコンピューティング部分と、データ保管のストレージ部分を分離を、マルチクラウド環境でソフトウェア的に実現するというアーキテクチャが評価され、柔軟なスケーラビリティを可能にしました。

また、マルチクラウドへのサービス展開という選択肢の柔軟性や、それによるデータ管理の一元化への道筋を立てやすいという側面もあります。

こうしたアーキテクチャやスケーラビリティの柔軟性の評価がありますが、日本国内マーケットに目をむけると、

  • Snowflake 日本法人設立
  • AWSクラウドの国内リージョン(東京、大阪)対応
  • Azure東京リージョン対応

等により、ユーザーが持つ国内のクラウド上のデータとの連携が容易になり、Snowflake が提唱するデータクラウドのコンセプトの考え方も広まっていったと考えられます。

Snowflake の特徴と導入のメリット

Snowflake の概要と活用シーンが理解できたあとは、どんな特徴があるのか?導入するべきメリットをご紹介します。

クラウドネイティブのアーキテクチャ

「コンピュートリソースとストレージの分離」のアーキテクチャについて、リソースの柔軟な拡張性について語られるSnowflake ですが、ストレージの分離によりデータを一元管理でき、データウェアハウス機能をシステムやアプリケーション単位に独立して起動することが可能です。

これにより個々のシステムやアプリの負荷という単位で、コンピュートリソース量を管理しつつ、データを一元管理できるプラットフォームを構成できます。

同時にクラウドネイティブ設計であるため、クラウドの得意とするインフラの省力運用、リソースコントロールによるコスト削減、セキュリティレベルアップが可能になります。

マルチクラウドに対応している

前述の通り、3大クラウドといえる、AWS、Azure、Google Cloud に対して、Snowflake はサービスを展開できます。

すでに利用しているクラウドがあれば同クラウドを選択することも多いでしょうし、またマルチクラウドの環境であれば、Snowflake をハブとして各種クラウドと連携させていく使い方も考えられます。

データシェアリング、タイムトラベル機能がある

Snowflake データシェアリングは、Snowflake アカウントA のデータベースについて、テーブル等のオブジェクトを他のアカウントとセキュアに共有が可能です。

Snowflake というプラットフォーム内でデータを共有できるため、企業が顧客やパートナー、自部門以外のビジネス部門とのデータ連携に有用な機能です。

タイムトラベル機能は、各エディションで標準の保持期間は1日(24時間)ですが、Enterprise 以上のエディションの場合、最大90日の範囲で、過去の任意の時点のデータにアクセスが可能になります。

現時点のデータが変更されていたり、削除されていたりしていても、大変なバックアップデータのリストア作業に頼らず、設定した範囲の過去データを容易に復元が可能です。

データコンテンツのエコシステム化

データクラウドのコンセプトについては前述しましたが、データについてすべてを自前でなくてよいという点も重要な特徴であり、メリットでもあります。 下記Snowflake のニュースリリースを例にとると、「50社の製造パートナーで構成されるSnowflakeのエコシステムでは、さまざまな製造および産業のユースケースに対応できるよう、事前構築済みのソリューションや業界データセットを提供」とあります。

参考:Snowflakeの製造向けデータクラウドでビジネス価値を引き出す

製造業だけでなく、金融やヘルスケアといった様々な領域でデータクラウドを構成しており、自前でビッグデータを保持していない企業であっても、データ利活用の領域に積極的に参加できます。

また、活用だけでなく、逆に自社データを適切にエコシステムに提供することで収益化する道もあります。

Snowflake の BigQuery や Redshift に対する優位性とは?

データウェアハウスには、Snowflake の他に

  • Google Cloud BigQuery
  • AWS Redshift

が挙げられます。

Snowflake と以上のサービスはどんな違いが、 Snowflake の競合優位性はどのようなものがあるのでしょうか?

サービスとしての位置付けや運用のしやすさ

BigQuery やRedshift はクラウドの1サービスであり、Snowflake はSaaS としてのサービスという位置づけです。

このため、Google Cloud やAWS 内のクラウドサービスとの連携が優先されるようなケースでは、BigQuery やRedshift が選定されることもあります。

この点はマルチクラウド/クロスクラウドのメリットをとるか、クラウド内のサービス連携をとるかによって評価は変わる点ですが、例えば、データの利活用について明確なゴールが定義しきれない事業でスモールスタート観点で見ると、Snowflake の多様なデータ活用にポテンシャルがあると考えられます。

また、Snowflake は、データ利活用のためのSaaS であり、特にRedshift と比較すると、インフラ管理のより省力的な運用(メンテナンス性、拡張性)が可能です。

また、前述のとおり、マルチクラウド上でのデータウェアハウス機能とストレージ機能の分離による、システムやアプリ設計の柔軟性は、特定クラウド内サービスであるBigQuery やRedshift にない特徴といえます。

コスト面:費用予測のしやすさ

BigQuery はストレージ量とクエリ実行に応じた従量課金メニューと定額前払メニューがあります。 Redshiftは、ノード数とノード起動時間に応じた従量課金メニューと定額前払メニューがあります。Redshift の場合、BigQuery と異なり、ノード展開に時間がかかることや定額メニューの割引率から定額前払メニューを取ることが多いです。

BigQuery とRedshift に共通することとして、費用予測が難しい点があります。

一方で、Snowflake の場合、次項で解説しますが、ストレージとコンピュートリソースの従量課金メニュー、定額前払メニューがあり、リソース使用率からの費用予測が中心であるため、BigQueryのクエリ量等スループットからの費用予測と比べ、予測がシンプルになります。

Snowflake の料金体系

本項の記載情報は、
2023/07時点のSnowflake 公式情報)を元に構成しています。

Snowflake の料金体系は、AWSやAzure、Google Cloud のクラウド料金体系と似ています。

Snowflake 利用料の概算を見積もるにあたり、下記を考慮します。

① 仮想ウェアハウス(コンピュートリソース費用に相当)
② ストレージ
③ データ転送
④ 米ドル為替レート(まとめで触れます。)

それぞれ以下の見出しで詳しく解説します。

① 仮想ウェアハウスの料金

通常利用の範囲では、利用料金の多くを占めるのは① 仮想ウェアハウスのコンピュート費用です。これは、例えばAWS 利用料において、EC2 料金が多くを占めるケースをイメージしていただければと思います。

仮想ウェアハウスの料金は、仮想ウェアハウスのサイズ(下表右ほど高スペック)によって設定されている「クレジット数とクレジット毎の単価」によって決まります。

               
XS S M L XL2XL 3XL 4XL 5XL 6XL
標準 1 2 4 8 16 32 64 128 256 512
XS S M L XL 2XL 3XL 4XL 5XL 6XL
標準 1 2 4 8 16 32 64 128 256 512

クレジットの単価は、クラウドやエディションによって異なります。

例1.AWS、Azure 東京リージョンのエディション毎のクレジット単価

Standard $2.85
Enterprise $4.30
Business Critical $5.70
Standard $2.85
Enterprise $4.30
Business Critical $5.70

例2.Google Cloud Iowaリージョンのエディション毎のクレジット単価

Standard $2.00
Enterprise $3.00
Business Critical $4.00
Standard $2.00
Enterprise $3.00
Business Critical $4.00

参考として、AWS、仮想ウェアハウスサイズ「L」、Enterprise エディション、月80時間起動、単一クラスタの場合、下記計算式となります。

8 クレジット × 80時間 × $4.30 = $2,752 … 1$140円とすると、月額385,280円
8 クレジット × 80時間 × $4.30 = $2,752 … 1$140円とすると、月額385,280円

② ストレージの料金

ストレージ料金の試算は、1TBあたりいくらの形式のため、比較的容易に見積もりが可能です。クラウド間の費用差も軽微です。

On-Demand Capacity(前払)
AWS 東京 月額 $46.00 / 1TB 月額 $25.00 / 1TB
Azure 東京 月額 $46.00 / 1TB 月額 $25.00 / 1TB
Google Cloud Iowa 月額 $46.00 / 1TB 月額 $20.00 / 1TB
On-Demand Capacity(前払)
AWS 東京 月額 $46.00 / 1TB 月額 $25.00 / 1TB
Azure 東京 月額 $46.00 / 1TB 月額 $25.00 / 1TB
Google Cloud Iowa 月額 $46.00 / 1TB 月額 $20.00 / 1TB

参考試算例として、AWS 東京で、5TBのデータを1年間保持するケースです。1年保持する想定であれば、Capacity 前払いプランを選択するとコストメリットが大きくなります。

5 TB × $25.00 × 12(1年分前払) = $1,500 … 1$140円とすると、月額17,500円
5 TB × $25.00 × 12(1年分前払) = $1,500 … 1$140円とすると、月額17,500円

③ データ転送の料金

データ転送料金の見積、試算は難しいケースが多いですが、Snowflake から外部へのデータ転送が業務上必要最小限であれば、①と②の合計額に10~20%程度、加算しておく程度でよいと思われます。

一応、金額を記載しておきます。

クラウドプロバイダー データが保存される領域 同じリージョン、同じクラウドへの転送 (TB あたり) 異なるリージョン、同じクラウドへの転送 (TB ごと) 別のクラウドへの転送(TBごと)
AWS Asia Pacific (Tokyo) $0.00 $90.00 $114.00
クラウドプロバイダー データが保存される領域 同じリージョン、同じクラウドへの転送 (TB あたり) 異なるリージョン、同じクラウドへの転送 (TB ごと) 別のクラウドへの転送(TBごと)
AWS Asia Pacific (Tokyo) $0.00 $90.00 $114.00
クラウドプロバイダー データ転送元リージョン 宛先リージョン (TB あたり)
同じクラウドプロバイダー 別のクラウドプロバイダーまたはインターネット
同じリージョン 同じ大陸内 異なる大陸間
Azure Japan East (Tokyo) $0.00 $80.00 $80.00 $120.00
クラウドプロバイダー データ転送元リージョン 宛先リージョン (TB あたり)
同じクラウドプロバイダー 別のクラウドプロバイダーまたはインターネット
同じリージョン 同じ大陸内 異なる大陸間
Azure Japan East (Tokyo) $0.00 $80.00 $80.00 $120.00
クラウドプロバイダー データ転送元リージョン 同じクラウドプロバイダーへのデータ転送 (TB) 別のクラウドプロバイダーまたはインターネットへのデータ転送 (TB)
同じリージョン 同じ大陸の異なる地域 別の大陸(オセアニアを除く) オセアニア 同じ大陸 別の大陸(オセアニアを除く) オセアニア
GCP US Central 1 (Iowa) $0.00 $10.00 $80.00 $150.00 $120.00 $120.00 $190.00
クラウドプロバイダー データ転送元リージョン 同じクラウドプロバイダーへのデータ転送 (TB) 別のクラウドプロバイダーまたはインターネットへのデータ転送 (TB)
同じリージョン 同じ大陸の異なる地域 別の大陸(オセアニアを除く) オセアニア 同じ大陸 別の大陸(オセアニアを除く) オセアニア
GCP US Central 1 (Iowa) $0.00 $10.00 $80.00 $150.00 $120.00 $120.00 $190.00

④まとめ

上記の通り、①から③までの料金項目のうち、仮想ウェアハウスがコスト内訳の多くを占めることが多いため、仮想ウェアハウスのサイズが妥当か、無駄な起動時間はないか等のコストモニタリングが重要になります。

ちなみに、米ドル為替レートでの支払いとなるため、想定為替レートは設定しておく必要があります。

Snowflake を利用するまでの流れと利用方法

Snowflake は無料トライアル版(30日間有効、400ドル相当の使用分)を提供しているため、検証は容易に開始できます。

  • GUI (Webインターフェイス)の利用
  • SnowSQLの利用

どちらからでも、操作が可能なので、比較的簡単に利用可能です。

ちなみに、SnowSQL とは、 Snowflakeコマンドラインクライアントのことです。(Oracleデータベースと比較すると、SQL plus 等に相当)

SnowSQL の導入により、下記のようなDDL/DML 系のコマンド操作が可能になります。

  • データベースとスキーマの作成
  • テーブルの作成
  • 仮想ウェアハウスの作成
  • データのアップロード
  • クエリの実行
  • データ挿入やテーブル削除

参考:(SnowSQLの利用
これにより、Snowflake データ基盤のコマンドによる自動化や、アプリケーション開発にSnowSQL を利用し、アプリ連携を行うこともできます。

本章では、具体的な操作方法には触れないですが、気になる方はぜひご自身で検証用アカウント作成をして操作してみてください。

Snowflake の導入事例紹介

リファラルマーケティングSaaS ソリューションの invy (クリエイティブホープ社)でのSnowflakeの活用事例を紹介します。

invy はGoogle Cloud 上でサービス提供をしていましたが、業務拡大に伴うデータ量増加により、データ分析をSnowfalke側で実施するインテグレーションを行いました。

この機能再配置により、分析の目的に応じたデータマートを構築し、出力速度向上〜分析の多様化を行いました。

このようなSnowflakeのデータマートを後から構築し、既存のDB、データレイクと連携させることができる柔軟性は、Snowflake プラットフォームの得意とするところです。

まとめ

データクラウドというコンセプトで、データプラットフォームだけでなく、様々なデータの利活用まで視野にいれているSnowflake は、データ活用や分析基盤構築を含むDX推進を検討されている事業会社にとって、重要な選択肢のひとつとなりえます。

また、Snowflake のような製品は常にR&D 投資を行い、機能を拡張していき新規/既存顧客の満足度を高めていく必要がありますが、例えば、話題の生成AI との連携についても積極的な機能拡張を行っており、先端技術との親和性も十分にあるといえます。

  • NVIDIAとSnowflake、生成AIで提携 企業にSaaS上のデータ利用の独自AIアプリ構築環境提供へ - ITmedia NEWS
  • Snowflakeが新たなLLMリリース、Applicaの生成AI技術を活用|EnterpriseZine(エンタープライズジン)

クラウド型データウェアハウスとしての機能を核にして、多様なデータ連携、周辺技術とのインテグレーションを着実に進めるSnowflake を採用することにより、事業会社のデータビジネスは急速に発展させることができるでしょう。

最後に弊社からのお知らせです。

データ活用の、こんなお悩みございませんか?

  • 何から始めればいいのかわからない
  • 分析してみたいけど方法が分からない
  • データ活用のメリットが社内で認知されていない

以上のお悩みの方へ 弊社は、貴社がデータ活用をもっと簡単に・スピーディーに始めるための支援をしております。

データ活用の支援

データ基盤の構築だけにとどまらず

  • 貴社独自のダッシュボードの作成
  • 施策改善までサポート
  • 企業・事業の成長に合わせたカスタマイズ

まで一気通貫でサポートできるのが弊社の強みです。

もちろん貴社のビジネス状況のヒアリングをしっかりと行いますので、どんなデータを収集したら良いのか?困っているあなたもご安心ください。

また、低価格&時短で分析基盤の構築が可能ですので、ミニマムからデータ分析を実施したい企業様におすすめです。 ※弊社サービスQuida(クイーダ)を使用した場合

  • データ基盤の構築だけ
  • データ活用のコンサルティングだけ
  • 一気通貫でのトータルサポート

貴社の状況に合わせたサポートが可能ですので、まずはお気軽にご相談ください

SNSでシェアする

google mapで見る