作為大數據時代下的熱門分析工具之一,BigQuery 已經成為許多企業營運決策中不可或缺的工具, 除了其原本無伺服器、全託管等特色,為了更進一步符合企業需求、改善使用者體驗, Google 在今年的 Google Data Cloud & AI Summit 宣布推出了新的三個版本和計價方式,並於各版本提出兩項創新 — 用量自動計算和壓縮儲存計價,同時, Google 也將所有地區的 On-Demand 分析模型價格提高 25%。企業可以根據個人用量進行混搭,希望給予用戶更多彈性及更高的 CP 值。
我們先用一張圖讓大家瞭解 BigQuery 儲存及運算的計價模型:
三個 Capacity 新版本
三個版本分別是 Standard、 Enterprise、 Enterprise Plus,基本計價方式、適合對象、版本特色可參見下面表格:
Standard | Enterprise | Enterprise Plus | |
基本計價 | $ 0.04/ slot hour | $ 0.06/ slot hour | $ 0.10/ slot hour |
適合對象 | 標準 SQL 分析 臨時短期的開發及測試 | 進階企業分析 安全性、治理、機器學習及數據管理需求 | 關鍵任務商務分析 長時間正常運行、高可用性、高復原要求、複雜的監管需求 |
版本特色 | – 用量自動計算 – Slots 最高 1,600 單位 – 每個管理專案最高5個預定保留 – 99.9% SLA – 區域高可用性 – Google Cloud 廣泛認證(基礎合規性) – HIPAA 合規性 – Google 加密金鑰 | Standard 版本功能+ – 預定保留無上限 – 99.99% SLA – BI Query 加速 – 整合 ML 模型 – 全文搜尋 – 物件表格 – VPC 安全控制防止數據外流 – 數據遮罩、欄位安全 | Enterprise 版本功能+ – 區域層級災難復原 – 客戶管理加密金鑰 – 支援透過 Assured Workloads 提供的 FedRAMP、ITAR 及其他合規制度 |
承諾合約 | 無 | 可選: 一年 $ 0.048/ slot hour 三年 $ 0.036/ slot hour | 可選: 一年 $ 0.008/ slot hour 三年 $ 0.006/ slot hour |
用量自動計算
本次的兩項創新之一 — 用量自動計算旨在透過即時且細緻的資源計算滿足企業的工作量需求,並確保使用者只需為真正使用到的計算容量付費。BigQuery Autoscaler 是協助您管理運算用量的強力工具,在事前設定最大用量及基礎運算用量後,BigQuery 將會自動管理及優化專案內的運算用量,省去手動管理的麻煩,確保運算容量發揮最大效果的同時還能降低管理的成本。
在用量自動計算的模式下,應負擔的金額可分為兩個部分:Baseline 及 Autoscaling slots。Baseline 指的是運作所需最低單位的 slots,也是該時段應付的最低金額,可以分為基礎的 Baseline 和 Commitment 價格的 Baseline,若企業事先簽訂承諾合約(Commitment),將可享有更低的價格;Autoscaling slots 則是企業該小時所運用到的 slots 總數減去 Baseline,自動計算實際使用量,完全符合「實支實付」的概念。同時也可以設定 Maximum slots,防止 Autoscaling slots 的費用超過預算。
我們用 Baseline + 一年 commitment + 無 capacity sharing 的情境當作案例,不同的需求量計算方式如下圖:
今年 7 月 5 日起,BigQuery 的用戶已經無法再購買以年或月計算的固定費率方案(Flat-rate)及彈性 slot 承諾合約,BigQuery 工作負載管理和容量會自動轉移至到 BigQuery Enterprise 版本,詳細轉移說明可以參考官方說明。
舉例來說,若原本是購買 Flat Rate Model 100 slots / month,每月費用為 2000 美金。而 BigQuery Enterprise 版本的收費為 0.06/per slot hour,相當於每月 4380 美金(0.06*730*100)。若沒有進行commit或是調整,BigQuery Reservation API 費用會從每日約 66.67 美金(每月 2000 美金)上升至每日約 144 美金(每月 4380 美金)。
註:一個月以730小時做為計算
壓縮儲存計價
本次的另一項創新 — 壓縮儲存計價則是能夠確保企業只需付出在數據資料被大幅壓縮後的價格,讓企業在降低支出的同時,增加數據足跡。壓縮儲存的技術經過多年的改良,現在已經能將數據壓縮到十二分之一,雖然壓縮儲存的價格為通常的兩倍,但基本上使用壓縮儲存計費模型還是更加划算的選擇。
儲存模式 | 價格 |
動態儲存 | $ 0.02 / GiB/ month |
動態壓縮儲存 | $ 0.04 / GiB/ month |
長期儲存 | $ 0.01 / GiB/ month |
長期壓縮儲存 | $ 0.02 / GiB/ month |
需要特別注意的是,若選擇使用壓縮儲存的計費模式需額外負擔 Time Travel Storage 的費用。在 BigQuery 中, Time Travel Storage可以讓您存取在過去一段時間內(預設為七天)被更新或刪除的資料數據,讓復原更加簡單快速。
舉例來說,若一個 BigQuery Table 總共有 100GB 的資料,壓縮儲存後的大小以 10 GB 計算,且該 Table 中 50% 的資料已被完全更新:
- Total Logical Bytes: 100GB
- Total Physical Bytes: 10 GB
- Data Changed: 50%
- Time Travel Physical Bytes: 5 GB
未使用壓縮儲存計費模式的費用為 100GB*$ 0.02 = $ 2(直接以 Logical Bytes 計算),而使用壓縮儲存計費模式的費用將變為 (10GB*$0.04) + (5GB*$0.04)= $ 0.6(壓縮儲存後的 Physical Bytes 加上 Time Travel Physical Bytes 數據量)。
如何查看資料量
從每個資料表(Table)中的詳細資訊,可以查看壓縮前後的資料量,並以此資訊來決定是否要啟用壓縮儲存的計費模式:
如何開啟壓縮儲存計費模式
- BigQuery Explorer
- 開啟資料集 (Dataset)
- 編輯詳細資料
- 進階選項
- 儲存空間計費模式
6. 勾選「啟用實體儲存空間計費模式」
註:更改 Dataset 的儲存計費模型後,需要 24 小時才能生效,且須等待 14 天才能再次更改存儲計費模型。
思想科技調整建議
隨著企業間對於雲端運算及儲存的接受度提升,針對數據的需求也大幅增加,Google 將會持續改善及調整產品的功能及計價方式。在價格調整後,思想科技建議您:
- 評估各資料集是否適用於壓縮儲存
- 若採用Capacity Pricing Model,查看各版本功能,確認需求較適合哪個版本
- 若需要 Enterprise、Enterprise Plus版本,且每月對於slots都有固定的基本用量 ,建議購買Committment來節省花費。以Enterprise版本每月 100 slots 為例,費用為每月4,380美金(0.048*730*100),若購買承諾使用:
– 1 year commitment:每月 3,504 美金(0.048*730*100),節省 876美金。
– 3 years commitment:每月 2,628 美金(0.036*730*100),節省1752美金。
若您有任何問題,歡迎聯繫思想科技 Master Concept 的專業顧問!
參考資源:
https://cloud.google.com/blog/products/data-analytics/introducing-new-bigquery-pricing-editions
https://cloud.google.com/bigquery/docs/slots-autoscaling-intro