NVIDIA 攜手 Google Cloud 為企業帶來代理型 AI 推理功能

Google 的 Gemini 模型即將可於地端部署，透過搭載 NVIDIA Blackwell 基礎架構之 NVIDIA 機密運算技術的 Google 分散式雲端平台運行

NVIDIA 與 Google Cloud 合作，運用 Blackwell HGX and DGX 平台及 NVIDIA 機密運算（NVIDIA Confidential Computing）技術保護資料安全，並將代理型 AI（agentic AI）帶給尋求在地端使用 Google Gemini 系列人工智慧（AI）模型的企業。

透過搭載 NVIDIA Blackwell 平台的 Google 分散式雲端（Google Distributed Cloud，GDC），企業的地端資料中心可以鎖定存取病患紀錄、金融交易和政府機密資訊等機敏資訊的權限，以符合法規要求和資料主權法令。NVIDIA 機密運算技術還能保護 Gemini 模型中的敏感程式碼，避免未經授權的存取與資料外洩。

Google Cloud 基礎設施與解決方案部門副總裁暨總經理 Sachin Gupta 表示：「藉由將我們的 Gemini 模型與 NVIDIA Blackwell 的突破性效能及機密運算能力相結合，我們讓企業能夠充分發揮代理型 AI 的潛力。這項合作有助於確保客戶能夠在不影響效能或操作便利性的情況下，安全地進行創新。」

NVIDIA Blackwell 的機密運算技術能為企業提供技術保障，包括 Gemini 模型應用程式介面的使用者提示及用於微調的資料，都能保持安全，無法被檢視或修改。

與此同時，模型所有者可以防止未經授權的存取或竄改，提供雙重保護，讓企業能夠在維護資料隱私的同時，利用 Gemini 模型進行創新。

AI 代理驅動全新企業應用

隨著代理型 AI 重塑企業技術格局，帶來更強大解決問題的能力，這項全新解決方案應運而生。

有別於根據學習到的知識來感知或生成內容的 AI 模型，代理型 AI 系統可以在動態環境中進行推理、適應與決策。例如在企業 IT 支援方面，以知識為基礎的 AI 模型可以檢索與提供故障排除指南，而代理型 AI 系統則能夠自主診斷問題、執行修復，以及將複雜的問題呈報到更高層級進行處理。

同樣地，在金融領域，傳統的 AI 模型可以根據既有模式標示潛在的詐欺交易活動，代理型 AI 系統則能更進一步調查異常情況，並主動採取行動，例如在交易發生前即進行封鎖，或是即時調整詐欺偵測規則。

在地端進行部署的兩難困境

雖然許多企業已經可以使用多模態推理的模型，整合文字、影像、程式碼和其他資料類型來解決複雜的問題，並建立雲端代理型 AI 應用，不過那些對安全或資料主權有著嚴格要求的企業卻還無法實現。

隨著這項消息的發表，Google Cloud 將成為首批提供機密運算功能的雲端服務供應商之一，以保護無論是在雲端或混合環境中的代理型 AI 工作負載。

這項解決方案由搭載 Blackwell GPU 與 NVIDIA 機密運算技術的 NVIDIA HGX B200 平台驅動，讓客戶能夠保護 AI 模型與資料安全。這樣可讓使用者在不影響資料安全性或模型完整性的情況下，達到突破性的效能與能源效率。

代理型 AI 的 AI 可觀察性及安全性

在生產環境中擴展代理型 AI 需要強大的可觀察性與安全性，以確保有穩定的效能表現及符合法令要求。

Google Cloud 今日宣布推出全新的 GKE Inference Gateway，藉由先進的路由和擴充性來最佳化部署 AI 推論工作負載的部署。透過與 NVIDIA Triton 推論伺服器及 NVIDIA NeMo Guardrails整合，GKE Inference Gateway 可提供智慧型負載平衡，以提升效能與降低服務成本，同時實現模型安全與治理活動的集中化控管。

展望未來，Google Cloud 正致力於整合專為跨 AI 工廠服務與擴充推理 AI 模型而打造的開源函式庫 NVIDIA Dynamo，以提高代理型 AI 工作負載的可觀察性。

歡迎聆聽 NVIDIA 在 Google Cloud Next 大會的演講、參加會議、觀看演示，並與 NVIDIA 專家交流。