2026 年,企業導入 AI 的問題已經不是「要不要做」,而是「做下去之後,誰幫你扛」。當 AI 從「你問、它答」的對話框,進化成能自己拆任務、呼叫 API、跨系統執行動作的 AI Agent(代理式 AI),它要的就不再只是一個聰明的模型——而是算力、儲存、權限、成本與稽核的一整套基礎建設。這正是多數「選哪個平台」的討論不會告訴你的下半段。
IDC 在 2025 年 12 月公布的台灣 ICT 趨勢預測給了一個本地座標:到 2029 年,代理式 AI 將佔台灣整體 AI 支出的 17%——每投入 5 元 AI 預算,約有 1 元花在 AI Agent 上。這是正在發生的預算位移。但同一時間,Gartner 也潑了一盆冷水:逾 40% 的代理式 AI 專案,將在 2027 年底前被取消。本文以企業 IT 維運服務商的視角,談一件競品較少碰的事:如何讓 AI Agent 不只「跑得起來」,而是「落得了地、管得住、撐得久」。
一、AI Agent 不只是更強的 ChatGPT
要談治理,得先把名詞釐清。生成式 AI(如 ChatGPT、Claude)是由人逐步驅動的——你下 prompt、它回答,每一步都有人在方向盤上。AI Agent(Agentic AI、代理式 AI)則是被賦予一個目標後,自己拆解任務、選用工具、呼叫 API、跨系統執行多步驟動作,過程中不一定需要人逐步介入。
這個「自主行動」的差別,徹底改寫了風險地圖。過去影子 AI 的洩密風險是「員工把資料貼出去」;而 AI Agent 是「AI 拿著公司憑證,自己去存取系統、執行動作」。它是一個會主動操作你 IT 環境的角色,因此導入無法只靠軟體選型,而必須回到 IT 基礎建設與資安治理的本質。
規模有多大?IDC 的全球預測同樣驚人:到 2029 年,代理式 AI 將佔全球 IT 支出逾 26%、達 1.3 兆美元,2025 至 2029 年間 AI 支出年增 31.9%;到 2030 年,全球將有 45% 的組織大規模協調 AI 代理。趨勢明確——但趨勢明確,不代表每家企業都會成功。
二、為什麼 40% 的專案註定失敗?
Gartner 在 2025 年 6 月的預測是這篇文章的冷靜起點:逾 40% 的代理式 AI 專案將於 2027 年底前被取消,主因是成本攀升、商業價值不明、風險控管不足。分析師更直接點名「agent washing」現象——數千家號稱具備 agentic 能力的廠商中,僅約 130 家具真實能力。多數專案,仍停在炒作驅動的早期實驗與 PoC。
失敗不是抽象的預言,而是已經發生的帳單:
成本失控,是 AI Agent 落地最被低估的殺手。據《數位時代》2026 年 6 月報導,Microsoft 因員工用量成本過高,導入約 6 個月後停用了 Claude Code;Uber 更在 4 個月內燒光整年度的 AI 預算。Gartner 分析師警告:別因為 token 單價在降,就以為 AI 成本在降——token 用量的膨脹速度,遠快過單價下降的速度,整體推理成本仍在上升。Goldman Sachs 甚至預估,2030 年全球每月 token 消耗將暴增 24 倍。
這就是為什麼「先把治理與基礎設施想清楚」不是保守,而是務實。token 成本若無人盯著用量與配額,一個被無限迴圈卡住、或被惡意 prompt 灌爆的 Agent,就能在一個週末把雲端帳單變成災難。成本治理,本身就是 AI Agent 治理的一環。
McKinsey 的《2026 AI Trust 報告》也指向同一方向:在約 500 家受訪組織中,近三分之二把資安與風險列為規模化代理式 AI 的首要障礙,遠超法規不確定性與技術限制;而僅約 30% 的組織,治理與 agentic 控管的成熟度達第 3 級以上。多數企業想衝、卻還沒準備好。
三、落地框架:算力、儲存、權限、成本、稽核
與其追逐 hype,不如把 AI Agent 落地拆成可被治理的五個層次——別人談「要不要做、用哪個平台」,凱茂談「做下去之後,這五件事誰幫你扛」。
| 落地層次 | 核心問題 | 常見坑 | 凱茂能補的位置 |
|---|---|---|---|
| 算力(Compute) | 自建推論還是用外部 API?要多大算力? | 一開始就搶頂規 GPU、或低估推論用量 | GPU/AI 算力選型與建置、自建 vs API 的 TCO 評估 |
| 儲存(Storage) | Agent 產生的資料、向量庫放哪?怎麼備份? | 向量庫無備份、Agent 資料散落無治理 | 企業儲存/備份/DR、承接 Agent 資料與向量庫 |
| 權限(Identity) | Agent 能存取什麼?權限會不會過大? | 過度授權、機器身份失控 | 零信任 ZTNA/SASE、PAM、最小權限 |
| 成本(Cost) | token 用量誰在盯?配額在哪? | 用量暴衝、預算一季燒光 | token 用量治理、用量基線與告警 |
| 稽核(Audit) | Agent 做了什麼?查得到嗎?合規嗎? | 動作無紀錄、出事無法溯源 | SIEM/SOC 行為監控、稽核軌跡、ISO 輔導 |
下面三節,分別把基礎設施、資安權限與治理流程說清楚。
基礎設施:算力與儲存,別讓 Agent 餓著也別讓它撐爆
AI Agent 的運算需求集中在「推論(inference)」——它每執行一步、每呼叫一次模型,都在消耗算力。企業有兩條路:用外部 API(彈性、起步快、但用量大時成本與資料外流風險上升),或自建推論環境(資料留在內網、長期 TCO 可控、但需前期投資)。
自建不等於要搶頂規。 對中小企業而言,以 NVIDIA RTX Pro 6000 級的中型算力即可起步,不必一開始就追 H100/H200。凱茂提供與建置 NVIDIA GPU 伺服器(H100/H200/L40S 等),協助評估該用 API 還是自建、該買多大規模——選型邏輯在企業 AI GPU 算力與製造業 AI 基礎設施兩篇有更完整展開,也可參考GPU/AI 算力解決方案。
儲存則是最容易被忽略的一塊。AI Agent 會持續產生大量資料:對話歷程、向量資料庫(embedding)、工具呼叫日誌、中間產物。這些資料若散落無治理、向量庫沒有備份策略,一旦損毀就得重新建索引、重新嵌入,代價高昂。把 Agent 的資料層納入企業儲存、備份與 DR(災難復原)規劃,是讓 AI 落地「撐得久」的基本功——也是凱茂以 Nutanix、Acronis 等方案承接的強項。
資安權限:把 Agent 當「非人類身份」納入零信任
這是 AI Agent 落地最關鍵、也最被低估的一塊。AI Agent 會用 API key、service account、OAuth token 去存取系統——這些都是機器身份,也就是「非人類身份」(Non-Human Identity, NHI)。業界(多為廠商報告)估計,機器身份與人類身份的比例已達數十比一,且相當高比例的資安事件與未受管的機器身份有關;Gartner 也將「IAM 因應 AI Agent」列為 2026 年的重要資安趨勢之一。
問題的核心是過度授權。為了「讓 Agent 跑得動」,企業常給它遠超實際所需的權限——而一個權限過高、又缺乏行為監控的 Agent,等於一把同時插在許多核心系統上的萬能鑰匙。許多企業的資安體系停在「監控與紀錄」,卻沒到「防護與隔離」的層級,形成**「看得到、卻管不住」**的盲區。
務實的做法,是把 AI Agent 完整納入零信任資安架構:
- 最小權限與 PAM:給 Agent 剛好夠用、且可隨時收回的權限;高權限憑證納入特權存取管理(PAM)控管。
- 零信任存取(ZTNA/SASE):控制 Agent 能連到哪些內外部服務,預設不信任、依情境動態授權。
- 行為基線與監控(EDR/XDR、SIEM/SOC):替每個 Agent 建立「正常行為基線」,一旦偏離(大量存取、異常外連、權限提升)即告警。
- 不只被動驗證身份,而是主動偵測、即時響應、事後可溯源,形成威脅感知—決策響應—溯源審計三位一體。
凱茂以四大原廠夥伴(Trend Micro、Nutanix、Acronis、WatchGuard)的方案搭配零信任架構,把 AI Agent 從「一個看不見的高權限帳號」,拉回看得見、管得住的軌道。
治理流程:human-in-the-loop,把人留在迴圈裡
技術控制之外,AI Agent 落地的靈魂是治理流程。核心原則是 human-in-the-loop——替 Agent 設計「驗證迴圈」與「可觀測性」,確保它的自主行動始終在人的監督之下。
一條不能退讓的紅線:AI Agent 不得在無人工核可的情況下,執行轉帳、刪除資料、變更存取控制、對外發送等高風險動作。把高風險動作設成「需人工放行」的關卡,是用最小的成本,擋下最大的災難。
2026 年的趨勢,更從 human-in-the-loop(人逐步介入每一步)走向 human-on-the-loop(人保留策略監督與治理)——讓 Agent 在明確界定的權限邊界內自主執行,但人始終握有監督權與煞車。這需要兩件事支撐:清楚的權限邊界(前一節的零信任與 PAM),以及完整的可觀測性與稽核軌跡。
對需要更高層級治理框架的企業,凱茂也提供 ISO 27001/42001 導入輔導服務(協助客戶導入,非凱茂自身持有認證),把 AI 治理對齊國際標準與 BCP/DR 的整體韌性規劃。延伸閱讀可參考我們對 Claude 企業版 AI 與 DeepSeek 企業部署 的評估,理解不同模型在企業落地時的治理與部署差異。
四、AI Agent 導入檢核清單
不確定公司準備到哪了?用這份清單快速自評。能打勾的越多,落地的勝算越大、踩坑的機率越小:
- 目標明確:先有清楚的商業價值與成功指標,而非「別人在做我們也要做」
- 場景收斂:從一兩個資料已整理好的單一場景起步,而非一次全公司鋪開
- 算力選型:已評估自建推論 vs 外部 API 的 TCO,且未盲目搶頂規 GPU
- 儲存就緒:Agent 資料與向量庫已納入企業儲存、備份與 DR 規劃
- 最小權限:Agent 只被賦予剛好夠用的權限,且權限可隨時收回
- 身份治理:Agent 以非人類身份(NHI)納入零信任,高權限憑證納入 PAM
- 行為監控:已用 EDR/XDR、SIEM 建立 Agent 行為基線並設定異常告警
- 成本治理:token 用量有人盯、有配額與告警,避免用量暴衝燒光預算
- human-in-the-loop:高風險動作(轉帳/刪除/改權限/對外發送)須人工核可
- 稽核軌跡:Agent 的每一步動作都被記錄、可溯源、可審查
- 治理對齊:政策已對齊 ISO 27001/42001 原則,並納入 BCP/DR 韌性規劃
- 維運 SLA:上線後有人持續維運監控、調校與處理異常,而非上線即放生
多數企業會發現自己只打勾了前一兩項——這很正常。AI Agent 落地是一條成熟度曲線,重點不是一次做到滿分,而是今天就把基礎打對:先想清楚算力、權限與治理,再讓場景一個個長出來。
結語:別人追 hype,你把地基打穩
回到開頭那組數字:IDC 說 2029 年代理式 AI 將佔台灣 AI 支出 17%,Gartner 說 40% 的專案會在 2027 年前夭折。這兩個看似矛盾的預測,其實指向同一結論——AI Agent 的浪潮真實且巨大,但能不能搭上,取決於你有沒有把地基打穩。
成本失控、權限失守、缺乏治理,是讓那 40% 沉沒的三塊礁石。避開它們的方法,不是更花俏的模型或更貴的平台,而是回到 IT 維運的本質:適配的算力、可靠的儲存與備份、納入零信任的身份治理、盯得住的成本,以及把人留在迴圈裡的 human-in-the-loop 流程。
凱茂資訊以「架構先行、可被治理」的方式,協助企業承接 AI Agent 落地的下半段——從 GPU/AI 算力選型與建置、企業儲存/備份/DR,到零信任資安(ZTNA/SASE/EDR/XDR/SIEM/SOC/PAM)把 Agent 納入身份治理、token 用量治理防成本失控,再到 human-in-the-loop 治理流程設計、ISO 27001/42001 導入輔導(協助客戶導入,非凱茂自身持有認證)與年度維運 SLA。我們深耕台中、服務全台,讓那 40% 的失敗風險,變成「找對維運夥伴避坑」的機會。
如果你正在評估 AI Agent 落地,卻不確定算力要多大、權限怎麼控、成本誰來盯——歡迎與我們聊聊。立即透過聯絡我們預約 30 分鐘免費諮詢,或來電 (04) 2375-8388,由專業顧問針對貴公司現況給出具體建議,不推銷、不強迫。