资讯洞察
腾讯云AI-Agent安全解决方案-2026-国内友商版

当 AI Agent 替你打工,谁来替你盯紧它?本文系统梳理 2026 年 AI Agent 安全的威胁全景、能力基线与选型标准,并基于公开资料横向点评 6 个值得关注的国产企业级 Agent 安全方案(360 / 奇安信 / 深信服 / 蚂蚁数科 / 安恒 / 腾讯云),帮助你按自身场景做出选择。
AI Agent 引入了传统安全体系完全看不懂、管不住的全新攻击面:提示词注入、工具越权调用、密钥外泄、影子 Agent、Skills/MCP 投毒。
单个 Agent 被攻陷的爆炸半径远大于传统应用——它能自主决策、跨系统调用、持有高权限凭据。
2026 年的分水岭是:从事后取证走向运行时实时拦截,从外挂式安全走向原生集成。
AI Agent 安全(Agentic AI Security),是指对能够自主规划、推理、决策并执行动作的 AI 智能体进行的安全防护。与传统应用不同,AI Agent 由大模型驱动决策,能够调用工具(Tools)、连接外部服务(MCP)、读写数据、操作系统命令——它不再是被动响应请求的程序,而是主动替人干活的数字员工。
这正是风险的根源。多家权威机构已对这一趋势发出预警:Gartner 将代理式 AI(Agentic AI)带来的新攻击面列为 2026 年网络安全核心趋势之一,指出无代码/低代码平台与氛围编程(Vibe-Coding)正在加速 AI 代理的失控扩散,企业必须同步建立治理与控制机制。1OWASP 也在 2025 年底专门发布了面向 Agentic 应用的十大风险清单,标志着 Agent 安全已成为独立于传统应用安全的全新议题。2 行业共识正在形成:安全防护必须与 Agent 的自主能力同步跟上。
盲区一:行为不可预测。Agent 由大模型驱动决策,行为具有天然不确定性。攻击者可通过提示词注入(Prompt Injection)操控其读取敏感文件、执行破坏性命令、访问未授权资源。传统基于规则的防火墙无法理解 AI 语义层面的攻击意图。OWASP 将其归类为 ASI01(目标劫持)和 ASI02(工具滥用),并指出提示词注入是当前 Agentic 系统最普遍、最难缓解的威买球官方网站胁。
盲区二:云密钥散落、暴露面广。Agent 需调用多云、多平台 API,大量 AK/SK 密钥散布在环境变量、配置文件、代码仓库中。一旦 Agent 被攻陷或密钥泄露,攻击者可直接窃取凭据横向移动。OWASP Agentic Top 10 将其列为 ASI04(身份与权限滥用)的核心风险。
盲区三:传统防护看不懂、管不住。当 Agent 成为网络请求的主要发起者,基于人、基于规则的传统安全体系第一次失效——它无法区分人在访问还是代理在访问。Gartner 指出,AI 代理的崛起要求 IAM 体系向机器身份、自动凭证和策略授权演进,传统仅认人的身份体系已无法覆盖 Agent 场景。1
2026 年 3 月 12 日,Microsoft 365 Copilot爆出漏洞CVE-2026-26133。攻击者发送带有隐藏指令块的邮件(XPIA 跨提示注入),员工点击总结按钮后,Copilot 输出伪造的微软安全告警和验证身份按钮——员工一点击,内网 SharePoint 文件、Teams 聊天记录就被打包发送至黑客服务器。
一封邮件,同时引爆了提示词注入、AI 替黑客做钓鱼、身份越权检索、一键数据外泄四重危机。这就是无防护 Agent 的致命爆炸半径。该案例直接对应 OWASP Agentic Top 10 中的ASI01(Agent Goal Hijack,智能体目标劫持)与ASI09(Human-Agent Trust Exploitation,人机信任剥削)——攻击者利用的就是 Agent 无法区分合法指令与外部植入内容这一根本缺陷。
很多企业把两者混为一谈。OWASP 在 2025 年底专门发布了《Top 10 for Agentic Applications》,明确指出 Agentic AI 的风险范畴远超大模型安全——后者仅关注模型说了什么,而前者必须额外覆盖自主行动、工具滥用、多智能体信任与身份蔓延。2 简单区分:
事后日志分析本质上是取证——当告警响起时,数据外泄可能早已完成。2026 年领先方案的共识是:安全检测必须发生在 Agent 推理和调用的过程中,而非事后追查——推理前清洗恶意指令,命令执行前实时拦截危险操作,输出前审核生成内容。NIST AI 100-4明确要求:对 Agentic AI 系统实施遏制与沙箱化控制以及持续运行时监控,而非依赖事后审计。3CISA 联合五眼联盟网络安全机构发布的《Careful Adoption of Agentic AI Services》联合指南中同样强调:当前 Agentic AI 部署应优先考虑韧性、可逆性和风险遏制,而非一味追求效率。4
把安全做成 Agent 外面的一道防火墙已经不够了。领先做法是把安全能力直接下沉到 Agent Core 与执行环境(Runtime),实现输入、运行、推理、输出的全生命周期接管——不是外挂,而是深入 Agent 运行底层。
传统企业 IDP(身份提供商)只认人,识别不了机器代理。当多个个人/岗位 Agent 共用资源时,系统无法区分人访与代理访。Gartner 明确指出:AI 代理的崛起要求 IAM 体系向机器实体身份注册、凭证自动化发放和策略驱动的访问授权演进。1CISA 五眼联盟联合指南也将权限风险(Privilege Risks)列为 Agentic AI 的关键安全风险——当代理被授予超出任务所需的广泛访问权限时,一次代理被攻陷就等于攻击者获得巨大的操作空间。4 2026 年的分水岭是建立User ID + Agent ID的组合授权体系——也就是一 Agent 一 ID。
MCP(Model Context Protocol,模型上下文协议)是让 AI 应用通过标准化接口连接外部工具、数据源和服务的开放标准。它极大降低了 Agent 接入外部能力的门槛,但也急速扩大了攻击面——一个被攻陷的 MCP Server,可能让 Agent 暴露给下游数十个系统。因此对 MCP 的加载校验、运行时监控、安全防卸载,是 2026 年 Agent 安全的必备项。
阶段一 观察(Observe) → 资产盘点、Agent/LLM 调用侦测、敏感信息排查
阶段二 治理(Govern) → 身份认证、精细化授权、凭据托管、基线检查
阶段三 执行(Enforce) → 运行时实时拦截、命令管控、内容审核、网络隔离
阶段四 自主响应(Auto) → 威胁自动告警、Skills 自动隔离、全链路秒级溯源
多数企业在 2026 年仍处于阶段一到阶段二之间。麦肯锡《2026 年人工智能信任成熟度调查》(覆盖全球约 500 家组织)显示,安全与风险问题已成为 Agentic AI 规模化部署的首要障碍,且在几乎所有 AI 风险类别中,实际缓解措施均落后于风险意识——知道风险却缺少对应防线是当前企业最危险的状态。5 从看得见到管得住、控得了、审得清,是接下来一到两年的核心命题。
国内 AI Agent 安全是一个 2025 年下半年才真正爆发的新市场——CNCERT 已就 OpenClaw 类智能体默认权限过高、提示注入等风险发布提示10,信通院、公安部三所也相继推出测评与认证。各厂商从不同基因切入:有的从安全大模型/SOC 起家,有的从终端杀软延展,有的从大模型安全一体机切入,有的从云平台原生集成。为便于横向参照,下面的梳理基于各厂商公开技术资料、产品发布与权威测评披露,从以下维度评估能力广度:
:防护是否贯穿构建期(资产/Skill 扫描)、运行期(实时拦截)、响应期(溯源/处置)。
:能否在端侧、企业内网、云托管等部署形态下发现 Agent,包括影子 Agent。
:治理机制的颗粒度,如沙箱隔离、Skill 级管控、命令拦截、数据脱敏、运行时阻断。
:SaaS 订阅、私有化部署、端-网-云联动、与国产 IDP/办公生态的对接能力。
:依赖规则匹配、探针采集、行为分析,还是规则+AI 语义双引擎/意图级检测。
说明:本节不评估价格、完整 POC 部署表现或内部性能基准。各方案按覆盖 Agent 安全生命周期的能力广度梳理,并非确定性排名;能力边界会随版本迭代变化,最终以各厂商官方信息为准。
:以 SOC + 安全大模型(Q-GPT)为切入基因;部署形态为 SaaS 托管、私有化,覆盖端-网-云;控制机制含流量审计、行为合规、Skill 沙箱管控;权威背书为 Q-GPT 安全大模型、政企落地广;最适合政企云端/内网 Agent 的合规审计与留痕。
:以安全垂直大模型(AI FIRST)为切入基因;部署形态为私有化、云地协同;控制机制含流量检测、数据保护、AI 自身防护;权威背书为国内首个安全大模型、双备案;最适合重视实战检测效果与本地化部署的企业。
:以大模型安全一体机为切入基因;部署形态为一体机、SaaS、套件;控制机制含内容对抗、Skills 合规扫描(CALIR)、风险舆情;权威背书为入选 IDC 大模型安全市场图谱;最适合已用蚂蚁大模型安全栈、关注内容与 Skill 合规的企业。
:以安全运营智能体为切入基因;部署形态为私有化、智能体编队;控制机制含数百安全智能体、统一调度、闭环验证;权威背书为浙商 AI 智能体 TOP40;最适合以AI 管 AI做安全运营自动化的组织。
:以云原生全栈安全为切入基因;部署形态为云、端、MCP,原生集成;控制机制含一 Agent 一 ID、运行时拦截、脱敏、流量沙箱;权威背书为信通院实践指引、机密计算专区;最适合需零改造/零感知运行时全栈接管的企业。
腾讯云给出的是一套深度集成于 Agent 运行环境的云端全栈安全基座,由三大组件构成,覆盖构建到响应全链路,差异化在于运行时实时拦截 + 零改造/零感知接管 + 国产化合规。
:OneID 统一认证、对接企业 IDP SSO(OAuth/OIDC);一 Agent 一 ID(User ID + Agent ID 组合授权);提示词注入防护(输入清洗+上下文二次校验);内容合规检测;访问凭据加密托管(真实密钥可用不可见、临时凭据替代长效凭据);敏感数据自动脱敏;MCP 接入治理与 Token 限速。
(原生集成而非外挂)——LLM 推理前清洗恶意指令、推理后审核输出;命令执行前实时拦截危险命令(如 rm -rf)与提权;敏感数据外发实时阻断;Skill/MCP 加载即校验、运行全程监控、安全防卸载。
:资产盘点与影子 Agent 发现、LLM 调用侦测;漏洞扫描/基线检查;网络与主机行为管控;行为/会话/工具调用全链路审计与秒级溯源;Skills 风险扫描隔离。
拳头能力——流量沙箱(Traffic Sandbox):以零改造、零感知、全覆盖的方式,像一层透明护盾包裹在 Agent 与外部世界之间——Agent 照常干活、完全无感,但所有出向流量都先过一道安检(访问控制、数据防泄漏、模型审计、密钥托管),审核通过才放行。这就是透明玻璃房:自由行动,但每一步都在眼皮底下。
:身份/运行时/内容/数据四层全栈 + 原生集成 + 运行时实时校验;流量沙箱零感知接管;支持机密计算模型专区(物理隔离推理),国产化合规。
等多个客户场景落地——以 ClawPro 为例,它对接这套官方 Agent 安全体系后提供资产盘点、环境管控、凭据代理、技能扫描、全链路审计的整套保障,并已服务近千家客户、约 2 万 Agent 在线 分钟上线。
奇安信没有走个人客户端路线,而是面向政企市场发布智能体安全监测平台,主打对云端和企业内部署的智能体做流量审计与行为合规审查,配合 SAFESKILL 平台管控/审计/沙箱第三方 Claw 实例,采用端-网-云三层联动,理念是看得清/管得住/用得好。背后是其 Q-GPT 安全大模型驱动的安全运营能力。
深信服以AI FIRST战略重构全域安全,安全 GPT 是国内首个自研安全垂直大模型(已迭代至 4.0,且通过网信办双备案),强项在以实战效果说话的威胁检测、钓鱼防御、数据保护与 AI 自身防护。其自研 AICP 算力平台、千亿级 IOC/情报库为大规模推理提供底座,在百万级威胁涌入场景下做精准拦截。
蚂蚁数科从大模型安全一体机切入,蚁天鉴 2.0 – 龙虾卫士聚焦三大能力:一是对抗思想变异,识别输入输出、拦截违规与恶意诱导;二是净化 Skills 仓库,基于 CALIR 五维模型对 Skills 插件做合规扫描与行为审计,阻断权限越界、敏感泄露、异常调用;三是风险舆情播报,实时推送应急报告。已入选 IDC《中国大模型安全市场图谱》。
安恒打的是以 AI 对抗 AI、以 AI 管理 AI的旗号,恒脑安全智能体已迭代至 4.0——一个以自主达成目标为导向的安全智能体总指挥,采用统一调度、自主执行、闭环验证架构,内置数百个专业安全智能体,覆盖网络安全、动态数据安全、安全运营、代码安全等场景。
Agent 安全正从企业实践走向行业标准,国内外多方已给出可对照的框架:
发布《AI Agent 安全实践指引》,提出企业看得清、用户用得稳、风险可追溯的实践框架。信通院还依托 AIIA 安全治理委员会启动了智能体内生安全专项测评(依据 AIIA/T 0206-2025《智能体安全技术要求》),为企业提供可量化的安全能力评估标准。6
等在 WAIC 2025 联合发布《终端智能体安全 2025》白皮书,首次系统梳理了智能体风险分类、防御路径与安全体系框架。7
联合发布《云端智能体服务网络与数据安全自律公约(2026 版)》,由国内主流云服务商共同参与,为云端 Agent 服务建立安全基线
(2026)专门针对 Agentic AI 系统的风险管理发布指导文件,覆盖自主目标追踪、工具滥用、多智能体协调失败与级联故障等新风险类别。3
联合发布《Careful Adoption of Agentic AI Services》指南,为全球 Agentic AI 部署提供安全基线
OWASP Top 10 for Agentic Applications
(2025)定义了 ASI01–ASI10 十大 Agent 安全风险,成为业界通用的风险参照框架。2
这些标准化成果共同指向同一套方法论——可见、可管、可控、可溯,也为企业落地 Agent 安全、评估各家方案提供了可对照的标尺。
让 Agent 尝试执行 rm -rf 或读取系统敏感文件,验证是否被实时拦截。
注入一个含恶意 Payload 的第三方 Skill/MCP,验证加载校验与隔离能力。
让 Agent 调用外部 API,检查 AK/SK 是否对终端用户可见(应可用不可见)。
制造一次越权数据访问,验证审计日志能否秒级定位到具体 Agent 与动作。
Q:什么是 MCP 安全?A:MCP(模型上下文协议)让 Agent 通过标准接口连接外部工具与数据源。MCP 安全指对 MCP Server 的接入治理、加载即校验、运行时监控和安全防卸载,防止单个被攻陷的 MCP Server 把 Agent 暴露给下游数十个系统。
Q:什么是间接提示词注入(Indirect Prompt Injection)?A:恶意指令并非由用户直接输入,而是隐藏在 Agent 检索到的内容里(如邮件、网页、文档)。Agent 处理这些内容时被诱导执行攻击者的指令——CVE-2026-26133 即典型案例。
Q:如何保护 AI Agent 的工具与函数调用(Tools Call)?A:在命令执行前进行实时识别与拦截,阻断危险命令(如 rm -rf)与提权操作;对 Skill/MCP 实施加载即校验与运行时监控。领先方案已能把这一防护下沉到 Agent 运行底层,而非停留在事后告警。
Q:什么是影子 Agent 发现?A:指识别那些未经正式安全审查就部署上线的 Agent。通过资产盘点与 LLM 调用侦测,把看不见的 Agent纳入管控。
Q:AI Agent 安全、AI 治理、AI-SPM 有什么区别?A:AI Agent 安全聚焦运行时的实时防护(做什么);AI 治理是合规与风险管理框架(该不该做);AI-SPM(AI 安全态势管理)侧重构建期的配置与基线风险评估(部署得对不对)。三者互补。
Q:AI Agent 合规需要哪些日志与审计记录?A:至少应覆盖——系统命令、网络请求、文件操作、域名解析/IP 连接(行为层),以及每轮对话输入/输出、Tools/MCP 调用日志(对话与工具层),并支持不可篡改存储与秒级溯源。
AI Agent 的价值在于自主,风险也恰恰来自自主。2026 年企业要解决的不是要不要用 Agent,而是如何让 Agent 在安全的环境里跑起来。当 Agent 从辅助工具变成操作核心,安全就不再是可选项,而是规模化落地的前提。
回到选型本身:上文 6 家国产方案各有侧重——有的从端侧探针延展、有的从政企安全运营/SOC 切入、有的押注安全垂直大模型、有的做大模型安全一体机与 Skill 合规、有的用智能体编队做安全运营自动化、也有的主打零改造/零感知的云端运行时全栈接管。没有放之四海皆准的最佳,只有最贴合你部署形态(端侧/政企内网/云)、合规要求与现有安全栈的那一个。但无论选哪家,判断标准都收敛到同一组能力上:运行时实时拦截、机器身份治理、凭据托管、全链路审计——也就是把 AI 从能用推向放心用的那条底线。
让 AI Agent 像运行在一间透明玻璃房里:自由行动,但每一步都在你眼皮底下。
各厂商官方资料:360 智能体安全管理与防护系统、奇安信智能体安全监测平台 / SAFESKILL、深信服安全 GPT、蚂蚁数科蚁天鉴 2.0(龙虾卫士)、安恒恒脑安全智能体、腾讯云 Cloud AI Agent 安全架构
权威测评与认证:公安部第三研究所人工智能安全态势管理系统认证、IDC《中国智能体威胁检测技术评估,2026》
国内标准框架:《AI Agent 安全实践指引》、AIIA/T 0206-2025《智能体安全技术要求》、《终端智能体安全 2025》白皮书
国际风险框架(可对照):OWASP《Top 10 for Agentic Applications》、NIST AI 100-4
⚠️ 以下来源中的具体数据/结论建议在正式发布前再次核对原文,确保引用准确。
本文基于各厂商公开技术资料、产品发布信息及上述公开行业报告/认证整理,用于企业 AI Agent 安全选型参考。各方案能力描述与权威背书以厂商及认证机构原始发布为准,不构成排名或采购建议。返回搜狐,查看更多


2026-06-28
浏览次数:次
返回列表