保旺达AI安全护栏解决方案正式发布,让大模型应用从“可用”走向“可信、可控、可审计”
更新时间:2026-05-21 来源:原创 编辑:管理员 浏览:10

随着大模型、智能体等应用快速进入业务核心场景,企业对AI的关注正在从“能不能用”转向“能不能安全地用、合规地用、持续地用”。在大模型带来效率跃迁的同时,新的安全风险也随之出现,提示词注入、敏感数据外泄等问题正在成为企业AI规模化落地过程中绕不开的关键挑战。

为帮助企业建立覆盖大模型应用全链路的安全防护能力,保旺达正式发布AI安全护栏解决方案,面向大模型应用、智能体系统、知识库问答和多模态交互场景,提供从输入检测、输出管控、数据防泄露到合规审计的一体化安全能力,助力企业构建“可信、可控、可审计”的AI安全体系

image.png


// 七大核心功能 //

覆盖大模型应用主要风险场景


保旺达AI安全护栏,构建了覆盖输入、输出、行为的全链路安全防护体系。


提示词攻击防护

提示词攻击是当前大模型应用中最常见、最隐蔽的安全风险之一。AI安全护栏支持对多类提示词攻击进行检测,包括:越狱攻击检测;角色扮演攻击检测;提示词注入检测;间接提示词注入检测;规则绕过检测;恶意操作防护;资源消耗攻击防护

系统不仅基于关键词匹配,更通过大模型语义理解、上下文关联分析和意图识别,判断用户真实目的。针对多轮对话场景,AI安全护栏还可结合历史上下文进行综合判断,避免攻击者通过“分步诱导”逐渐绕过安全机制。


内容合规检测

AI安全护栏基于《GB/T 45654—2025 生成式人工智能服务安全基本要求》等相关规范,构建多维度内容安全检测能力,覆盖高风险、中风险、低风险等多类内容场景。

同时,方案覆盖TC260生成式人工智能服务安全相关规范中的多类风险内容,可对涉政、涉恐、涉暴、涉黄、违反伦理道德、侵犯个人权益等风险输出进行检测和处置,帮助企业在AI应用上线前、运行中和审计时建立统一的合规控制能力。


数据防泄漏

大模型应用接入企业业务系统和知识库后,数据安全成为核心问题。数据防泄露能力是AI安全护栏面向企业级落地场景的重要支撑,重点解决用户隐私、账号凭证、企业敏感数据在AI交互链路中的泄露问题。

核心能力包括:个人敏感信息识别、账号凭证与密钥识别、企业敏感数据识别、检测、拦截、脱敏一体化处理、结构化与非结构化内容兼容,避免个人隐私、企业核心数据和关键凭证通过AI输入输出链路泄露。


输入风险识别管控

产品对用户输入内容进行实时检测和分级处置,在进入模型前完成第一道安全过滤,避免风险内容污染模型输入环境。

核心能力包括:违法违规内容输入识别、敏感信息输入检测、分级响应机制、实时拦截提示、越权提问识别、超范围提问识别。通过在模型处理前完成风险消减,降低违规输入、恶意攻击和越权访问带来的安全隐患。


输出风险识别与管控

AI安全护栏具备对大模型输出结果的后置审核能力,对模型生成内容进行实时检查与干预,确保输出“合法、合规、安全、可控”。

平台支持:违法和不良信息过滤、不当内容与风险表达识别、敏感信息输出检测、超范围内容输出管控、灵活干预策略,弥补输入侧遗漏风险,从而确保模型最终对外输出内容安全可控,符合监管要求,避免舆情和数据泄露风险。


安全运营与合规审计

AI安全护栏提供完整的态势感知、风险报表和审计能力,帮助企业从“被动处置”走向“主动运营”。

平台支持:总检测数、风险检出数、拦截率等核心指标展示;高、中、低风险等级分布分析;近7天检测趋势追踪;提示词攻击、暴力犯罪、数据泄露等风险类别统计;风险趋势分析与预警;日志留存与审计;一键生成审计报告;敏感度阈值灵活配置

在敏感度策略上,系统支持High、Medium、Low多级阈值配置,企业可根据业务场景在“高覆盖率”和“高准确率”之间灵活平衡。


多模态内容安全检测

随着大模型应用形态不断丰富,攻击载体已经不再局限于文本。文档、图片、语音、代码、链接甚至元数据,都可能成为风险入口。

AI安全护栏支持多模态内容安全检测能力,包括:文档内容识别;图片意图识别;语音、音频、视频等内容扩展识别;代码及文件内容风险检测;针对文档、图片、链接等复杂载体的间接提示词注入检测,从而避免攻击者借助非文本载体绕过传统文本检测能力,实现更完整的AI安全防护。


// 开放架构 //

灵活适配企业现有AI技术栈


为了适配不同企业的大模型应用建设路径,AI安全护栏支持多种部署和接入方式。


API/SDK集成模式

由大模型应用直接调用护栏API或SDK,在模型调用前后分别进行输入检测和输出检测。目前支持Node.js、Python、Java、Go等主流开发语言,便于企业快速接入。

image.png

安全网关代理模式

通过安全网关承接大模型应用流量,统一进行安全检测、策略执行和结果返回。该模式适合多应用、多模型统一纳管场景,支持单机、集群和负载均衡部署。

image.png

智能体工作流编排模式

支持与Dify、Coze等主流智能体和工作流平台集成,对智能体输入、工具调用、知识库检索和输出内容进行全流程安全防护。


多模型与信创环境支持

方案支持主流大模型接入与模型路由管理,可适配不同大模型提供商。同时支持Nvidia GPU和华为昇腾NPU等算力基础设施,满足企业在通用算力和信创环境下的部署需求。


// 满足合规与安全要求 //

   掌握AI时代安全入口      

AI安全护栏面向大模型应用与智能体应用场景,不仅满足国家针对大模型服务的强制监管与合规要求,更可为企业提供实时、全面的AI安全防护能力,让企业能够放心、高效地拥抱AI技术带来的业务变革。

■ 合规

产品依据国家关于生成式人工智能、深度合成、网络安全等相关监管要求进行设计,可为客户提供覆盖输入检测、输出审核、风险识别、审计溯源在内的安全能力支撑,助力满足监管合规要求。

■ 安全

产品可针对提示词攻击、越权访问、敏感信息泄露、违规内容生成等风险进行全面识别与防护,为企业AI应用建立起覆盖全流程的安全防线。

■ 掌握AI时代安全入口

产品支持API调用与安全网关等多种接入方式,可灵活融入客户现有AI应用架构,帮助客户真正掌握AI时代的人机交互入口、安全策略入口和风险治理入口。


// 深耕行业场景 //

   精准贴合客户业务与痛点      

保旺达长期深耕运营商、能源等重点行业,对行业监管要求、业务运行模式和客户实际应用场景具备较深理解,能够更准确识别客户在AI落地过程中面临的安全与合规挑战。

不同于通用型产品能力输出,AI安全护栏不仅关注大模型的基础安全问题,更重视客户在智能客服、AI办公、知识库问答、智能体应用等具体业务场景中的真实风险与治理需求。基于对行业特点、业务流程和风险痛点的深入把握,保旺达可为客户提供模型精调、策略优化、接口适配、功能扩展等定制化服务,帮助客户构建更加贴合实际业务、更加可落地、更加可持续演进的AI安全防护体系。


大模型正在成为数字化转型的新引擎,也正在重塑企业应用、业务流程和人机交互方式。AI安全护栏的发布,旨在帮助企业解决大模型应用落地过程中的四个关键问题——敢不敢上线、能不能合规、是否可运营、能否规模化。保旺达AI安全护栏,让每一次智能交互都更可靠。


图片


如您希望对AI安全护栏产品有进一步的交流了解,或者试用产品,请扫描下方二维码,填写表单。



创造更安全的数字未来 身份与访问安全 · 数据安全 · 安全管理与运营 · 安全服务