360数字安全集团:2025大模型安全白皮书
VIP专免
让AI世界更安全更美好
安全·向善·可信·可控
据IDC预测,到2030年,人工智能将为全球带来22.3万亿美元经济收入,大模型正驱动百行
千业智能化变革,而开源大模型在性能提升、部署成本降低的推动下,加速向政务、金融、能
源等重点行业落地,安全风险也随之渗透到全生命周期:从模型层的提示注入、越狱攻击,
到数据层的敏感信息泄露,再到应用层的智能体越权,任何一处漏洞都可能威胁个人、企业
国家的财产安全,甚至是生命安全。清晰的网络安全边界正不断消融、趋于模糊,并延伸至
大模型的全链路安全,传统基于规则和特征匹配的防御体系已然失效。
我们正在从传统的“网络安全”时代,迈入以“大模型安全”为核心挑战的新阶段。当前威胁呈现
指数级演化态势:一方面,攻击面急剧扩大,针对算力基础设施的劫持、供应链中的恶意模
型文件、以及利用LangChain等框架漏洞的新型攻击,表明风险已深度嵌入技术底座。另一
方面,攻击主体高度“平民化”,自然语言取代专业代码成为攻击武器,提示注入、越狱攻击
让“全民黑客”从概念走向现实,极大降低了网络犯罪门槛。与此同时,模型固有的“幻觉”问
题、智能体在工具调用中的越权风险、以及数据泄露与知识污染,共同构成了一个多维、动
态、交织的复杂威胁矩阵。
在此背景下,360主张:必须采用以AI对抗AI、原生融合安全的新范式来应对大模型时代的
安全挑战。我们提出“外筑‘以模治模’动态屏障,内固‘平台原生’安全底座的核心理念,将安全
能力内嵌于大模型的构建、训练、部署与运营的全过程。通过构建一个纵深防御、动态演化
的全景框架,从基础设施安全、内容与价值对齐、幻觉缓解到智能体行为管控,实现从“网
络安全”到“大模型安全”的范式升维,为人工智能时代提供一个“安全、向善、可信、可控”
的底座。
面对这一全球性挑战,中国开创了“发展与安全并重”的敏捷治理之路,以《生成式人工智能
服务管理暂行办法》为代表的“包容审慎、分类分级”原则,为技术创新与风险防控提供了动
态平衡的框架。
01 02
本白皮书系统性地论证了大模型安全正经历从传统网络边界防御到原生、全栈、智能动态防御的范
式转移,并提出“外筑"以模治模"动态屏障,内固"平台原生"安全底座”的核心理念,覆盖“安全、
向善、可信、可控”四大支柱的全景安全框架,构建智能时代的核心免疫系统。
5. 生存之道:开放共生,生态共治
大模型安全的复杂性、全局性,决定了仅靠单一力量的技术或资源难以实现全链路、全场景的
大模型安全治理。必须通过标准共建、产学研协同——例如开源安全模型、共建联合平台,
以及组建产业联盟等形式,汇聚各方力量,共同打造智能时代可信、向善的安全基底。这既
是产业发展的必然要求,也是国家层面的战略需求。
4. 应对之道:以模治模+平台原生安全
360提出的“以模治模+平台原生安全”是应对新范式的技术必然。它通过专用安全大模型,例
如风险检测、幻觉纠正与红蓝对抗模型,对抗通用大模型风险,它既具备“外挂式”插件的灵
活快速,又兼具“原生式”的深度安全能力,实现了双向赋能的协同防御,构筑起从模型、数
据、内容到行为的全链路深度防护体系。
1. 风险之变:从边界防御到全栈免疫
大模型安全风险是系统性、全栈式的。它贯穿基础设施、模型层、数据层、智能体层及用户
端五大层次,具体表现为算力劫持、供应链投毒、内容越狱、模型幻觉、知识污染、隐私泄
露、行为失控以及工具滥用等诸多方面,共同构成了一个传统安全方案无法应对的复杂威胁
立体空间。
2. 攻击之变:从专业黑客到全民黑客
攻击技术持续向高端化演进,例如针对框架和基础设施的深度利用;与此同时,攻击主体则
日趋平民化,“自然语言黑客” 的出现极大降低了攻击门槛。这导致攻防不对称性加剧,必须
发展出同等智能、动态感知的防御体系。
3. 治理之智:中国特色的“发展与安全”平衡术
中国的治理模式采用“发展与安全并重”的动态平衡策略。通过“包容审慎、分类分级”的监管框
架,既划定安全底线,又为技术快速迭代预留了弹性空间,为产业创新提供了关键的政策窗
口期。
核心观点
引言:
外筑内固,构建大模型安全全链路防护体系
大模型
安全白皮书
安全·向善
可信·可控 让AI世界更安全更美好
三六零数字安全科技集团有限公司(或称“360”)提醒您在阅读或使用本文档之前,仔细阅读、
充分理解本法律声明的全部内容。您对本文档的任何阅读或使用行为,即视为您已认可并同意接
受本声明的全部约束。
5.遵守法律
您在使用本文档及其中所述技术时,应严格遵守《网络安全法》、《数据安全法》、《个人
信息保护法》及生成式人工智能相关法规等中华人民共和国法律法规,并承担因使用不当所
引发的一切法律责任。
6.反馈与联络
如您发现本文档存在任何错误、疑问或可能的侵权内容,请通过官方指定渠道与我们联系:
service-tech@360.cn
4.免责声明
本文档仅作为技术参考与指引提供,所有内容按“现状”、“包含可能缺陷”及“当前功能”状态呈
现。尽管360已力求文档内容的准确性与可靠性,但不对其准确性、完整性、适用性、及时
性作任何明示或默示的保证。任何单位或个人因依赖或使用本文档而直接或间接遭受的任何
损失(包括但不限于数据、收入、商誉损失),360及关联方均不承担法律责任。
本文档内容仅供参考,不构成法律、政策建议;不构成投资、商业决策依据;本文档引用的
数据和观点不代表360立场;360不对引用资料的准确性、完整性承担保证责任。
1.文档获取与使用
您应通过360官方指定网站或360授权的其他正式渠道下载、获取本文档。本文档仅可为自
身合法、合规的非商业性活动之目的而使用。
2.知识产权
未经360事先书面许可,任何单位或个人不得擅自对本文档的任何内容(包括但不限于文字、
图表、数据、架构设计)进行包括但不限于篡改、翻译、复制、发行、或以其他任何形式传
播。本文档所涉及的所有内容,包括但不限于商标、专利、著作权、商业秘密等知识产权,
均归360或其关联公司依法所有。
3.文档更新
鉴于技术、产品、法律与政策的持续演进,360保留在不事先通知的情况下,对本文档内容
进行更新、修订或替换的权利。
360保留本文档中未明确列明的所有权利。
法律声明
让AI世界更安全更美好
03 04
大模型
安全白皮书
安全·向善
可信·可控
本资料由有户自行上传,仅供个人参考学习使用(禁止商用)。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本内容侵犯了原著者的合法权益,可联系我们进行处理。
相关推荐
-
湖区自然景区旅游品牌传播创意方案【旅游】【文旅】VIP专免
2024-12-25 147 -
肛泰大橘猫电梯投放【梯媒,电梯广告,户外广告】VIP专免
2025-01-14 137 -
B2B市场人DeepSeekAI提示词手册VIP专免
2025-02-19 178 -
清华大学:2025年迈向未来的AI教学实验报告VIP专免
2025-03-29 158 -
智变2025:互联网AI应用元年VIP专免
2025-03-29 164 -
AI如何变革能源化工行业?VIP专免
2025-03-29 169 -
6秒钟情商:2025年EI&AI职场现状报告VIP专免
2025-04-10 131 -
浙江大学:2025年大模型:从单词接龙到行业落地报告VIP专免
2025-04-19 135 -
代理式AI的拐点之年:CEO的两年转型路线图VIP专免
2025-10-28 144 -
AI重塑中国互联网前沿洞察VIP专免
2026-03-05 119
作者:小七七
分类:研究报告
价格:免费
属性:30 页
大小:11.56MB
格式:PDF
时间:2025-11-12
相关内容
-
2026年春节AI应用、游戏和电影跟踪:AI应用加速迭代,内容消费格局凸显
分类:研究报告
时间:2026-02-26
标签:AI
格式:PDF
价格:免费
-
token跳动:2026AI业务落地白皮书春节特刊
分类:研究报告
时间:2026-02-26
标签:白皮书
格式:PDF
价格:免费
-
电子行业深度报告:2026年端侧AI产业深度,应用迭代驱动终端重构,见证端侧SoC芯片的价值重估与位阶提升
分类:研究报告
时间:2026-02-26
标签:AI
格式:PDF
价格:免费
-
新经济中工作的四个未来__2030年的AI与人才
分类:研究报告
时间:2026-02-26
标签:AI
格式:PDF
价格:免费
-
AI重塑中国互联网前沿洞察
分类:研究报告
时间:2026-03-05
标签:AI
格式:PDF
价格:免费


