本文作者:adminddos

苏州少儿武术(报名咨询)1891-5555-567::苏州少儿搏击散打(报名咨询)1891-5555-567:-360数字安全集团CTO潘剑锋:跳出通用模型框架,要打造真正的安全垂直大模型

adminddos 2025-08-08 17:30:22 4 抢沙发
苏州少儿武术(报名咨询)1891-5555-567::苏州少儿搏击散打(报名咨询)1891-5555-567:-360数字安全集团CTO潘剑锋:跳出通用模型框架,要打造真正的安全垂直大模型摘要: ...

  新浪科技讯 8月8日下午消息,在ISC.AI 2025未来峰会上,360集团首席科学家、数字安全集团CTO潘剑锋指出:“安全行业对大模型的探索已从初期的快速集成模式,迈向更纵深的‘实战化’阶段。这要求我们要跳出通用模型的框架,深入底层技术创新,打造真正属于安全领域的垂直大模型”。

  会上,潘剑锋结合360安全大模型的实践成果,系统阐述了基于人脑“快慢思考”方法论重构大模型与智能体能力边界的创新路径——将安全场景中的各个子任务划分为“快思考任务”或“慢思考任务”,分别进行针对性处理后再实现综合应用,从而实现安全大模型能力边界的重构。

  具体而言,“快思考”对应人类95%的日常潜意识决策,依赖海量训练形成“直觉判断”,大模型擅长通过海量标签数据挖掘统计规律,在概率意义上掌握学习样本所反映出来的一些隐含知识,可以看出“大模型擅长快思考”;“慢思考”对应人类“深思熟虑”的多步推理,需结合事实性知识与外部工具,在安全领域体现为复杂威胁溯源、多维度关联分析等深度推理任务,现阶段主要通过安全智能体的方式来解决。

  此外,潘剑锋还指出,360聚焦各类安全任务,正以“在专业场景中实现小参数模型能力远超通用大尺寸模型”为目标,在实战效果与落地能效上持续突破,通过三级跳式发展实现安全大模型的效能跃升。

  第一阶段,聚焦单个安全任务,探索垂直模型结构与训练方法创新。针对安全任务在数据、任务属性及实战需求上的独特性,360为不同任务定制专用模型并开展专项训练。以终端行为多模态研判模型为例,从海量EDR日志中寻找攻击痕迹,如同在成千上万页文字记录中定位一个目标,难度极大。为此,360创新思路,将枯燥的EDR日志转化为“终端行为监控录像”,每条操作对应一帧画面,让AI以“看录像、看精华”的方式完成分析,最终实现了“又准、又快、又省钱”的实战效果。数据显示,该模型对EDR行为的研判与归因准确率达99.42%。

  随着产品化落地深入,多模型并行导致参数过大、GPU消耗过高、应用成本攀升,且单一任务需多种模型能力协同。为此,360启动第二阶段研发,推出“多专家协同(CoE)”大模型架构。该架构以大基座为基础,可像搭积木般插入不同专家分区,多数参数固定,任务执行时无需激活所有参数,有效解决多模型协同难题,实现集约化应用。

  第三阶段聚焦训练框架创新。为解决多机多卡环境下训练成本高昂的痛点,360主导(联合伯克利BAIR实验室)推出业界首个开源的RL-LoRA训练框架,并升级为支持“持续进化”的LoRA训练框架。潘剑锋表示,该框架一方面使显存和带宽开销呈数量级降低,实现极致“省”;另一方面,节省的显存支持更大的Batch Size,使训练效率翻倍、周期大幅缩短,实现极致“快”。(文猛)

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,4人围观)参与讨论

还没有评论,来说两句吧...