引言:AI技术革命的"双子星"与系统化突破
2025年伊始,中国AI领域迎来标志性突破——DeepSeek-R1开源大模型以1/30于OpenAI o1的API成本实现同等推理性能的壮举震动全球,其"小力出奇迹"的技术哲学颠覆了传统AI研发范式。紧随其后,Manus智能体凭借多智能体协同与任务闭环执行能力,在非公开测试阶段即引发"中国版AutoGPT"的热议。这场由认知模型(DeepSeek)与智能体执行终端(Manus)共同掀起的风暴,正推动生成式AI从单点能力突破向系统化架构跃迁。
行业数据显示,搭载DeepSeek-R1的智能系统已在金融、医疗领域实现8倍效率提升,而Manus展示的简历筛选、股票分析等复杂任务处理能力,更验证了"思考-决策-执行” 全链路智能化的五层式生成式人工智能应用系统架构日趋主流。这种"算法创新+工程突破"的双轮驱动,标志着中国在生成式人工智能系统架构领域实现从追随到并跑的质变。
本文接下来的内容组织如下:
一、概念解析: 科普大语言模型(LLM)与智能体(AI Agent)的核心定义与技术边界;
二、架构拆解: 围绕五层式生成式人工智能运用系统架构展开,包括:模型基座层,提示模板层,链式处理层,智能体层,多智能体协作层;
三、技术赋能路径: 解析七大技术要素(运用定义系统、AI Fabric异构算力调度、大模型基座、先进液冷、可持续扩展架构、安全防护、智能体电算协同);
四、生态实践:携手合作伙伴开展的3个方向上的创新工作介绍。
一、大模型LLM是认知引擎(大脑), AI Agent是具身智能体”
人工智能技术正经历从判别式AI 1.0(以分类、检测为核心)向生成式AI 2.0(以创造、推理为特征)的范式跃迁。以DeepSeek-R1,OpenAIo1/o3等为代表的推理大模型,突破了早期模型的三大核心瓶颈:逻辑不可靠(如数学符号混淆)、幻觉频发(如虚构法律条文)和多模态协同不足(如跨文本-图像推理断裂)。
在回答问题之前先生成一个详细的内部思维链,模拟人类大脑的深思熟虑,逐步分解复杂的问题,在提高答案的准确性和深度上,取得了惊人的进展,其表现出来的智慧程度,再次触发业界对“大模型技术能力边界“的热议。
以Manus等为代表的AI Agent,是一种半自主系统(终极阶段是全自主),能够与环境交互并代表用户执行任务,具有自主性,可以在无需持续人工干预的情况下工作。
AI Agent通过分析数据来进行决策,并根据反馈不断学习和改进,以适应不断变化的环境和用户需求。这些智能系统广泛应用于各个领域,如智能客服、自动驾驶汽车和智能家居助手等,为用户提供高效便捷的服务,帮助人们更好地应对复杂多变的任务和挑战,提高工作和生活的效率。
二、五层式生成式人工智能运用系统架构的技术跃迁:构建虚实融合的智能体协同
五层式生成式人工智能应用系统架构以大语言模型操作系统为核心基座,通过分层设计贯通底层算力资源支撑、模型训练与推理优化、智能体任务编排,实现多智能体协作,形成从硬件资源到群体智能的全栈技术闭环。
其分层架构及功能如下:
1、模型基座层(Models):作为系统基础能力底座,通过多模态大模型API调用(如文本/图像/代码生成)与多机态支持(云端/边缘端部署)构建操作系统级服务能力,在成本控制与算力调度层面实现动态优化,支撑上层应用开发。
2、提示模板层(Prompt):通过结构化模板设计实现动态适配与场景复用,其核心机制包括变量占位符注入、角色指令分层(系统指令定义任务规则,用户输入填充动态参数),以及多模态格式控制,显著提升生成内容与业务需求的匹配度,提升意图识别准确率。
该层通过工程化模板复用降低开发复杂度,可借由预定义任务指令与上下文规则,结合多轮对话消息链实现复杂逻辑编排,也可使用LangChain的PromptTemplate类实现跨领域任务快速迁移,提升模型输出准确率。
3、链式处理层(Chains):基于思维链(CoT)技术构建任务流水线引擎,将复杂需求拆解为有序子任务序列,包含顺序链(Sequential Chain)确保线性执行、路由链(Router Chain)实现条件分支,以及转换链(Transform Chain)插入自定义处理逻辑,其核心价值在于标准化流程复用与灵活组合能力。
4、智能体层(Agent):能够通过传感器感知环境,并通过执行器自主采取行动以实现特定目标的实体,其核心特性包括自主性(无需外部干预)、反应性(快速响应环境变化)、主动性(基于目标主动规划)及社会性(与其他智能体协作)。
通过集成大语言模型(LLM)作为认知中枢,结合工具调用(如API接口、机械臂控制)和长期记忆模块,实现从文本交互到物理世界改造的技术跃迁。
5、多智能体协作层(Multi-Agent):通过分布式自治架构实现复杂任务的高效协同,其核心机制包括动态任务分解、角色分工(如生成者、评审者、协调者等)以及智能体间的实时通信与协商,通过共享记忆网络和共识模型实现全局状态同步。
例如OpenManus框架通过PlanningTool将用户需求拆解为线性子任务序列,并动态分配至专业化智能体(如代码生成Agent、部署验证Agent),结合工具链实现端到端闭环;多智能体协作可通过信息共享与交叉验证,突破单一模型的认知边界,解决复杂长链任务。
三、协同生态驱动的全栈生成式AI架构创新:安擎基于七大技术要素构建五层式系统,赋能虚拟认知至物理改造的智能范式演进
安擎协同生态合作伙伴围绕生成式人工智能应用系统架构的七大技术要素:运用定义系统架构、GenAI光电路交换(OCS)互联架构、强韧大模型基座层、智能调试与根因定位技术、先进液冷方案、可持续碳优化计算体系、系统安全及智能体电算协同管理,构建覆盖虚拟认知至物理改造的全栈技术体系,通过多层级技术融合实现五层式架构(模型基座层→提示模板层→链式处理层→智能体层→多智能体协作层)的深度优化。
2025年重点开展的创新项目及工作介绍如下:
基于分布式OCS开放互连技术,首创“Switchless” Scale Up和Scale Out 双向融合系统架构:
该系统架构专为生成式人工智能(GenAI)应用设计,提供开放互联及灵活配置的优化运行环境,实现跨物理服务器的高速卡间与机间互联,充分满足多样化GenAI对大规模多维并行处理和实时数据交换的高要求。
分布式OCS技术凭借异构资源池化与智能管理策略,显著提升资源利用效率,确保业务应用性能卓越与资源优化,为构建先进的绿色智能计算开放生态奠定坚实基础。同时,该技术内置的可靠容错与冗余机制,有效保障系统的高可用性和业务连续性,大幅降低系统故障风险。
通过首创的“Switchless”双向融合系统架构,我们在AI服务器及系统架构领域开辟了一条全新路径,有力推动了多样化GenAI业务的创新应用与产品竞争力的提升。
基于超流体技术的先进冷板油冷方案,100%解决水冷板漏液业界痛点:
高性能GPU和CPU因功耗巨大且散热需求高,给Gen AI服务器系统的冷却带来了极大挑战。目前,间接接触液体冷却系统(如冷板辅助方案)普遍采用水或丙二醇与水的混合物作为冷却介质。然而,在电子设备中,水冷系统存在泄漏隐患,一旦管理不当,可能会对敏感元件造成重大损害。即便是微小的泄漏,也可能引发短路和腐蚀,进而导致系统停机或产生高昂的维修成本。尽管通过加强防漏连接、及时检测泄漏和实施定期维护等常规工程措施可以降低这些风险,但泄漏问题依然难以完全根除。这已成为数据中心在大规模部署高端人工智能服务器时,水冷解决方案所面临的关键行业痛点之一。
本项目发布了一种创新的冷板液冷解决方案,该方案融合了基于绿色介电冷却液的创新超流体技术,以及优化设计的冷板与中心分配单元(CDU)。
这一创新设计成功解决了水冷系统长期存在的泄漏隐患这一行业难题,能够在高密度AI服务器系统中对单芯片TDP(热设计功耗)超过1500W的高性能处理器实现高效且可靠的冷却。
Ultra Pooling GenAI Rack Scale系统架构方案 “绿色超池智算基座”:
该实现方案以最小化的池化POD单元为基础构建模块,包括专为推理设计的"通用AI加速卡"POD、企业级推理GPU POD,以及为大规模数据训练定制的GPU POD。
系统根据工作负载需求,动态组合POD 节点,以实现资源的高效配置。Ultra Host Processor Node(UHP)作为系统的智能管理中心,集中监控和管理机架内的服务器、存储和网络设备,负责供电、散热、 远程控制、故障诊断、报警和系统安全管理。UHP也是 GenAI 应用的优化核心,提供模型感知、基于DeepSeek时代的Scaling Law策略的工作负载调度、机架级碳优化计算,以及支持 Climatik 和 Gen AI Operator等运作。Ultra Pooling Switch (UPS)利用开放互联OCS 技术,执行AI Fabric功能组装,实现异构 GPU 资源的有效池化。与 Ultra Host Processor Node (UHP)相结合,UPS 能够根据不同应用场景的需求,灵活重构系统资源池。UPS支持运行包括 UALINK、Ethernet、OISA 在内的Scale up 互联,确保 GPU POD之间的高效互联。
绿色超池智算基座具备高度的适应性,能够覆盖从数据中心到边缘计算的多种部署场景。它不仅能够扩展成多机架的 Super POD,满足超大规模数据中心的需求;也能在单机 架内集成 CDU、UPS、储能单元和电力算力协同单元,适用于企业 边缘和边缘数据中心等边缘计算环境。这种灵活性使得系统能够根据不同环境的需求进行定制和扩展。
后续,安擎资深技术专家将陆续推出一系列技术专栏内容,深入剖析前沿技术与行业应用。若您对前沿技术洞察、实用技术干货感兴趣,欢迎持续关注我们,一同解锁更多专业知识。