流水线开跑,大模型量产!走进浪潮探访国内首个人工智能模型工厂

2025-09-17 14:59:13 来源: 大众新闻·大众日报 作者:

  1913年,亨利·福特改良传送带技术应用于汽车制造,将单车生产时间从数日缩减至数小时,让汽车走向大众。

  如今,流淌百年的流水线智慧正催化另一场革命。

  日前,国内首个人工智能模型工厂——浪潮人工智能模型工厂在济南完成实体化建设并正式运行投产。通过“九大单元”、75道工序、180套工具的加工训练,数据被加工成模型,且质量稳定,成本下降,交期缩短。

  去年5月,全球权威赛事QASC挑战赛更新国际排名,浪潮海若大模型以93.70%的准确率排在榜首并刷新世界纪录。目前,浪潮位居中国政务大模型市场第一,其人工智能业务正加速走向海外。

  今年8月,国务院发布《关于深入实施“人工智能+”行动的意见》,提出加快实施“人工智能+”科学技术、产业发展、消费提质、民生福祉、治理能力、全球合作等6大重点行动,标志着人工智能技术赋能千行百业步入全面加速阶段,迎来前所未有的发展爆发期。

  就像流水线的普及应用拉开了现代工业化大生产的序幕,浪潮人工智能模型工厂背后,是人工智能大潮的汇聚成势。

  流水线上“流”出人工智能产品?

  大数据、优质芯片支撑,用模型生产模型

  外观,像一只巨大的方盒,坐落在工业园区云集的济南经十东路;内部,数据车间、模型车间、集成车间等依序分布。看上去,人工智能模型工厂与传统的制造业工厂没什么两样。

  实际上,它们也遵循着同样的生产逻辑——将复杂生产过程拆分为若干简单工序,由特定“工人”完成,从而提升生产效率。

  以一件市民服务热线大模型订单生产为例。

  相关数据首先汇入数据车间。

  数据车间外的显示屏上,展示着订单数据多维度的统计指标。点击原始数据的分类占比,资讯类为60%,建议类仅为0.2%。

  真实世界生成的数据往往并不均衡。市民服务热线收集到的信息绝大多数是咨询、求助,投诉、建议很少。数据不均衡会严重降低大模型的准确度。

  数据车间需要做的,除了抽检、清洗、脱敏等常规处理,重要的一环就是增广——补齐“瘸腿”的数据。

  举个例子。系统会自动从建议类中选取一条“拓宽养老金发放渠道”,在其基础上延伸到拓宽住房公积金、失业保险金、伤残补助金等发放渠道,数据就可以实现“一变多”。

  再看数据占比:经过增广,这件订单的6类数据占比全部被调整至14%-15%,成为生成模型的合格原料。

  处理后的数据进入模型车间。模型车间是整个工厂的核心区域,主要任务是训练模型,即通过各类工具模型的使用将数据训练为满足用户需求的模型产品。

  与一般数据中心配置的2.5千瓦处理器标柜不同,这里配备的是50千瓦的“大块头”——无论是数据处理还是模型训练,都需要大量的算力支撑。模型工厂布局了2000多台服务器,超1000P的智算算力。

  最快数小时的训练完成后,模型初现雏形。但这还不是最终产品。

  顺着产线继续看,评测中心的大屏幕上,一行行数据飞速滚动。这里,浪潮海若测评模型正在对订单模型从安全、效果、性能、功能等进行全方位的测试。一旦出现错误,测评模型将会有针对性地为受测模型生成新“考卷”进行复测,直至错误逐一消除。

  到这里你会发现这条流水线高效率的秘密之一——生产模型的不再是工人或工程师,而变成了模型制造机。

  全国“首个”为何花落浪潮?

  用“系统性优势”抓住“寒武纪”级市场爆发机遇

  高效率的另一个秘密,在于资源的集约。

  在浪潮人工智能模型工厂,上千台服务器24小时运转不停,为模型生产提供算力支持;调优工具、标引工具等几十种适应不同场景不同需求的软件工具一应俱全,并不断更新迭代;近百人的研发团队针对生产过程中出现的问题第一时间调整优化……模型生产的所有要素几乎集成于一厂,大幅提升了生产效率,交期从原来的3个月压缩到十几天,并且还在继续缩短。

  追求效率,有时会以丧失灵活为代价。但在浪潮,客户服务中心将用户需求拆解成具体任务,产品工程中心确定具体的实施方案,模块化管理为流水线赋予了足够的柔性,让每个订单都拥有独特的工序、工艺,确保个性化的需求得到满足。

  人工智能产品生产实现工厂化,目标不止于对速度和柔性的追求。

  《关于深入实施“人工智能+”行动的意见》明确,到2027年我国新一代智能终端、智能体等应用普及率超70%,到2030年超90%,到2035年全面步入智能经济和智能社会。

  普及率大幅提升,意味着未来10年,人工智能技术将与各行各业深度融合,创造数不清的新产品和新业态。这对企业、地区甚至国家而言,都将是实现跨越式发展的重要窗口。如果人工智能产品的生产还停留在作坊式阶段,没有优质、廉价、稳定的供应,势必错失这场“寒武纪”级的市场爆发,丧失竞争优势。

  面对窗口,同类企业都在跃跃欲试,为什么“首个”花落浪潮?

  细看这座工厂,就能见端倪:数据车间里高速运转的,是浪潮品牌的服务器;正在训练订单模型的,是浪潮研发的海若大模型;为其提供语料资源的,是浪潮自建的行业知识语料库……

  “硬件、软件、云计算服务,三轮驱动,三者兼备。”浪潮集团执行总裁、总工程师,浪潮云董事长肖雪,把浪潮人工智能模型工厂拔得头筹的主要原因归结于“系统性优势”。

  就像中央处理器、图形用户界面、操作系统、应用软件等一系列的技术变革催生个人电脑这一划时代产物,纵观历史,信息技术产业的革命性进步,从来不是靠单一部件的突飞猛进,而是硬件、软件、算法、网络、交互方式等多个领域的协同进化。

  纵向上,技术链条自主可控;横向上,技术能力与千行百业深度融合,从基础设施到行业应用,浪潮覆盖全产业链的布局使其在革命性跃迁的关键当口,总有能力率先跨越。

  从中国第一台微型计算机、第一台小型机服务器、第一台关键应用主机、第一片分布式云到第一座人工智能模型工厂,弄潮儿的本色其实就是“系统性”。

  如何把AI送到千行百业?

  工厂内外,未来已来

  在集成车间,模型被“灌注”进设备,变成可见、可感、可辅助人类工作生活的智能体。

  “正在进行的是抓握数据的采集。”集成车间,山东海若公司副总经理陈艳清手持遥操作设备夹取一只苹果,身旁的机器人精准还原他的手部动作。每一个细微动作,都被摄像头精准捕捉记录下来。

  为了保证智能体的实际运行效果,工程师大量采集数据对其持续训练。通常单一动作要采集上千条数据,而泛化动作要采集十几万、几十万条。

  训练有虚拟的:陈艳清身旁,电脑上播放着类似游戏画面的场景——遍布台阶的巨坑里,角色奋力向外攀爬。这是刚生成的机器狗在虚拟场景中受训。机器狗若被困住,说明存在问题,需要专门调整。

  也有现实的:园区内,搭载巡检任务的机器狗沿着道路轻快地穿行,工作人员跟在它身后验证其执行任务、应对突发情况等的能力。

  反复训练后,智能体方能真正走下“产线”,走向千行百业。

  工厂之外,未来已来。

  浪潮为位于济宁的山东经典印务有限责任公司提供印刷行业大模型,围绕设备运维、政策分析、管理规范等应用场景,建立知识库,助力企业全流程智能化升级,企业生产效率提升近20%,原辅材料损耗降低10%。

  在药物研发过程中,厘清靶点与病症之间的匹配关系是至关重要的一环。应用科研智能体,浪潮的生物医药智能体研发团队能够高效率提取靶点信息、病症、研发阶段等关键要素,为研发按下“加速键”。

  直接面向消费者的定制化人工智能产品也已下线。大模型生成、计算机视觉和声音克隆技术,能将特定人物进行数字化重现,让人类的情感需求通过数字化形式获得满足。

  产线转动不停,终点也是起点。

  浪潮计算服务产业园内,人工智能智能体工厂和人工智能训练场正在施工,即将投用——山东人工智能产品将进一步丰富和完善。

  开启未来世界新一扇门的“钥匙”,或许就将从这里下线。

  (大众新闻记者 李振 段婷婷)


初审编辑:

责任编辑:刘美显

相关新闻