新浪科技讯 1月21日晚间消息,今日举行的金山云年度Tech Talk上,金山云高级副总裁刘涛表示,智算平台金山云星流已完成从资源管理平台向一站式AI训推全流程平台的战略升级。从训推平台、机器人平台到模型API服务,升级后的金山云星流平台构建了从异构资源调度、训练任务故障自愈到机器人行业应用支撑、模型API服务商业化落地的全链路闭环。

金山云星流平台全面升级,高级副总裁刘涛:四大模块能力实现“开箱即用”的AI开发体验  第1张

  据悉,在平台效率方面,金山云星流训推平台提供从模型开发、训练到推理的完整生命周期管理,具备开发、训练、推理和数据处理四大模块能力,通过降低多模块协同复杂度,能实现“开箱即用”的AI开发体验。自研的GPU故障自愈技术结合任务可观测性设计,可实时监控硬件健康状态与任务进程,自动触发故障迁移与任务重调度,降低算力中断风险,保障长周期训练任务稳定运行。

  作为面向机器人开发与落地的全链路云原生平台,金山云星流机器人平台深度融合数据采集、存储、标注、模型开发、训练、部署与仿真等核心环节,打造具身场景专属的数据、模型、仿真一体化引擎。面向大模型应用开发者和企业用户,金山云星流平台模型API服务提供高可用、易集成的模型调用与管理能力,覆盖模型调用的全生命周期。该服务支持高并发推理与多模型管理,能够帮助用户高效接入多种模型资源,助力大模型应用落地。目前,金山云星流平台模型API服务已积累诸多行业客户。

  此外,金山云星流平台的模型生态也在持续丰富。目前,平台已支持近40种不同模型,包括DeepSeek、Xiaomi MiMo、Qwen3、Kimi等。客户通过一站式访问,即可高效接入多种模型,在畅享稳定高效云服务的同时,更加聚焦AI业务创新和价值创造。