每日AI快讯 | MiniMax 开源 M3 模型权重及 MSA 技术论文

发布时间: 2026-06-15 文章分类: AI快讯
阅读量: 0
AI智能体
企业级AI智能体开发与部署
LumeValley提供全栈式企业级AI智能体开发与部署服务,涵盖战略规划、场景化开发、企业级应用构建、行业解决方案及算力支撑。从需求分析到持续优化,确保智能体高效稳定运行,助力企业实现智能化转型,提升运营效率与竞争力。

428B 总参数、激活仅 23B——MiniMax 把 M3 的权重扔到开源池里那天,很多人第一反应是去跑分。两周后,结果摆出来了:Artificial Analysis 综合智能指数第一,GDPval-AA 排行榜开源组第一,Code Arena WebDev 杀进帕累托最优序列,Vals.AI 国产模型第一。没铺天盖地的 PR,没"震撼发布"的排比句,就是一份份榜单截图把同行按在地上摩擦。M3 的杀手锏是 MSA(MiniMax Sparse Attention),本质上是对注意力机制做了一次结构性的瘦身。传统 Transformer 在长上下文场景里算力开销随序列长度平方级膨胀,MSA 通过稀疏化策略让计算量显著压下来,意味着同样一张卡,能跑的上下文窗口直接翻好几倍,成本曲线被砸出一道明显的拐点。配合 23B 的激活参数,推理侧的实际开销远比 428B 这个数字看起来友好得多。

真正让技术圈侧目的是 M3 的训练范式——它是第一个从预训练阶段就把文本、图像等多模态数据做交错混合训练的开源模型。在此之前,绝大多数开源多模态模型走的是"先纯文本预训练,再外挂视觉编码器"的拼接路线,多模态融合发生在对齐阶段而非底层。MiniMax 的做法更激进,让模型在预训练阶段就见过图文混排的世界,理论上对跨模态理解的结构性帮助远大于后置对齐。性能跑分只是副产品,训练方法论的革新才是这个模型值得长期盯的原因。

工程侧的动作同样密集:输出速度从约 30 TPS 拉到约 80 TPS,官方还预告接下来再提速 30%–40%,目标是和闭源旗舰掰手腕的实时交互体验;Token Plan 后台同步上线调用量看板,开发者终于不用靠抓包猜自己烧了多少 Token。从模型架构、训练范式到商业化基建,MiniMax 这套组合拳的节奏感很清晰——开源不是慈善,是抢生态位。国产开源基座的牌桌上,又多了一个不能忽视的玩家。

AI智能体
企业级AI智能体开发与部署方案
LumeValley打造企业级AI智能体全流程方案,涵盖需求洞察、定制开发、多平台适配部署。凭借专业算法与丰富经验,确保智能体精准理解业务,高效执行任务,无缝融入企业生态,为企业数字化转型提供强劲智能引擎,提升核心竞争力。
点赞 | 22

Lumevalley——全栈AI服务领航者,以“战略-应用-算力”三位一体服务框架,为企业提供从顶层战略规划、场景化AI智能体(AI Agent)开发/搭建/部署,到企业级AI应用开发、AI+行业场景解决方案的全链路服务,并配套AI大模型部署与高性能AI算力底座支撑,助力客户在营销、服务、运营等核心环节实现效率倍增与模式创新。

马上扫码获取产品资料
下一篇: 没有了
相关文章

相关文章

填写以下信息, 免费获取方案报价
姓名
手机号码
企业名称
  • 建筑建材
  • 化工
  • 钢铁
  • 机械设备
  • 原材料
  • 工业
  • 环保
  • 生鲜
  • 医疗
  • 快消品
  • 农林牧渔
  • 汽车汽配
  • 橡胶
  • 工程
  • 加工
  • 仪器仪表
  • 纺织
  • 服装
  • 电子元器件
  • 物流
  • 化塑
  • 食品
  • 房地产
  • 交通运输
  • 能源
  • 印刷
  • 教育
  • 跨境电商
  • 旅游
  • 皮革
  • 3C数码
  • 金属制品
  • 批发
  • 研究和发展
  • 其他行业
需求描述
填写以下信息马上为您安排系统演示
姓名
手机号码
你的职位
企业名称

恭喜您的需求提交成功

尊敬的用户,您好!

您的需求我们已经收到,我们会为您安排专属电商商务顾问在24小时内(工作日时间)内与您取得联系,请您在此期间保持电话畅通,并且注意接听来自广州区域的来电。
感谢您的支持!

您好,我是您的专属产品顾问
扫码添加我的微信,免费体验系统
(工作日09:00 - 18:00)
电话咨询 (工作日09:00 - 18:00)
客服热线: 4008 868 127
售前热线: 189 2432 2993
扫码即可快速拨打热线