大白话聊透人工智能精校章节_MiniMax：团队、产品、创始人，还有和豆包的真实关系

提起AI圈的“后起之秀”，MiniMax绝对是绕不开的名字。很多人可能用过它的Glow、海螺AI，也听过它和抖音旗下豆包的各种传闻，但对它到底是谁、背后团队有多牛、产品能干嘛，还有和豆包到底啥关系，一直云里雾里。今天就用最接地气的大白话，把这些问题拆解开讲透，保证不管你是AI小白还是普通用户，都能一看就懂。

一、先搞懂MiniMax：AI圈的“实干派独角兽”，2021年才成立却冲得飞快

首先得明确一点，MiniMax不是什么小作坊，而是正儿八经的AI巨头种子选手。用一句话总结：2021年底在上海成立的AI创业公司，专门搞“能听、能看、能说、能做”的多模态大模型，短短几年就做到了行业顶尖，还成功上市了。

1. 团队底子：400人精英战队，不搞花架子只拼技术

MiniMax的团队规模不算特别大，大概400人左右，但“含金量”超高。和很多AI公司喜欢挖行业老人不同，它的人才主要靠校招自己培养，简单说就是“从一张白纸开始，培养最贴合自己技术路线的人”。

这里有个很有意思的点：团队没有KPI考核。咱们普通人上班都要面对业绩压力，但MiniMax不一样，他们靠“单一目标拆解”驱动——比如今年要把视频生成模型做到全球前三，所有人就围绕这个目标分工干活，不用天天盯着KPI报表。这种模式虽然少见，但效果很明显：团队凝聚力强，技术迭代速度特别快，从成立到发布全球顶尖的大模型，只用了不到4年时间。

而且公司的定位很清晰：聚焦“多模态AGI”。可能有人听不懂“多模态AGI”，其实翻译过来就是“全能型人工智能”——不只是能处理文字，还能搞定语音、图片、视频，甚至能和物理世界互动，比如以后可能赋能机器人，让机器人能看懂环境、听懂指令、做出动作。这和很多只做文字聊天的AI公司，完全不在一个赛道上。

2. 融资与上市：资本追着投，2026年初成功登陆港交所

能在短短几年内快速崛起，离不开资本的支持。MiniMax在上市前一共完成了7轮融资，总金额高达15.5亿美元，换算成人民币差不多110亿。要知道，AI行业烧钱特别厉害，能拿到这么多融资，说明资本对它的技术和前景极度认可。

更厉害的是，2026年1月9日，MiniMax成功在港交所上市了。这意味着它成为了AI大模型赛道里的“上市公司一员”，有了更稳定的资金来源，后续研发和产品推广也能更有底气。对于一家成立才4年多的创业公司来说，这个成长速度堪称“火箭级”。

简单说，MiniMax现在的状态就是：有顶尖技术团队、有充足资金、有明确的发展方向，而且已经靠上市站稳了脚跟，是AI圈名副其实的“独角兽”。

二、创始人闫俊杰：清华博士出身，商汤“老功臣”，带着技术理想创业

一家公司能走多远，创始人的格局和技术实力往往是关键。MiniMax的创始人闫俊杰，就是典型的“技术大牛+创业实干家”，履历亮眼到让人佩服。

1. 学霸履历：从清华到中科院，一路深耕AI

闫俊杰是1989年生人，河南人，年纪不大但学术背景超硬核：清华大学自动化本科+中科院自动化所博士+清华大学计算机博士后。这一串头衔下来，就能看出他是“根正苗红”的AI领域科班出身，不是半路出家的“野路子”。

在学术上，他的成就也很突出：发表过100-200篇AI领域的顶会论文，Google Scholar（谷歌学术）上的引用量超过3万次。可能有人对这个数据没概念，简单说，顶会论文是AI行业的“学术天花板”，能发表一篇就很不容易，而他发表了上百篇，还被同行广泛引用，说明他的研究成果在行业内有很高的认可度。2019年，他还登上了福布斯中国30U30精英榜，算是行业内对他青年才俊身份的盖章认证。

2. 职场经历：商汤6年从实习生做到副总裁，攒下核心经验

闫俊杰不是刚毕业就创业的“愣头青”，而是有过多年大厂实战经验。他在商汤科技待了6年，从一个实习生一步步做到副总裁、研究院副院长、智慧城市事业群CTO，堪称“逆袭典范”。

在商汤期间，他主导了深度学习工具链与算法体系的搭建——这相当于给商汤的AI技术搭好了“地基”，后续很多产品都是在这个基础上发展起来的。这段经历让他不仅懂技术，还懂团队管理、产品落地和商业化，为后来创立MiniMax积累了关键经验。

3. 创业初心：押注多模态，要做“普惠大众”的AI

2021年，闫俊杰从商汤离职，创立了MiniMax。他的创业初心很明确：坚信“AGI（通用人工智能）一定会实现，并且一定会服务大众、普惠大众”。简单说，他不想让AI只停留在实验室里，或者只服务于少数大企业，而是想让普通人都能用得上、用得起AI。

本小章还未完，请点击下一页继续阅读后面精彩内容！

他的技术路线也很坚定：坚持“单模型+全场景”，押注多模态融合是AGI的终局。啥意思呢？就是不搞一堆零散的模型（比如一个模型处理文字、一个处理图片），而是打造一个“全能模型”，能同时搞定文本、语音、视频等多种数据，而且能适配不同场景（比如C端用户聊天、B端企业办公、内容创作等）。

从现在的发展来看，他的判断是对的。MiniMax的多模态技术已经走在了行业前列，不管是语音模型还是视频生成模型，都有全球顶尖的表现，而这一切都离不开创始人最初的战略布局。

三、MiniMax的核心产品：从聊天到视频，覆盖C端和B端，个个都是“实力派”

MiniMax的产品矩阵很清晰，主要分三大类：底层的大模型技术底座、面向普通用户的C端应用、服务企业的To B解决方案。简单说，就是“自己搭好技术地基，然后做自己的产品，同时也把技术开放给别人用”，两条腿走路，既稳又快。

1. 底层技术底座：大模型是“核心引擎”，性能对标全球顶尖

如果把MiniMax的产品比作一辆汽车，那大模型技术底座就是“发动机”，所有产品的功能都靠它支撑。目前它的核心技术底座主要有三类：

（1）M系列大语言模型：开源全球第一，又快又便宜

这是MiniMax的“王牌技术”，目前已经迭代到M2版本。这款模型有多牛？用几个关键数据就能说明白：

- 全球权威测评Artificial Analysis（AA）中，总分位列全球前五、开源第一，是中国开源大模型首次进入全球前五，能和OpenAI、谷歌这些硅谷巨头同台竞技；

- 速度比谷歌的Claude Sonnet 4.5快近一倍，价格却只有它的8%；

- 综合成本不到OpenAI GPT-5（high）的六分之一，输入每百万Token只要2.1元人民币，输出只要8.4元。

可能有人听不懂“Token”“开源”这些术语，咱们用大白话翻译：

- “Token”就是AI处理文字的“基本单位”，简单理解为“字数”就行，百万Token大概相当于75万字，也就是说，让AI处理75万字的输入，只要2块1，成本低到离谱；

- “开源”就是把模型的核心技术公开，让全世界的开发者都能免费使用、二次开发。这一点特别重要，相当于MiniMax把自己的核心技术“分享出去”，既降低了行业的开发门槛，也能吸引更多人用它的技术，形成生态优势。

而且这款模型还得到了海外巨头的认可，比如Meta（脸书母公司）在论文中提到，MiniMax的研究是近期强化学习的突破代表，还采用了它提出的核心技术。在全球知名的AI模型调用平台OpenRouter上，M2上线不到两天，调用量就冲进了全球前十，足以说明它的受欢迎程度。

（2）音频大模型：全球领先，语音生成、克隆都拿手

除了文字，MiniMax的音频技术也是王牌。它的音频大模型在全球处于领先地位，能实现很多实用功能：