提起AI圈的“后起之秀”,MiniMax绝对是绕不开的名字。很多人可能用过它的Glow、海螺AI,也听过它和抖音旗下豆包的各种传闻,但对它到底是谁、背后团队有多牛、产品能干嘛,还有和豆包到底啥关系,一直云里雾里。今天就用最接地气的大白话,把这些问题拆解开讲透,保证不管你是AI小白还是普通用户,都能一看就懂。
一、先搞懂MiniMax:AI圈的“实干派独角兽”,2021年才成立却冲得飞快
首先得明确一点,MiniMax不是什么小作坊,而是正儿八经的AI巨头种子选手。用一句话总结:2021年底在上海成立的AI创业公司,专门搞“能听、能看、能说、能做”的多模态大模型,短短几年就做到了行业顶尖,还成功上市了。
1. 团队底子:400人精英战队,不搞花架子只拼技术
MiniMax的团队规模不算特别大,大概400人左右,但“含金量”超高。和很多AI公司喜欢挖行业老人不同,它的人才主要靠校招自己培养,简单说就是“从一张白纸开始,培养最贴合自己技术路线的人”。
这里有个很有意思的点:团队没有KPI考核。咱们普通人上班都要面对业绩压力,但MiniMax不一样,他们靠“单一目标拆解”驱动——比如今年要把视频生成模型做到全球前三,所有人就围绕这个目标分工干活,不用天天盯着KPI报表。这种模式虽然少见,但效果很明显:团队凝聚力强,技术迭代速度特别快,从成立到发布全球顶尖的大模型,只用了不到4年时间。
而且公司的定位很清晰:聚焦“多模态AGI”。可能有人听不懂“多模态AGI”,其实翻译过来就是“全能型人工智能”——不只是能处理文字,还能搞定语音、图片、视频,甚至能和物理世界互动,比如以后可能赋能机器人,让机器人能看懂环境、听懂指令、做出动作。这和很多只做文字聊天的AI公司,完全不在一个赛道上。
2. 融资与上市:资本追着投,2026年初成功登陆港交所
能在短短几年内快速崛起,离不开资本的支持。MiniMax在上市前一共完成了7轮融资,总金额高达15.5亿美元,换算成人民币差不多110亿。要知道,AI行业烧钱特别厉害,能拿到这么多融资,说明资本对它的技术和前景极度认可。
更厉害的是,2026年1月9日,MiniMax成功在港交所上市了。这意味着它成为了AI大模型赛道里的“上市公司一员”,有了更稳定的资金来源,后续研发和产品推广也能更有底气。对于一家成立才4年多的创业公司来说,这个成长速度堪称“火箭级”。
简单说,MiniMax现在的状态就是:有顶尖技术团队、有充足资金、有明确的发展方向,而且已经靠上市站稳了脚跟,是AI圈名副其实的“独角兽”。
二、创始人闫俊杰:清华博士出身,商汤“老功臣”,带着技术理想创业
一家公司能走多远,创始人的格局和技术实力往往是关键。MiniMax的创始人闫俊杰,就是典型的“技术大牛+创业实干家”,履历亮眼到让人佩服。
1. 学霸履历:从清华到中科院,一路深耕AI
闫俊杰是1989年生人,河南人,年纪不大但学术背景超硬核:清华大学自动化本科+中科院自动化所博士+清华大学计算机博士后。这一串头衔下来,就能看出他是“根正苗红”的AI领域科班出身,不是半路出家的“野路子”。
在学术上,他的成就也很突出:发表过100-200篇AI领域的顶会论文,Google Scholar(谷歌学术)上的引用量超过3万次。可能有人对这个数据没概念,简单说,顶会论文是AI行业的“学术天花板”,能发表一篇就很不容易,而他发表了上百篇,还被同行广泛引用,说明他的研究成果在行业内有很高的认可度。2019年,他还登上了福布斯中国30U30精英榜,算是行业内对他青年才俊身份的盖章认证。
2. 职场经历:商汤6年从实习生做到副总裁,攒下核心经验
闫俊杰不是刚毕业就创业的“愣头青”,而是有过多年大厂实战经验。他在商汤科技待了6年,从一个实习生一步步做到副总裁、研究院副院长、智慧城市事业群CTO,堪称“逆袭典范”。
在商汤期间,他主导了深度学习工具链与算法体系的搭建——这相当于给商汤的AI技术搭好了“地基”,后续很多产品都是在这个基础上发展起来的。这段经历让他不仅懂技术,还懂团队管理、产品落地和商业化,为后来创立MiniMax积累了关键经验。
3. 创业初心:押注多模态,要做“普惠大众”的AI
2021年,闫俊杰从商汤离职,创立了MiniMax。他的创业初心很明确:坚信“AGI(通用人工智能)一定会实现,并且一定会服务大众、普惠大众”。简单说,他不想让AI只停留在实验室里,或者只服务于少数大企业,而是想让普通人都能用得上、用得起AI。
本小章还未完,请点击下一页继续阅读后面精彩内容!
他的技术路线也很坚定:坚持“单模型+全场景”,押注多模态融合是AGI的终局。啥意思呢?就是不搞一堆零散的模型(比如一个模型处理文字、一个处理图片),而是打造一个“全能模型”,能同时搞定文本、语音、视频等多种数据,而且能适配不同场景(比如C端用户聊天、B端企业办公、内容创作等)。
从现在的发展来看,他的判断是对的。MiniMax的多模态技术已经走在了行业前列,不管是语音模型还是视频生成模型,都有全球顶尖的表现,而这一切都离不开创始人最初的战略布局。
三、MiniMax的核心产品:从聊天到视频,覆盖C端和B端,个个都是“实力派”
MiniMax的产品矩阵很清晰,主要分三大类:底层的大模型技术底座、面向普通用户的C端应用、服务企业的To B解决方案。简单说,就是“自己搭好技术地基,然后做自己的产品,同时也把技术开放给别人用”,两条腿走路,既稳又快。
1. 底层技术底座:大模型是“核心引擎”,性能对标全球顶尖
如果把MiniMax的产品比作一辆汽车,那大模型技术底座就是“发动机”,所有产品的功能都靠它支撑。目前它的核心技术底座主要有三类:
(1)M系列大语言模型:开源全球第一,又快又便宜
这是MiniMax的“王牌技术”,目前已经迭代到M2版本。这款模型有多牛?用几个关键数据就能说明白:
- 全球权威测评Artificial Analysis(AA)中,总分位列全球前五、开源第一,是中国开源大模型首次进入全球前五,能和OpenAI、谷歌这些硅谷巨头同台竞技;
- 速度比谷歌的Claude Sonnet 4.5快近一倍,价格却只有它的8%;
- 综合成本不到OpenAI GPT-5(high)的六分之一,输入每百万Token只要2.1元人民币,输出只要8.4元。
可能有人听不懂“Token”“开源”这些术语,咱们用大白话翻译:
- “Token”就是AI处理文字的“基本单位”,简单理解为“字数”就行,百万Token大概相当于75万字,也就是说,让AI处理75万字的输入,只要2块1,成本低到离谱;
- “开源”就是把模型的核心技术公开,让全世界的开发者都能免费使用、二次开发。这一点特别重要,相当于MiniMax把自己的核心技术“分享出去”,既降低了行业的开发门槛,也能吸引更多人用它的技术,形成生态优势。
而且这款模型还得到了海外巨头的认可,比如Meta(脸书母公司)在论文中提到,MiniMax的研究是近期强化学习的突破代表,还采用了它提出的核心技术。在全球知名的AI模型调用平台OpenRouter上,M2上线不到两天,调用量就冲进了全球前十,足以说明它的受欢迎程度。
(2)音频大模型:全球领先,语音生成、克隆都拿手
除了文字,MiniMax的音频技术也是王牌。它的音频大模型在全球处于领先地位,能实现很多实用功能: