全球主机交流论坛

标题: 又出来一个大模型 minimax ... 最近速度好快啊 [打印本页]

作者: 欢迎新会员    时间: 2025-3-12 22:29
标题: 又出来一个大模型 minimax ... 最近速度好快啊
本帖最后由 欢迎新会员 于 2025-3-12 22:30 编辑

MiniMax-01开源:新架构开启Agent时代

https://minimaxi.com/news/minimax-01-%E7%B3%BB%E5%88%97

在 MiniMax-01系列模型中,我们做了大胆创新:首次大规模实现线性注意力机制,传统 Transformer架构不再是唯一的选择。这个模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

基于业界主流的文本和多模态理解测评结果如下图所示,我们在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120以及Claude-3.5-Sonnet-1022。在长文任务上,我们对比了之前长文最好的模型 Google的Gemini。如图(c)所示,随着输入长度变长,MiniMax-Text-01 是性能衰减最慢的模型,显著优于Google Gemini。


作者: 欢迎新会员    时间: 2025-3-12 22:33
嗯,还开源了,虽然我看不懂

https://github.com/MiniMax-AI
作者: hkbbdx    时间: 2025-3-12 22:40
试了一下,发现还可以
作者: laox    时间: 2025-3-12 22:42
哪家公司的?
作者: 欢迎新会员    时间: 2025-3-12 22:50
laox 发表于 2025-3-12 22:42
哪家公司的?

稀宇极智科技(MiniMax)
https://www.thepaper.cn/newsDetail_forward_29692389
作者: zhujisou    时间: 2025-3-13 00:26
大模型四小龙 很早的玩家了




欢迎光临 全球主机交流论坛 (https://hostloc.gdisk.cf/) Powered by Discuz! X3.4