网站首页 > 教程分享正文

全网首发~，Qwen2.5-Omni 全新多模态大模型开源来

henian88 2025-04-30 16:54:04 教程分享 7 ℃ 0 评论

Omni的模型你可能看到有很多， Baichuan-Omni-1.5：全能多模态开源模型来了

汇总了个表格给大家：

可能大家会好奇Qwen2.5-Omni是什么？

我们先看看 Qwen-Omni（全模态模型）

支持视频、音频、图片、文本，真全模态。

这模型没有开源，好像也没有宣发，只是在阿里的大模型服务平台找到了，而且也是最近上线~，感兴趣的可以去体验一下，因为没有说基于qwen还是qwen2，不好评价。

看到这个图应该都很熟悉，没错，又是PR，同样来transformer的PR，昨天的Qwen3 要来了，会开源吗？上一次 Qwen2.5VL，上一次开源Qwen2.5好像也是同步开源qwen2vl（可能会有一定的时间偏差）

进入合如transformer仓库环节，是不是也同样要开源啊（大胆想象~）

直白的一句话就是Qwen2.5-Omni是一款端到端多模态大模型，支持文本、图像、音频和视频输入，并能以流式方式同时生成文本和语音响应，采用TMRoPE时间对齐嵌入与Thinker-Talker架构

最最最值得关注的一点是什么？

开源！！！端到端！！！语音生成！！！

真的重点太多，根本看不过来。

直白宣布，Qwen你就是我2025的“源神”

划重点“7B”，7B的全模态，在现在发展的具身智能机器人里，真的不要太香了~

结合这个信息来看，是不是更炸裂了，这就要开启机器人量产了吗？（合理幻想）

支持男声和女生两种声音，支持一下定制就 perfect了~

回顾一下 Qwen2.5-Omni 的特点：

* 本文结合开源仓库PR分析，个人观点，如有错误请联系修改调整。

都看到这了，点个关注+分享，加个星标，第一时间获取最新AI资讯和文章！