程序员的知识教程库

网站首页 > 教程分享 正文

全网首发~,Qwen2.5-Omni 全新多模态大模型开源来

henian88 2025-04-30 16:54:04 教程分享 7 ℃ 0 评论

Omni的模型你可能看到有很多, Baichuan-Omni-1.5:全能多模态开源模型来了

汇总了个表格给大家:

可能大家会好奇Qwen2.5-Omni是什么?

我们先看看 Qwen-Omni(全模态模型)

支持视频、音频、图片、文本,真全模态。

这模型没有开源,好像也没有宣发,只是在阿里的大模型服务平台找到了,而且也是最近上线~,感兴趣的可以去体验一下,因为没有说基于qwen还是qwen2,不好评价。

看到这个图应该都很熟悉,没错,又是PR,同样来transformer的PR,昨天的Qwen3 要来了,会开源吗?上一次 Qwen2.5VL,上一次开源Qwen2.5好像也是同步开源qwen2vl(可能会有一定的时间偏差)

进入合如transformer仓库环节,是不是也同样要开源啊(大胆想象~)

直白的一句话就是Qwen2.5-Omni是一款端到端多模态大模型,支持文本、图像、音频和视频输入,并能以流式方式同时生成文本和语音响应,采用TMRoPE时间对齐嵌入与Thinker-Talker架构

最最最值得关注的一点是什么?

开源!!!端到端!!!语音生成!!!

真的重点太多,根本看不过来。

直白宣布,Qwen你就是我2025的“源神”

划重点“7B”,7B的全模态,在现在发展的具身智能机器人里,真的不要太香了~

结合这个信息来看,是不是更炸裂了,这就要开启机器人量产了吗?(合理幻想)

支持男声和女生两种声音,支持一下定制就 perfect了~

回顾一下 Qwen2.5-Omni 的特点:

* 本文结合开源仓库PR分析,个人观点,如有错误请联系修改调整。

都看到这了,点个关注+分享,加个星标,第一时间获取最新AI资讯和文章!

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表