股民天地 > 大盘分析 > 市场新闻 > 正文
阿里巴巴发布新一代多模态旗舰模型Qwen2.5-Omni
2025-3-27 9:55:58 作者:zwn  次阅读 分享到:

 近日,阿里巴巴发布了新一代端到端多模态旗舰模型Qwen2.5-Omni,号称具备全方位多模态感知能力,看听说写样样精通。

采用全新的Thinker-Talker双核架构,Thinker模块负责处理多模态输入并生成语义表征和文本内容,Talker模块则负责将这些信息转化为流畅的语音输出。这种架构实现了端到端的统一,支持实时音视频交互和流畅的语音生成。

能够无缝处理文本、图像、音频和视频等多种输入形式,并同时生成文本和语音输出。支持分块输入和即时输出,实现真正的实时交互。

已在Hugging Face、ModelScope、DashScope和GitHub等平台开源,方便开发者体验和使用。

相比现有方案,语音生成的自然度和稳定性更高。在音频能力上优于同等规模的Qwen2-Audio,与Qwen2.5-VL-7B保持同等水平。在语音指令理解方面表现出色,效果可媲美文本输入。


来源: 证券时报网


相关内容:
今日,宝马集团宣布与阿里巴巴集团深化战略合作,基于阿里通义AI大模型,联合开发AI引擎,...
2025-3-26 13:34:12
昨日晚间,在阿里巴巴集团2025财年Q3业绩电话会上,阿里巴巴高管明确表示,目前没有出售盒...
2025-2-21 13:43:31
昨日,阿里巴巴发布2025财年第三季度(截至2024年12月份季度)业绩,总营收2801.5亿元,同比...
2025-2-21 9:52:55
今日,在阿联酋迪拜举办的WorldGovernmentsSummit2025峰会上,阿里巴巴联合创始人、董事...
2025-2-13 14:36:01
港股方面,今日市场整体进一步上行。恒生指数盘中涨幅超过1%,站上22000点。港股科技股继...
2025-2-13 13:50:12
网站简介 联系我们 免责条款 广告服务 网站地图 用户服务
免责声明:本网站提供之资料或信息,仅供投资者参考,不构成投资建议。股市有风险,入市须谨慎!
Copyright 2011, Hubei Smart Technology Co,Ltd. All rights reserved.
联系电话:400-690-9926 E-MAIL:mbl516@163.com 鄂ICP备20014020号-2 鄂公网安备42282209000026号
网络经济主体信息