腾讯副总裁蒋杰:混元大模型正部署从多模态到全模态的技术,很快即可体验
蒋杰表示,大模型行业正从最初的单模态向多模态过渡。其认为对于腾讯混元大模型来说,多模态是一道“必答题”,目前混元大模型正在积极部署从多模态到全模态的技术,用户将很快可在腾讯元宝 App、腾讯内部业务及场景中体验,同时会通过腾讯云向外部应用开放。
而在 5 月 17 日,蒋杰曾在腾讯生成式 AI 产业应用峰会上透露,今年三季度将开源混元“最核心”的文生文模型。腾讯内部已开始对三种不同尺寸(S、M、L)的文生文模型进行训练以供开源使用。
S 版主要部署在手机端,拥有 3B 参数量;
M 版主要部署在 PC 端,参数量为 5B;
L 版主要部署在云 / 数据中心,是 30B 参数量的 MOE 架构模型。
据哈迈百科此前报道,腾讯混元文生图大模型(混元 DiT)昨日宣布开源小显存版本,仅需 6G 显存即可运行,对使用个人电脑本地部署的开发者比较友好。