腾讯混元宣布并开源图生视频模子:可天生 5 秒
栏目:公司资讯 发布时间:2025-03-07 09:37
IT之家 3 月 6 日新闻,IT之家从腾讯混元微信大众号得悉,腾讯混元宣布图生视频模子并对外开源,同时上线对口型与举措驱动等弄法,并支撑天生配景音效及 2K 高品质视频。基于图生视频的才能,用户只要上传一张图片,并冗长描写盼望画面怎样活动、镜头怎样调理等,混元即可按请求让图片动起来,酿成 5 秒的短视频,还能主动配上配景音效。别的,上传一张人物图片,并输入盼望“对口型”的笔墨或音频,图片中的人物即可“谈话”或“唱歌”;应用“举措驱动”才能,还能一键天生同款舞蹈视频。现在用户经由过程混元 AI 视频官网即可休会,企业跟开辟者可在腾讯云请求应用 API 接口应用。此次开源的图生视频模子,是混元文生视频模子开源任务的连续,模子总参数目坚持 130 亿,模子实用于多品种型的脚色跟场景,包含写实视频制造、动漫脚色乃至 CGI 脚色制造的天生。开源内容包括权重、推理代码跟 LoRA 练习代码,支撑开辟者基于混元练习专属 LoRA 等衍生模子。现在在 Github、Hu365bet网页版ggingFace 等主流开辟者社区均可下载休会。混元开源技巧讲演表露,混元视频天生模子具有机动的扩大性,图生视频跟文生视频在雷同的数据集上发展预练习任务。在坚持超写实画质、流利归纳年夜幅度举措、原生镜头切换等特征的基本上,让模子可能捕获到丰盛的视觉跟语义信息,并联合图像、文本、音频跟姿势等多种输入前提,实现对天生视频的多维度把持。现在,混元开源系列模子曾经完全笼罩文本、图像、视频跟 3D 天生等多个模态,在 Github 累计取得超 2.3 万开辟者存眷跟 star。附:混元图生视频开源链接Github:https://github.com/Tencent/HunyuanVideo-I2VHuggingface:httbeat365亚洲体育在线官网ps://huggingface.co/tencent/HunyuanVideo-I2V
服务热线
400-123-4567