当前位置: 首页 > 科技

新经济视界 | 兵马俑唱rap、高启强普法 国产图生视频AI模型让照片开口说话|封面天天见

封面新闻记者 欧阳宏宇

把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话……继Sora之后,一款能让照片开口说话的国产图生视频AI模型在社交媒体上走红。近日,记者获悉,该AI模型已正式上线,并开放给所有用户免费使用。

据介绍,这款AI模型名为EMO(Emote Portrait Alive),由通义实验室研发。在该AI模型上,用户仅需一张人物肖像照片和音频,就可以让照片中的人物按照音频内容“张嘴”唱歌、说话,且口型基本一致,面部表情和头部姿态非常自然。

比如,让奥黛丽赫本唱《上春山》,爱因斯坦说中文段子,《狂飙》电视剧中“高启强”畅谈罗翔普法;甚至用兵马俑士兵图片配上音频,就能“唱出”一首rapper饶舌,连口型都几乎一模一样。据悉,这款AI模型目前已在通义APP上线。

记者随即进入该大模型页面看到,用户能在歌曲、热梗、表情包中任选一款模板,上传肖像照片,AI随即就能合成视频。目前,该模型首批上线了80多个模板,包括热门歌曲《上春山》《野狼disco》等,网络热梗“钵钵鸡”“回手掏”等。

这款图生视频AI模型高度真实感和表现力背后的技术原理是什么?该实验室研发团队透露,该模型所运用的肖像说话(Talking Head)技术是当前大热的AIGC领域。在此之前,肖像说话技术需针对人脸、人头或者身体部分做3D建模,国内研发团队则率先提出了弱控制设计,无需建模就可驱动肖像开口说话,不仅降低视频生成成本,还大幅提升了视频生成质量。

据了解,该模型目前已学习并实现了编码人类表达情绪的能力,能将音频内容和人物的表情、嘴型匹配,还能把音频的语气特征和情绪色彩反映到人物微表情上。

公开资料显示,围绕该模型肖像说话技术的相关论文已在今年2月底发布,相关AI模型也成为继Sora之后最受关注的AI模型之一。有业内人士表示,图生视频AI模型让所有人都可免费体验前沿模型的创造力。未来,相关技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。

新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表西藏新闻热线立场,转载请注明出处
转发到:
拓展阅读
  • 【乡村行 看振兴】    ◎本报记者 王迎霞    锁国礼是宁夏吴忠市同心县石狮开发区黄石村村民,一生都在与土地和牛打交道。4月24日这天,他的心情格外激动——他养了很久的和牛犊被高价回购了。“这种提前帮我们找好销路的模式,让我养一头和牛的[全文]
    2024-05-05 03:18
  • 本报讯(记者李晨)近日,南京农业大学教授胡高团队与河南省农业科学院研究员封洪强团队合作,揭示了我国东部地区夜间迁飞昆虫空中数量规模及迁飞行为模式。该研究成果在线发表于美国《国家科学院院刊》。据介绍,每年有数以万亿计的昆虫飞过天空,寻找千里之[全文]
    2024-05-01 03:37
  • 铁路“五一”小长假运输今日启动,自4月29日至5月6日,为期8天。记者从中国铁路成都局集团有限公司(以下简称成都局)获悉,“五一”期间,该局计划开行旅客列车1055对,预计发送旅客1330万人次,同比去年增加127万人次,增幅10.6%。预[全文]
    2024-04-30 03:22
  • 4月28日,京东酒世界CEO刘俊受邀出席在扬州举办的世界美食之都美食国际文化论坛。此次论坛汇聚了餐饮行业的众多领军人物,共同探讨美食与酒文化的融合发展之道。会上,京东酒世界与中国华夏文化遗产基金会中华饮食文化专项基金进行了战略签约,将携手美[全文]
    2024-04-29 03:17
  • 新快报讯 记者陈慕媛 通讯员张家瑛 朱振杰 罗诗岚报道 近日,自然资源部印发了《关于2024年土地利用计划管理的通知》,奖励广东820亩红树林造林合格的新增建设用地计划指标。这是广东省2024年唯一通过生态保护获得的新增建设用地计划奖励指标[全文]
    2024-04-29 03:17
  • 封面新闻记者 欧阳宏宇把一段音频、一张照片输入AI模型,就能让图中人物开口唱歌说话……继Sora之后,一款能让照片开口说话的国产图生视频AI模型在社交媒体上走红。近日,记者获悉,该AI模型已正式上线,并开放给所有用户免费使用。据介绍,这款A[全文]
    2024-04-26 03:20
阿里云服务器
腾讯云秒杀
Copyright 2003-2024 by 西藏新闻热线 xz.zhxinw.cn All Right Reserved.   版权所有