• 电击 调教

hongkongdoll AI视频生成新进展,Vidu上线“主体参照”功能

发布日期:2024-09-14 00:05    点击次数:148

本年4月hongkongdoll,生数科技勾通清华大学发布了中国首个原创全自研,永劫长、高一致性、高动态性的视频大模子Vidu。9月11日,生数科技在行业内初次发布“主体参照”(Subject Consistency)功能,该功能八成杀青对纵情主体的一致性生成,让视频生成愈加剖析、可控,目下该功能已面向用户免费绽开。 所谓“主体参照”,即是允许用户上传纵情主体的一张图片,Vidu 就八成锁定该主体的形象,通过态状词纵情切换场景,输出主体一致的视频。该功能不局限于单一双象,而是面向“纵情主体”,

  • hongkongdoll AI视频生成新进展,Vidu上线“主体参照”功能

    本年4月hongkongdoll,生数科技勾通清华大学发布了中国首个原创全自研,永劫长、高一致性、高动态性的视频大模子Vidu。9月11日,生数科技在行业内初次发布“主体参照”(Subject Consistency)功能,该功能八成杀青对纵情主体的一致性生成,让视频生成愈加剖析、可控,目下该功能已面向用户免费绽开。

    所谓“主体参照”,即是允许用户上传纵情主体的一张图片,Vidu 就八成锁定该主体的形象,通过态状词纵情切换场景,输出主体一致的视频。该功能不局限于单一双象,而是面向“纵情主体”,不管是东说念主物、动物、商品,如故动漫变装、造谣主体,王人能确保其在视频生成中的一致性和可控性,这是视频生陈规模的一大翻新。Vidu 亦然大家首个解救该才气的视频大模子。

    比如进行东说念主物变装的“主体参照”,不管是真正东说念主物如故造谣变装,Vidu 王人能保捏其在不同环境中、不同镜头下的形象连贯一致。以具体案例来看,输入一张林黛玉的变装照,输入不异的“在当代咖啡厅喝咖啡”的态状并让Vidu生成相应的视频后,能直不雅看到,在Vidu “主体参照”功能下,林黛玉的形象在当代场景中获得了完好保留,场景输出也自可是真正。而未具备该功能时生成的视频中,林黛玉仅保留了面部特征,情绪、东说念主物举座形象王人产生了略显突兀、不当然的变化。

    “主体参照”功能使得AI视频生成展现出不小的变现后劲。以告白片生成为例,告白片的一大重要在于要保证多个镜头、不同场景低品牌物形象的一致性。视频大模子规模的竞争日益浓烈,尽管繁多模子论千论万,但当年大批存在着一个中枢问题——可控性不及,或者叫一致性的不及。“主体参照”功能八成很好地惩办这一问题。举例,在一个长度36秒的跑步鞋告白视频中,仅通过一张商品图,便完成了扫数视频画面的生成,不管是不同角度、布景,如故动态证据,跑步鞋的形象在通盘视频中王人保捏了高度一致。

    生数科技关系证据东说念主先容,该视频仅一位东说念主员破耗6个小时完成,包含前期运筹帷幄、素材生成,后期裁剪,其中30段AI视频素材的生成仅破耗3个小时,通盘经由仅参照一张商品图。传统告白片制作高度依赖线下实拍和后期制作,时辰周期长、资本插足大,但目下通过 Vidu 八成极地面勤俭告白制作的资本,通盘产出经由愈加高效。

    在功能发布同期,生数科技也推出了配合资伴经营,邀请告白、影视、动漫、游戏等行业的机构加入,在实践共创、本事解救、市集拓展等方面伸开配合,首批配合资伴包括欣喜麻花、猫眼文娱、巨东说念主采集、好意思克家居、融创文化、河南省非物资文化遗产保护和机灵化中心、李可柒画院等驰名企业与机构。

    Hongkongdoll 露脸

    记者:孙奇茹hongkongdoll



相关资讯

  • 调教 母狗 钛媒体科股早知说念:华为谷歌苹果加快布局,该类家具正成为伏击AI硬件落地体式

    调教 母狗 必读要闻一:华为谷歌苹果加快布局,该类家具正成为伏击 AI 硬件落地体式 9 月 10 日,星纪魅族与博士眼镜在北京举行政策配合签约典礼,两边将在智能眼镜鸿沟张开愈加长远的配合,共同鼓励星纪魅族 XR 品牌与 XR 智能眼镜的市集推行与销售。星纪魅族高档副总裁、XR 奇迹部总裁卢勇与博士眼镜 COO 夏冰代表两边出席签约典礼并签署条约。 智能眼镜...

  • 女同 视频 波音研讨将F-15EX改装为电子战飞机

    好意思制F-15EX重型来回机女同 视频。 Hongkongdoll 露脸 据外媒报说念,好意思国波音公司研讨将F-15EX重型来回机改装为电子战飞机,用于填补好意思舟师电子战飞机退役后留住的空白,同期为F-15EX设备新市集。 好意思舟师EA-18G“吼怒者”电子战飞机由F/A-18“大黄蜂”来回机改装而来,由于采购数目少,将于2027年住手坐蓐。当今,波...