亚洲精品一区二区国产精华液,亚洲欧美中文日韩v在线观看,亚洲综合人成网免费视频,亚洲精品色婷婷在线影院,一区二区三区在线 | 网站

首頁 > 資訊 > 文章

2024-03-07 13:40

阿里巴巴推出 AtomoVideo 高保真圖生視頻框架，兼容多種文生圖模型

3 月 7 日消息，阿里巴巴研究團(tuán)隊(duì)近日推出了 AtomoVideo 高保真圖生視頻（I2V，Image to Video）框架，旨在從靜態(tài)圖像生成高質(zhì)量的視頻內(nèi)容，并與各種文生圖（T2I）模型兼容。

3 月 7 日消息，阿里巴巴研究團(tuán)隊(duì)近日推出了 AtomoVideo 高保真圖生視頻(I2V，Image to Video)框架，旨在從靜態(tài)圖像生成高質(zhì)量的視頻內(nèi)容，并與各種文生圖(T2I)模型兼容。

總結(jié) AtomoVideo 特性如下：

高保真度：生成的視頻與輸入圖像在細(xì)節(jié)與風(fēng)格上保持高度一致性

運(yùn)動一致性：視頻動作流暢，確保時間上的一致性，不會出現(xiàn)突兀的跳轉(zhuǎn)

視頻幀預(yù)測：通過迭代預(yù)測后續(xù)幀的方式，支持長視頻序列的生成

兼容性：與現(xiàn)有的多種文生圖(T2I)模型兼容

高語義可控性：能夠根據(jù)用戶的特定需求生成定制化的視頻內(nèi)容

▲ 圖源 AtomoVIdeo 團(tuán)隊(duì)論文

AtomoVideo 使用預(yù)先訓(xùn)練好的 T2I 模型為基礎(chǔ)，在每個空間卷積層和注意力層之后新添加一維時空卷積和注意力模塊，T2I 模型參數(shù)固定，只訓(xùn)練添加的時空層。由于輸入的串聯(lián)圖像信息僅由 VAE 編碼，代表的是低層次信息，有助于增強(qiáng)視頻相對于輸入圖像的保真度。同時，團(tuán)隊(duì)還以 Cross-Attention 的形式注入高級圖像語義，以實(shí)現(xiàn)更高的圖像語義可控性。

目前，該團(tuán)隊(duì)只發(fā)布了 AtomoVideo 的論文及演示視頻，并未提供在線體驗(yàn)地址。同時官方開設(shè)了 GitHub 賬戶，但僅用作官方網(wǎng)站托管，并未上傳任何相關(guān)代碼。