97人人爽|97碰在线视频|三年片在线|中文字幕一区二区三区三区四区

?
當前位置:首頁 / 新聞資訊 / 行業資訊

昆侖萬維開源視頻生成模型SkyReels-V1,國內首個面向AI短劇創作的視頻生成模型

發布日期:2025-02-18     214 次

2 月 18 日消息,昆侖萬維今日宣布開源國內首個面向 AI 短劇創作的視頻生成模型 SkyReels-V1、國內首個 SOTA 級別基于視頻基座模型的表情動作可控算法 SkyReels-A1。


昆侖萬維官方介紹稱,SkyReels-V1 針對表演細節做了打標,還對情緒、場景、表演訴求等進行處理,利用“千萬級別、高質量”的好萊塢級別數據進行訓練微調。


此外,SkyReels-V1 可實現“影視級人物微表情表演生成”,支持 33 種人物表情與 400 + 種自然動作組合,還原真人情感表達,支持生成大笑、怒吼、驚訝、哭泣等微表情。

基于好萊塢級的影視數據訓練,當前 SkyReels 生成的每一幀畫面,在構圖、演員站位、相機角度等號稱都具備“電影級的質感”。


SkyReels-V1 不僅支持文生視頻,還支持圖生視頻,號稱是“開源視頻生成模型中參數最大的支持圖生視頻的模型”,在同等分辨率下各項指標實現開源 SOTA。

0.png

總結來看,SkyReels-V1 可以實現:

影視化表情識別體系:11 種針對影視戲劇中的人物表情理解,如不屑、不耐煩、無助、厭惡等表情的理解;

人物空間位置感知:基于人體三維重建技術,實現對視頻中多人的空間相對關系理解,助力模型生成影視級人物站位;

行為意圖理解:構建超過 400 種行為語義單元,實現對人物行為的精準理解;

表演場景理解:實現人物-服裝-場景-劇情的關聯分析。

性能方面,在自研推理優化框架「SkyReels-Infer」的加持下,該模型可實現 544p 分辨率,推理基于單臺 4090 用時 80s,還支持分布式多卡并行,支持 Context Parallel,CFG Parallel,和 VAE Parallel。

此外,模型采取 fp8 quantization 以及 parameter-level offload,滿足低顯存用戶級顯卡運行需求;支持 flash attention、SageAttention,模型編譯優化等,進一步優化延遲;基于開源 diffuser 庫,提升易用性。

為了實現更加精準可控的人物視頻生成,昆侖萬維還開源了 SOTA 級別的基于視頻基座模型的表情動作可控算法 SkyReels-A1,對標 Runway 的 Act-One,SkyReels-A1 支持視頻驅動的電影級表情捕捉。

SkyReels-A1 能夠基于任意人體比例(包括肖像、半身及全身構圖)生成人物動態視頻。



為您精選

最新文章

尋找更多銷售、技術和解決方案的信息?

?
關于綠測

廣州綠測電子科技有限公司(簡稱:綠測科技)成立于2015年11月,是一家專注于耕耘測試與測量行業的技術開發公司。綠測科技以“工程師的測試管家”的理念向廣大客戶提供專業的管家服務。綠測科技的研發部及工廠設立于廣州番禺區,隨著公司業務的發展,先后在廣西南寧、深圳、廣州南沙、香港等地設立了機構。綠測科技經過深耕測試與測量領域多年,組建了一支經驗豐富的團隊,可為廣大客戶提供品質過硬的產品及測試技術服務等支持。

綠測工場服務號
綠測工場服務號
綠測科技訂閱號
綠測科技訂閱號
020-2204 2442
Copyright @ 2015-2024 廣州綠測電子科技有限公司 版權所有 E-mail:Sales@greentest.com.cn 粵ICP備18033302號