Skywork Meluncurkan SkyReels-V2: Model Video AI Open-Source yang Memberikan Pembuatan Video Berdurasi Tak Terbatas
Singkatnya Model video AI sumber terbuka SkyReels-V2 dari Skywork memungkinkan pembuatan video dengan durasi tak terbatas melalui browser, mendukung beragam aplikasi seperti pembuatan cerita dan sintesis video multi-subjek.
Platform yang mengkhususkan diri dalam agen tempat kerja AI, Bangunan Langit mengumumkan bahwa alat pembuatan video AI-nya, Gulungan Langit , telah memperkenalkan SkyReels-V2, model video AI sumber terbuka yang mampu menghasilkan video dengan durasi tak terbatas langsung dari peramban web tanpa biaya. Bobot dan kode inferensi model kini tersedia untuk umum di GitHub. SkyReels-V2 menggunakan kerangka kerja Diffusion Forcing yang mengintegrasikan Multi-modal Large Language Models (MLLM), pra-pelatihan multi-tahap, pembelajaran penguatan, dan teknik diffusion forcing untuk mengoptimalkan kinerja secara komprehensif. Model ini mendukung berbagai aplikasi praktis, termasuk pembuatan cerita, sintesis gambar-ke-video, pengarahan kamera, dan pembuatan video multi-subjek yang konsisten melalui sistem Skyreels-A2.
Kerangka kerja Diffusion Forcing memungkinkan pembuatan video dengan durasi tak terbatas. SkyReels-V2 mendukung tugas pembuatan teks ke video (T2V) dan gambar ke video (I2V), dan mampu menjalankan inferensi dalam mode sinkron dan asinkron, dengan contoh skrip yang menunjukkan pembuatan video berdurasi panjang yang tersedia.
Komponen penting SkyReels-V2 adalah SkyCaptioner-V1, model teks video yang dirancang untuk anotasi data. Model ini dilatih pada hasil teks dari model dasar Qwen2.5-VL-72B-Instruct dan sub-ahli teks tambahan menggunakan kumpulan data yang dikurasi dengan cermat dari sekitar dua juta video yang seimbang untuk memastikan kualitas anotasi dan keseimbangan konseptual.
SkyCaptioner-V1, yang dibangun di atas fondasi Qwen2.5-VL-7B-Instruct, disetel dengan baik untuk meningkatkan kinerja teks video khusus domain. Evaluasi menggunakan set uji yang terdiri dari 1,000 sampel menunjukkan bahwa SkyCaptioner-V1 mencapai akurasi rata-rata yang lebih tinggi daripada model dasar terkini, khususnya unggul dalam bidang yang terkait dengan pengambilan gambar.
Berdasarkan keberhasilan sebelumnya dengan model bahasa besar, pengembang berfokus pada peningkatan kualitas video generatif melalui pembelajaran penguatan, mengatasi keterbatasan yang teridentifikasi seperti kesulitan dengan gerakan besar yang dapat diubah bentuknya, serta ketidakkonsistenan fisik sesekali dalam video yang dihasilkan.
Untuk meningkatkan kinerja, dua tahap berurutan dari penyempurnaan terbimbing (SFT) diimplementasikan pada resolusi 540p dan 720p, masing-masing. Tahap SFT awal berlangsung segera setelah prapelatihan dan sebelum tahap pembelajaran penguatan. Tahap SFT pertama ini bertindak sebagai pelatih keseimbangan konseptual, menyempurnakan hasil prapelatihan model dasar, yang hanya menggunakan data video 24 bingkai per detik (fps), dan menyederhanakan arsitektur dengan menghapus komponen penyematan FPS.
Apa itu SkyReels?
SkyReels adalah platform pembuatan video yang didukung oleh kecerdasan buatan yang memungkinkan pengguna untuk memproduksi film pendek, animasi, dan video dengan menggabungkan perintah teks, gambar, dan input audio. Platform ini menyediakan berbagai fitur termasuk karakter yang dihasilkan AI, alat untuk membuat storyboard, kemampuan sinkronisasi bibir, komposisi musik, dan penyuntingan video, semuanya dirancang untuk menyederhanakan proses pembuatan konten. Platform ini juga mencakup model AI tingkat lanjut seperti SkyReels-V1 dan SkyReels-V2.
SkyReels-V1 adalah model fondasi video sumber terbuka yang berfokus pada produksi video yang berpusat pada manusia untuk drama pendek, mendukung keduanya teks-ke-video dan pembangkitan gambar ke video sekaligus menampilkan ekspresi wajah halus secara akurat dan memberikan visual berkualitas sinematik.
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Ethereum Foundation merilis laporan 'Trillion Dollar Security' yang mengidentifikasi area yang perlu ditingkatkan dalam pertumbuhan Ethereum
Singkatnya Yayasan Ethereum telah meluncurkan inisiatif “Keamanan Triliun Dolar” untuk mengatasi tantangan keamanan kritis di enam area inti ekosistem Ethereum, yang bertujuan untuk memperkuat jaringan agar dapat diadopsi secara global dalam skala besar dan mengundang kolaborasi komunitas untuk membentuk masa depannya.

Datagram Meluncurkan Alpha Testnet untuk Interoperabilitas DePIN
Singkatnya Datagram telah meluncurkan Alpha Testnet berbasis Avalanche untuk mendukung interoperabilitas DePIN, yang memungkinkan peserta menjalankan node, memperoleh hadiah token, dan berkontribusi pada pengembangan infrastruktur terdesentralisasi melalui waktu aktif dan rujukan.

Astar Network Integrasikan CCIP Chainlink, Adopsi Standar SuperchainERC20 Untuk ASTR Guna Tingkatkan Interoperabilitas
Singkatnya Token ASTR menjadi kontrak token pertama yang terintegrasi dengan Superchain melalui ERC-7802 dan Chainlink CCIP, memungkinkan transfer lintas rantai yang aman dan terstandarisasi dalam superchain OP tanpa aset terbungkus atau kumpulan likuiditas.

SQDUSDT sekarang diluncurkan untuk perdagangan futures dan bot trading
Berita trending
LainnyaHarga kripto
Lainnya








