เริ่มทดสอบ AI ในการ Gen art สำหรับ Animation อย่างเสถียรเพื่อพัฒนาผลงานและทุ่นเวลามนุษย์!
312 VIEWS
December 1, 2023
technology
เริ่มทดสอบ AI ในการ Gen art สำหรับ Animation อย่างเสถียรเพื่อพัฒนาผลงานและทุ่นเวลามนุษย์!
Ai generative art ของ Stable Diffusion สามารถเป็นแอนิเมชั่นได้แล้ว ผู้พัฒนา Stability AI ประกาศ บริษัทได้เปิดตัวผลิตภัณฑ์ใหม่ที่เรียกว่า Stable Video Diffusion เป็นตัวอย่างการวิจัย ซึ่งช่วยให้ผู้ใช้สามารถสร้างวิดีโอจากภาพเดียวได้ “โมเดลวิดีโอ AI เจนเนอเรชั่นที่ล้ำสมัยนี้แสดงถึงก้าวสำคัญในการเดินทางของเราสู่การสร้างแบบจำลองสำหรับทุกคนทุกประเภท”
เครื่องมือใหม่นี้เปิดตัวในรูปแบบของโมเดลภาพต่อวิดีโอ 2 โมเดล ซึ่งแต่ละโมเดลสามารถสร้างความยาว 14 ถึง 25 เฟรมที่ความเร็วระหว่าง 3 ถึง 30 เฟรมต่อวินาทีที่ความละเอียด 576 × 1,024 มีความสามารถในการสังเคราะห์หลายมุมมองจากเฟรมเดียวพร้อมการปรับแต่งชุดข้อมูลแบบหลายมุมมองอย่างละเอียด “ในขณะที่เปิดตัวในรูปแบบพื้นฐาน ผ่านการประเมินจากภายนอก เราพบว่าโมเดลเหล่านี้เหนือกว่าโมเดลปิดชั้นนำในการศึกษาความชอบของผู้ใช้” บริษัทกล่าว โดยเปรียบเทียบกับแพลตฟอร์มข้อความเป็นวิดีโอ Runway และ Pika Labs
การกระจายวิดีโอที่เสถียรมีไว้เพื่อวัตถุประสงค์ในการวิจัยเท่านั้น ณ จุดนี้ ไม่ใช่แอปพลิเคชันในโลกแห่งความเป็นจริงหรือเชิงพาณิชย์ ผู้ใช้ที่มีศักยภาพสามารถลงทะเบียนเพื่อรับรายชื่อรอเพื่อเข้าถึง "ประสบการณ์เว็บที่กำลังจะมีขึ้นซึ่งมีอินเทอร์เฟซข้อความเป็นวิดีโอ" Stability AI เขียน เครื่องมือนี้จะแสดงการใช้งานที่เป็นไปได้ในภาคส่วนต่างๆ เช่น การโฆษณา การศึกษา ความบันเทิง และอื่นๆ
ตัวอย่างที่แสดงในวิดีโอด้านบนดูเหมือนจะมีคุณภาพค่อนข้างสูง และตรงกับระบบกำเนิดของคู่แข่ง อย่างไรก็ตาม บริษัทเขียนว่ามีข้อจำกัดบางประการ: สร้างวิดีโอที่ค่อนข้างสั้น (น้อยกว่า 4 วินาที) ขาดความสมจริงของภาพที่สมบูรณ์แบบ ไม่สามารถทำการเคลื่อนไหวของกล้องได้ยกเว้นการแพนที่ช้า ไม่มีการควบคุมข้อความ ไม่สามารถสร้างข้อความที่อ่านได้ และอาจ ไม่สร้างคนและใบหน้าอย่างเหมาะสม
เครื่องมือนี้ได้รับการฝึกฝนเกี่ยวกับชุดข้อมูลวิดีโอหลายล้านรายการ จากนั้นปรับแต่งชุดข้อมูลขนาดเล็ก โดย Stability AI เพียงบอกว่าใช้วิดีโอที่เผยแพร่ต่อสาธารณะเพื่อวัตถุประสงค์ในการวิจัย ต้นกำเนิดของชุดข้อมูลมีความสำคัญ เนื่องจากเมื่อเร็ว ๆ นี้ Stability AI ถูกฟ้องโดย Getty Images ในข้อหาคัดลอกไฟล์รูปภาพ
วิดีโอเป็นเป้าหมายสำคัญสำหรับ generative AI เนื่องจากมีศักยภาพในการทำให้การสร้างเนื้อหาง่ายขึ้น อย่างไรก็ตาม มันยังเป็นเครื่องมือที่มีศักยภาพมากที่สุดสำหรับการละเมิดผ่านการปลอมแปลง การละเมิดลิขสิทธิ์ และอื่นๆ อีกมากมาย และแตกต่างจาก OpenAI กับผลิตภัณฑ์ ChatGPT ความเสถียรมีความสำเร็จน้อยกว่าในเชิงพาณิชย์ผลิตภัณฑ์ Stable Diffusion และเผาผลาญเงินสดในอัตราที่สูง TechCrunch ตั้งข้อสังเกต และเมื่อสัปดาห์ที่แล้ว Ed Newton-Rex รองประธานฝ่ายเสียงของ Stability AI ได้ลาออกจากการใช้เนื้อหาที่มีลิขสิทธิ์เพื่อฝึกโมเดล AI เชิงสร้างสรรค์
Niponpan Sasidhorn