Google เปิดตัว Veo 3.1: การควบคุมเสียงและการบรรยายแบบเนทีฟ

การผจญภัยสากล » ทั่วไป » Google เปิดตัว Veo 3.1: เสียงดั้งเดิม ควบคุมได้มากขึ้น และ Flow ที่ได้รับการปรับปรุงใหม่

Veo 3.1 ผสมผสานเสียงดั้งเดิมและปรับปรุงการยึดมั่นตามคิว ส่งผลให้คลิปมีความสมจริงมากขึ้น
Flow จะเพิ่มเสียงให้กับส่วนผสม เฟรม และส่วนขยาย และช่วยให้คุณสามารถแทรกหรือลบองค์ประกอบที่มีแสงและเงาที่ผสานรวมเข้าด้วยกัน
รองรับรูปแบบ 1080p, 16:9 และ 9:16 คลิปฐาน 8 วินาทีขยายได้เกิน 1 นาที โดยมีการผสานรวม Gemini และ Vertex AI
การถกเถียงเกี่ยวกับการใช้ข้อมูล ลายน้ำ และการเพิ่มขึ้นของ AI ที่ทำให้การแยกแยะเนื้อหาสังเคราะห์ทำได้ยาก

Veo 3.1 เปิดตัวแล้ว

Google ได้นำเสนอ วีโอ 3.1, รุ่นล่าสุดของมัน แบบจำลองการสร้างวิดีโอ AIออกแบบมาเพื่อสร้างคลิปจากรูปภาพและข้อความด้วยความแม่นยำที่มากขึ้น คุณสมบัติใหม่ที่มองเห็นได้ชัดเจนที่สุดคือ เสียงพื้นเมืองแบบรวม และการควบคุมการเล่าเรื่องที่ละเอียดอ่อนยิ่งขึ้น ซึ่งเมื่อรวมกันแล้วจะได้ผลลัพธ์ที่มีความสอดคล้องและสมจริงมากขึ้น

โมเดลใหม่ได้รับการรวมเข้าอย่างสมบูรณ์ ไหลสภาพแวดล้อมการทำภาพยนตร์ของบริษัท และจะมาถึงด้วย แอพราศีเมถุน API ของแล้ว เวอร์เท็กซ์ AI y เมถุนด้วยรูปลักษณ์ที่สวยงามและการปฏิบัติตามคำแนะนำที่ดีขึ้น Veo 3.1 มุ่งเน้นไปที่การใช้งานระดับมืออาชีพโดยไม่ละเลยความท้าทายทางจริยธรรมที่เกิดจากความสมจริงของ เนื้อหาที่สร้างโดย AI.

สิ่งที่ Veo 3.1 นำมาจริงๆ

เวอร์ชันนี้สร้างขึ้นบน Veo 3 และแนะนำ การปรับปรุงที่สำคัญ ในสามด้าน ได้แก่ เสียง การควบคุมการบรรยาย และความแม่นยำในการตีความคำกระตุ้น บริษัทได้สังเกตเห็นว่า ความซื่อสัตย์ต่อคำแนะนำ และ การแปลงรูปภาพเป็นวิดีโอ สอดคล้องกันมากขึ้น โดยมีพื้นผิวและการเคลื่อนไหวที่รับรู้ได้ว่าไม่เป็นธรรมชาติ

ในแง่ของเอาท์พุต ระบบจะผลิตคลิปฐานประมาณ วินาที 8 ในความละเอียด 1080p, พร้อมรองรับรูปแบบ 16:9 และ 9:16 ที่ 24 FPS พร้อมสุนทรียศาสตร์แบบภาพยนตร์ ผ่านส่วนขยายแบบโซ่ ชิ้นส่วนต่างๆ สามารถ เกินนาที การรักษาความต่อเนื่องของภาพและเสียง

เม็กซิโกยุติการปกปิดตัวตนในบริการโทรศัพท์มือถือด้วยระบบลงทะเบียนภาคบังคับใหม่

ความพร้อมใช้งานกระจายอยู่ในหลายช่องทาง: การสร้างโดยตรงใน ไหล, ใช้ใน แอพราศีเมถุน, การบูรณาการผ่าน API เจมินี่ และการปรับใช้ทางธุรกิจใน เวอร์เท็กซ์ AIGoogle พูดถึงการเปิดตัวแบบเป็นระยะตามภูมิภาค และการเข้าถึงที่รวมแผนสำหรับผู้ใช้ปลายทางและโปรไฟล์ เชี่ยวชาญ.

มีอะไรใหม่ใน Veo 3.1 ใน Flow

การไหล: เสียงข้ามเครื่องมือทั้งหมดและการแก้ไขที่แม่นยำยิ่งขึ้น

ส่วนผสมในวิดีโอ:รวมภาพอ้างอิงหลายภาพ (ตัวละคร วัตถุ สไตล์) เพื่อสร้างฉากที่มีความสอดคล้องพร้อมเสียง
เฟรมเป็นวิดีโอ: ส่วนหนึ่งของภาพเริ่มต้นและภาพสุดท้าย และสร้างการเปลี่ยนผ่านทางภาพและเสียงระหว่างทั้งสอง
Extender:ขยายคลิปโดยใช้เวลาวินาทีสุดท้ายเป็นจุดยึด ทำให้เกิดเทคยาวเกินกว่า 1 วินาที นาที โดยไม่ต้องตัดขาดกะทันหัน

นอกจากนี้ตัวแก้ไขยังอนุญาตให้ แทรกและลบองค์ประกอบ ภายในช็อตเดียว ปรับเงา แสงสะท้อน และแสงอัตโนมัติ แสง เพื่อให้บรรลุการบูรณาการตามธรรมชาติ แนวคิดคือการวนซ้ำผลลัพธ์โดยไม่ต้องสร้างใหม่ทั้งหมด ทำให้งานของ ผู้สร้าง.

ชุดนี้จะเปลี่ยน Flow ให้กลายเป็นพื้นที่การผลิตที่ไม่เพียงแต่สร้าง แต่ยัง ปรับแต่ง และแก้ไขด้วยการควบคุมความต่อเนื่อง การจัดฉาก และรายละเอียดปลีกย่อยขององค์ประกอบให้ดียิ่งขึ้น

คุณภาพ ความสม่ำเสมอ และการควบคุมที่รวดเร็ว

Veo 3.1 ปรับปรุงการตอบสนองต่อ คำเตือนที่ซับซ้อน ด้วยวัตถุหลายชิ้น การโต้ตอบทางกายภาพ และรูปแบบที่กำหนดไว้ สามารถดูความคืบหน้าได้ใน เสถียรภาพของตัวละครระหว่างเฟรม, ลดการเปลี่ยนแปลงที่ไม่ต้องการในคุณลักษณะ เสื้อผ้า หรือการวัดสี และ ฟิสิกส์ น่าเชื่อถือยิ่งขึ้นในด้านวัสดุและของเหลว

การบูรณาการสัญญาณภาพและเสียงเข้าด้วยกันช่วยให้เรื่องราวมีความน่าสนใจยิ่งขึ้น สอดคล้องกัน. ในอดีตการเสริมสร้างเรื่องราวในการแก้ไขเป็นเรื่องปกติ แต่ปัจจุบันคนรุ่นใหม่สามารถรวมจังหวะ ความเงียบ หรือ ผลกระทบ ที่จะช่วยรักษาเจตนาสร้างสรรค์จากการกระตุ้น

อัลท์แมนฟื้นทฤษฎีอินเทอร์เน็ตที่ตายแล้ว

จะใช้ที่ไหนและเข้าถึงได้อย่างไร

Veo 3.1 มีให้บริการใน ไหล เพื่อการสร้างสรรค์ที่ได้รับการชี้นำใน แอพราศีเมถุน สำหรับผู้ใช้ที่ต้องการทดลองและผ่าน API เจมินี่ y เวอร์เท็กซ์ AI สำหรับนักพัฒนาและธุรกิจ Google ยังมองหาที่จะนำความสามารถเหล่านี้มาสู่ YouTube ในประสบการณ์แบบบูรณาการซึ่งจะขยายการเข้าถึงไปสู่รูปแบบสั้น

แบบจำลองนี้อยู่ร่วมกับแผนและ ค่าธรรมเนียมการใช้งาน ขึ้นอยู่กับโปรไฟล์ และความพร้อมใช้งานอาจแตกต่างกันไปตามตลาด ในบริบททางวิชาชีพ การผสานรวมผ่าน API ช่วยให้สามารถทำงานอัตโนมัติบางส่วนของการผลิต การสร้างต้นแบบไอเดีย และ ปีนขึ้นไป เนื้อหาที่มีการปรับแต่งได้มากขึ้น

ความโปร่งใส ข้อมูลการฝึกอบรม และความเสี่ยงจากการละเมิด

ความสมจริงที่มากขึ้นหมายถึงบางคลิป ยากที่จะแยกแยะ ที่สร้างขึ้นโดย AI เป็นตัวกระตุ้นให้เกิดปรากฏการณ์ที่เรียกว่า AI slop หรือ “ขยะดิจิทัล” ผู้เชี่ยวชาญเตือนถึงความเป็นไปได้ เสียความมั่นใจ ของสาธารณชนเมื่อเผชิญกับเนื้อหาสังเคราะห์จำนวนมหาศาล แม้กระทั่งชิ้นงานที่ถูกต้องตามกฎหมายที่ไม่ได้สร้างด้วย AI ก็ยังได้รับผลกระทบ

Google รวมถึง ลายน้ำที่มองเห็นได้ y SynthID ฝังอยู่ในแต่ละเฟรมเพื่อระบุแหล่งที่มาของการสังเคราะห์ของวัสดุ สัญญาณเหล่านี้ซึ่งมีไว้สำหรับการตรวจสอบและการยืนยัน มุ่งหาสมดุลระหว่างความคิดสร้างสรรค์และ ความปลอดภัย ของระบบนิเวศ

ในส่วนของการฝึกอบรม รายงานล่าสุดชี้ให้เห็นถึงการใช้บางส่วนของ ห้องสมุด YouTube เพื่อปรับปรุงโมเดลเช่น Gemini และ Veo ด้วยข้อตกลงในการปกป้อง ทรัพย์สินทางปัญญาอย่างไรก็ตาม ผู้สร้างบางรายอ้างว่าไม่ได้รับแจ้ง และผู้เชี่ยวชาญด้านกฎหมายเตือนถึงความขัดแย้งที่อาจเกิดขึ้นหากเครื่องมือเหล่านี้แข่งขันกับผลงานดัดแปลงของเครื่องมือนั้น วัสดุ โดยไม่ได้รับเครดิตหรือค่าตอบแทน

การแข่งขันและสถานะทางการตลาด

การประกาศดังกล่าวเกิดขึ้นท่ามกลางการแข่งขันด้านวิดีโอเชิงสร้างสรรค์ OpenAI โซระ 2 การกำหนดจังหวะบนโซเชียลมีเดีย Google วางตำแหน่ง Veo 3.1 บนเส้นทางสู่ การเชื่อมโยงกัน และการควบคุมเชิงสร้างสรรค์มากกว่าการสร้างผลกระทบทันทีด้วยเครื่องมือที่ส่งเสริมการผลิตที่ซับซ้อนและการใช้งานระดับมืออาชีพ

งานเปิดตัว iOS 27: ทุกสิ่งที่คุณควรรู้

ในขณะที่รุ่นอื่นๆ ให้ความสำคัญกับความเร็วหรือความน่าตื่นตาตื่นใจ Veo 3.1 เน้นย้ำความสม่ำเสมอระหว่างช็อต เสถียรภาพ ขององค์ประกอบและความต่อเนื่องทางเวลา เป็นการมุ่งมั่นสู่เวิร์กโฟลว์ที่คาดเดาได้มากขึ้น ซึ่งมีประโยชน์สำหรับชิ้นงานที่ต้องการมากขึ้น ปรับจูน.

Google ระบุว่าการปรับใช้ Flow ได้อนุญาตให้สร้างแล้ว หลายร้อยล้าน ของวิดีโอ ปริมาณที่ป้อนการวนซ้ำอย่างต่อเนื่องของโมเดลและการแก้ไข อคติ และสิ่งประดิษฐ์ตามฐานการใช้งานที่เติบโต

กรณีการใช้งานและข้อจำกัดในปัจจุบัน

สำหรับสำนักงานบรรณาธิการ หน่วยงาน และ การศึกษาVeo 3.1 ช่วยให้การสร้างการสาธิต การแสดงจำลอง และการอธิบายเป็นเรื่องง่ายโดยไม่ต้องถ่ายทำแบบเดิมๆ ในด้านการตลาด Veo 3.1 ช่วยให้คุณสามารถสร้างต้นแบบของรุ่นต่างๆ ก่อนการผลิตขนาดใหญ่ได้ เสียง บูรณาการเพื่อลดขั้นตอนหลังการผลิต

อย่างไรก็ตาม ข้อจำกัดยังคงอยู่: อาจปรากฏ สิ่งประดิษฐ์ ในฉากที่มีการเคลื่อนไหวเร็วมาก และการลิปซิงค์แม้จะได้รับการปรับปรุงแล้ว แต่ก็ไม่ได้ให้ความแม่นยำระดับสตูดิโอเสมอไปหากไม่มีการปรับแต่งใดๆ ต้องคำนึงถึงการใช้พลังงานด้วย การคำนวณ/หน่วยกิต ในกระแสที่เข้มข้น

การรวมเครื่องมือสร้างและแก้ไขใน Flow ช่วยลดการพึ่งพาภายนอก แต่ต้องใช้ แจ้ง การอ้างอิงภาพอย่างรอบคอบและคัดสรรมาอย่างดี เมื่อสิ่งบ่งชี้เบี่ยงเบนไปจากตรรกะภาพ การเปลี่ยนแปลงที่แปลกประหลาดหรือการสูญเสียความสอดคล้องระหว่าง พลาโน.

ด้วยเสียงดั้งเดิม การควบคุมการเล่าเรื่องที่มากขึ้น และการแก้ไขภายในโฟลว์เอง Veo 3.1 จึงรวมเป็นหนึ่งเดียว ไหล เป็นเวิร์กช็อปวิดีโอ AI ระดับมืออาชีพ ข้อเสนอนี้พัฒนาคุณภาพและการใช้งาน ขณะเดียวกันก็เปิดประเด็นถกเถียงเกี่ยวกับ ความโปร่งใสข้อมูลการฝึกอบรมและความสมดุลระหว่างความคิดสร้างสรรค์และสิทธิของผู้สร้างสรรค์

บทความที่เกี่ยวข้อง:

Google Photos ก้าวไปอีกขั้นด้วยความคิดสร้างสรรค์: ฟีเจอร์ใหม่ที่ขับเคลื่อนด้วยปัญญาประดิษฐ์