Paano gumawa ng mga cinematic video gamit ang Gemini 3 at Veo 3.1

Huling pag-update: Marso 14, 2026
  • Ang Veo 3.1 na isinama sa Gemini ay nagbibigay-daan sa iyong lumikha ng maiikling video sa 720p, 1080p at 4K na may katutubong audio at iba't ibang istilo ng pelikula.
  • Para makamit ang tunay na propesyonal na mga resulta, mahalagang maging dalubhasa sa mga senyales: paksa, aksyon, istilo, kamera, kapaligiran, at mga posibleng imaheng sanggunian.
  • Ang Flow at Flow TV ay mga mainam na kagamitan para sa pagkuha ng inspirasyon, pagtingin sa mga totoong prompt, at pagpapabilis ng paggawa ng mga clip na handa nang gamitin sa social media.
  • Sa kasalukuyan, ang ganap na access sa Veo 3.1 at pagbuo ng video gamit ang Gemini ay limitado sa mga bayad na plano at, sa maraming pagkakataon, sa mga user sa Estados Unidos.

mga sinematikong video kasama ang Gemini 3

Ang kombinasyon ng Gemini 3 sa mga modelo ng video ng Veo 3 at Veo 3.1. Dahil dito, biglang nagsimulang magbahagi ang lahat ng mga epikong clip sa social media, tulad ng mga bagong cinematic video na may AIKung gusto mo ring makisali sa aksyon at makakuha ng mga kuha na parang galing sa isang blockbuster na pelikula, hindi lang basta pagsulat ng ilang linya sa text box ang kailangan mo: kailangan mo talagang maunawaan kung paano gumagana ang teknolohiyang ito at kung paano ito gamitin para magawa nito ang gusto mo.

Sa mga sumusunod na linya ay makikita mo ang isang kumpletong gabay, sa Espanyol at may palakaibigang tono.Dito halos lahat ng ipinaliwanag sa opisyal na dokumentasyon ng Google, sa mga X thread, at sa mga espesyal na tutorial ay tinitipon: mula sa kung paano i-access ang Veo 3 sa pamamagitan ng Gemini, hanggang sa kung paano gamitin ang mga reference na imahe, kontrolin ang aspect ratio, gamitin ang audio, at pigain ang Flow at Flow TV para (legal) na nakawin ang pinakamahuhusay na prompt.

Ano ang Veo 3.1 at paano ito akma sa Gemini 3?

Paggawa ng mga video gamit ang Gemini 3

Ang Veo 3.1 ay ang susunod na henerasyon ng modelo ng video ng GoogleDinisenyo upang makabuo ng napakaikli ngunit de-kalidad na mga visual clip, na may resolusyon hanggang 4K at natively generated na audio. Ang maganda rito ay maaari mo itong kontrolin gamit ang programa sa pamamagitan ng Gemini API, o direkta mula sa Gemini interface sa iyong browser, depende sa iyong plano.

Ang modelong ito ay na-optimize para sa mga eksena na humigit-kumulang 8 segundo ang tagal.Tumatakbo ito sa 24 na frame bawat segundo at nag-aalok ng tatlong pangunahing resolusyon: 720p, 1080p, at 4K. Kung mas mataas ang resolusyon, mas matagal ang pagbuo ng video at mas mahal ang paggamit ng API, kaya tandaan iyan kung plano mong gumawa ng maraming nilalaman.

Isa sa mga pangunahing pagpapabuti ng Veo 3.1 kumpara sa mga nakaraang bersyon Mahusay nitong nahawakan ang iba't ibang istilo ng biswal: cinematic realism, film noir aesthetics, cartoon-style 3D animation, surreal videos... at lahat ng ito ay sinamahan ng kapani-paniwalang galaw ng kamera, depth of field, mga epekto ng ilaw, at audio na akmang-akma sa eksena.

Mula sa teknikal na pananaw, ang Veo 3.1 ay isinama sa pamilya ng modelo ng Gemini. sa pamamagitan ng mga partikular na endpoint (halimbawa, ang vea-3.1-generate-preview at ang Fast variant nito). Pinapayagan nito ang mga developer na magpasa ng teksto, mga imahe, o kahit na mga preview ng video bilang input at makatanggap ng isang output clip bawat kahilingan, na may naka-embed na audio.

Mga format, aspect ratio, at resolution para sa iyong mga video

Gumagana ang Veo 3.1 gamit ang dalawang pangunahing aspect ratioPahalang na 16:9 (ang klasikong format ng YouTube o widescreen cinema) at patayong 9:16 (ang pamantayan para sa TikTok, Reels, at Shorts). Maaari mo itong tukuyin gamit ang setting ng aspect ratio sa API, o sa pamamagitan ng pagpili ng naaangkop na mode sa mga interface na sumusuporta dito.

Tungkol sa resolusyon, pinapayagan ng modelo ang pagbuo ng mga video sa 720p, 1080p, at 4K.Ang default na mode ay karaniwang 720p, na ginagamit din para sa mga extension ng video (kapag pinahaba mo ang isang clip na nagawa mo na). Available ang 1080p at 4K, ngunit kapag ang tagal ay 8 segundo o mas matagal pa, at ang gastos at latency ay tumataas nang malaki.

Ang haba ng video ay isa pang salik na kailangan mong tandaan kapag nagdidisenyo ng iyong mga prompt.Pangunahing gumagana ang Veo 3.1 sa mga clip na may 4, 6 o 8 segundo, bagama't sa pagsasagawa halos lahat ay gumagamit ng 8 segundo upang masulit ang eksena, samantalahin ang pinakamataas na resolution at magamit ang mga feature tulad ng mga reference na imahe o extension.

Ang mga pangunahing parameter na maaari mong isaayos sa mga tawag sa API Kabilang dito ang: ang naglalarawang teksto (prompt), isang opsyonal na paunang larawan, mga karagdagang larawang sanggunian, isang preview video upang pahabain ito, ang aspect ratio, ang tagal sa segundo, ang resolution, at mga partikular na kontrol para sa pagbuo ng mga tao (na may mga limitasyon depende sa rehiyon).

Teksto sa video: paano hilingin sa Gemini 3 na mag-isip tungkol sa mga pelikula

Ang karamihan sa mga epikong clip na nakikita mo sa social media ay nagsisimula sa isang mahusay na text prompt.Hindi sapat ang magsulat ng "isang magandang futuristic na lungsod"; kung gusto mo itong magmukhang eksena sa pelikula, kailangan mong turuan ang modelo na mag-isip tulad ng isang cinematographer at filmmaker nang sabay.

Binibigyang-diin ng dokumentasyon ng Veo ang ilang mahahalagang elemento na dapat lumitaw sa halos lahat ng iyong mga tagubilin.: ang pangunahing paksa (tao, hayop, bagay, tanawin), ang kilos na ginagawa nito, ang ninanais na istilo biswal, ang pagpoposisyon at paggalaw ng kamera, ang komposisyon ng frame, ang mga epekto ng lente at ang kulay at ilaw na kapaligiran.

Halimbawa, sa halip na isang pangkalahatang parirala Tungkol naman sa isang "lalaking nakikipag-usap sa telepono," mahalagang tukuyin ang isang bagay tulad nito: isang cinematic close-up, isang desperadong lalaking naka-berdeng amerikana na nagdi-dial ng rotary phone, berdeng neon light na naglalagay ng mga anino sa isang pader na ladrilyo, isang napakababaw na pokus na nagpapakita ng tensyon sa kanyang mukha at nagpapalabo sa background ng mga ilaw ng lungsod. Ang pagkakaibang ito sa antas ng detalye ay direktang isinasalin sa isang paglukso sa kalidad ng nagreresultang video.

Mainam ding ideya na magdagdag ng mga terminong partikular sa wikang audiovisual.: aerial view, kamerang nasa antas ng mata, dolly shot, extreme close-up, wide shot, handheld camera, slow tracking shot, macro lens, wide angle, soft blur… Mas maganda ang nakikita ko kapag mas nagmumukha ang iyong prompt na isang teknikal na paglalarawan ng script.

  Proyekto ng Google na maglisensya ng nilalaman sa AI nito: Isang pagbabago ng direksyon para sa media?

Mga larawan patungo sa video: mula sa isang hindi gumagalaw na larawan patungo sa isang gumagalaw na eksena

Bukod sa teksto, pinapayagan ng Veo 3.1 ang paggamit ng mga imahe bilang panimulang frame.Ito ay mainam para sa pag-animate ng mga ilustrasyon, litrato ng produkto, mga painting, o mga render na ginawa gamit ang iba pang mga modelo ng imahe tulad ng Gemini 2.5 Flash Image (binansagang Nano Banana sa ilang halimbawa ng Google).

Ang karaniwang paraan ay ang paglikha muna ng isang napakakinis na imahe na kumakatawan sa harapan ng iyong eksena (halimbawa, isang macro na larawan ng maliliit na surfer na sumasakay sa mga alon sa loob ng isang lababong bato, na may isang antigong gripo na lumilikha ng foam). Pagkatapos, ang larawang iyon ay ipapasa sa Veo 3.1 kasama ang isang prompt na naglalarawan kung paano dapat gumalaw ang camera, kung anong mga elemento ang magbabago, at kung anong atmospera at tunog ang iyong pinupuntirya.

Ginagamit ng modelo ang larawang iyon bilang balangkas ng bota Mula roon, bubuo ito ng isang maikling clip na nagbibigay-buhay sa mga detalye: ang umaagos na tubig, ang mga gumagalaw na surfer, ang mabagal na umiikot na kamera, ang kinang ng metal, atbp. Isa itong napakalakas na paraan upang magamit ang mga nakaraang gawa na nagawa mo gamit ang mga tool sa pagbuo ng imahe.

Pakitandaan na ang Veo 3.1 ay sumusuporta lamang ng hanggang tatlong reference na larawan sa bawat kahilingan. At ang ilang mga tungkulin, tulad ng sabay-sabay na paggamit ng mga sanggunian at mataas na resolusyon, ay nangangailangan ng pagtatakda ng tagal sa 8 segundo. Kung pagsasamahin mo ang ilang mga imahe (halimbawa, mukha, damit, at mga aksesorya), susubukan ng modelo na panatilihin ang lahat ng mga elementong iyon sa huling resulta.

Mga imaheng sanggunian at kontrol sa biswal na istilo

Isa sa mga magagandang kalakasan ng Veo 3.1 ay ang kakayahang gumamit ng mga nakalaang imaheng sanggunian.Ang mga reperensiyang ito, na naiiba sa unang larawan na nagsisilbing unang frame, ay nakakatulong na mapanatili ang pare-parehong anyo para sa mga karakter, produkto, o mahahalagang elemento sa buong video.

Maaari kang mag-upload ng hanggang tatlong larawang sanggunianna binibigyang-kahulugan ng sistema bilang mga biswal na "sangkap": halimbawa, isang partikular na damit, mukha ng isang babae, at isang partikular na pares ng salamin. Susubukan ng Veo na tiyakin na, sa nabuong clip, mapapanatili ng karakter ang mga damit, katangian ng mukha, at mga aksesorya, kahit na magbago ang eksena, kapaligiran, o uri ng kuha.

Ang pamamaraang ito ay lalong kapaki-pakinabang kapag gusto mong lumikha ng mga baryasyon ng iisang bida. (para sa mga ad, branded na nilalaman, mga paulit-ulit na karakter, atbp.) nang hindi magmumukhang ganap na magkaiba ang bawat video. Sa mga opisyal na halimbawa, makikita mo kung paano pinagsama ang pagtukoy sa isang isda sa malalim na dagat at ang kasuotan ng isang prinsesa ng mga bata upang makabuo ng isang animated na bersyon ng isdang nakabihis at kumakaway ng wand.

Bukod pa rito, ang Veo 3.1 ay may kasamang mode kung saan maaari mong tukuyin ang una at huling frameSa ganitong kaso, dalawang imahe ang ipinapasa: ang una at ang pangwakas, at ang modelo ay lumilikha ng isang interpolasyon na nag-uugnay sa pareho, sa gayon ay kinokontrol hindi lamang ang panimulang punto kundi pati na rin kung paano nagtatapos ang eksena (halimbawa, isang kotse na minamaneho ng isang pusa na nauwi sa pagtalsik sa bangin).

Pagpapahaba ng mga video: pagpapahaba ng aksyon nang hindi nasisira ang istilo

Isa pang eksklusibong tampok ng Veo 3.1 ay ang extension ng video, na nagbibigay-daan sa iyong kumuha ng clip na nabuo na gamit ang Veo at magdagdag ng ilang segundo pa sa paraang naaayon sa nangyayari sa huli.

Ayon sa kasalukuyang mga detalye, maaari mong pahabain ang isang video nang humigit-kumulang 7 segundo sa bawat pagkakataon.Hanggang 20 magkakasunod na beses, basta't ang orihinal na clip ay hindi lalampas sa 141 segundo, may 720p na resolusyon at aspect ratio na 16:9 o 9:16. Ang resulta ay isang file na hanggang 148 segundo na pinaghahalo ang unang footage at ang bagong nabuo na segment.

Para gumana nang maayos ang extension, mahalaga na ang huling segundo ng input video ay naglalaman ng aksyon o audio na gusto mong ipagpatuloy.Halimbawa, kung ang isang voiceover ay naputol bago ang huling segundo, mahihirapan ang modelo na natural itong pahabain. Ganito rin ang nangyayari sa mga sound effect.

Mula sa perspektibo ng paggamit, ang extension ay isinasagawa sa pamamagitan ng pagpasa sa orihinal na video bilang isang parameter. (tinutukoy ang isang clip na nabuo na ng API, hindi isang arbitraryong file) kasama ang isang bagong tagubilin sa teksto na nagpapaliwanag kung ano ang susunod na mangyayari: ipagpatuloy ang pagbaba sa paragliding, dagdagan ang bilis ng paghabol, ipagpatuloy ang isang tracking shot sa isang kagubatan, atbp.

Paano gumagana ang mga asynchronous na operasyon sa pagbuo ng video

Hindi madalian ang paggawa ng video sa cloudTinutugunan ito ng Google sa pamamagitan ng isang sistema ng mga pangmatagalang trabaho. Kapag humiling ka sa Gemini API na gumawa ng video gamit ang Veo, hindi mo agad matatanggap ang file, kundi isang operation object na nagpapahiwatig na ang trabaho ay isinasagawa.

Ang karaniwang paraan ng pagtatrabaho ay ang pagpapatupad ng isang polling loop Pana-panahon nitong susuriin ang katayuan ng operasyong iyon hanggang sa ipahiwatig ng kaukulang field na tapos na ito. Sa puntong iyon, isasama sa tugon ang URL o mapagkukunan ng nagresultang video, na maaari mong i-download o iproseso kung kinakailangan.

Ang mga inaanunsyong latency ay mula humigit-kumulang 11 segundo sa pinakamagandang sitwasyon hanggang sa ilang minuto sa mga oras na peak hours.Kung gusto mong isama ang Veo 3.1 sa mga workflow ng produksyon o mga aplikasyon ng end-user, mahalagang pamahalaan nang maayos ang mga oras na ito, magpakita ng mga makatwirang progress bar, at pamahalaan ang mga pila ng trabaho.

Gayundin, tandaan na ang mga nabuong video ay nakaimbak sa mga server ng Google sa loob lamang ng dalawang araw.Kung plano mong gamitin muli ang isang clip sa ibang pagkakataon o pahabain ito nang maraming beses, ipinapayong mag-download at mag-save ng lokal na kopya, o tandaan na ang pagtukoy sa video sa mga bagong kahilingan ay magre-reset sa two-day counter.

  Ina-activate ng Google ang AI Mode sa Spanish sa mga resulta ng paghahanap

Mga pangunahing parametro ng Veo 3.1 API at mga variant ng modelo

Ang opisyal na talahanayan ng parameter ng Veo ay nagdedetalye kung ano ang maaaring isaayos sa bawat modelo (Veo 3.1, Veo 3, Veo 2 at ang kanilang mga Fast variant), at kung anong mga uri ng datos ang tinatanggap ng bawat isa. Bagama't hindi natin kokopyahin ang talahanayan nang eksakto tulad ng nakasaad dito, sulit pa ring suriin ang mga pinaka-kaugnay na field.

Sa seksyong "mga pagkakataon," ang mga sumusunod ay kapansin-pansin: Ang text prompt, ang inisyal na imahe, ang pangwakas na imahe para sa interpolasyon, ang mga partikular na reference na imahe (sa Veo 3.1 lamang), at ang input video para sa mga extension. Lahat ng ito ay naka-encapsulate bilang mga image o video object na nauunawaan at pinoproseso ng API.

Kasama sa mga parameter na maaaring i-configure ang aspect ratio (na may 16:9 bilang default at isang opsyon para sa 9:16), ang tagal sa segundo (mga nakapirming halaga tulad ng 4, 6 o 8 depende sa modelo), ang mga mode ng pagbuo ng tao (na may malinaw na mga paghihigpit sa rehiyon para sa EU, UK, Switzerland at MENA) at ang resolusyon ng output.

Tungkol sa mga bersyon ng modelo, ang Veo 3.1 at Veo 3.1 Fast ay inaalok sa preview mode.Gamit ang isang video bawat kahilingan, native audio, text at image input, at tinatayang limitasyon na 1024 text token. Ang Veo 3 at Veo 2 ay itinuturing na mas matatag, ngunit may mas kaunting mga tampok (halimbawa, ang Veo 2 ay hindi kasama ang nabuong audio, mga silent video lamang).

Ang pagkakaroon ng mga variant na "Mabilis" ay inilaan para sa mga komersyal na kaso ng paggamit. kung saan ang bilis ay kasinghalaga ng pagpapanatili ng mataas na antas ng kalidad: malawakang pagbuo ng ad, A/B testing ng mga malikhaing konsepto, o mga tool na gumagawa ng nilalaman para sa mga social network nang halos real time.

Seguridad, mga watermark, at mga limitasyon sa rehiyon

Nakikita kong naglalapat ito ng mga security filter at memory check na nakahanay sa Gemini. Upang maiwasan ang paglikha ng nakakasakit, mapanganib, o lumalabag sa copyright na nilalaman. Kung ang tagubilin ay nasa ilalim ng mga kulay abong lugar, ito ay haharangan at hindi ka sisingilin para sa kahilingang iyon.

Lahat ng nabuong video ay may kasamang mga watermark ng SynthID, isang pagmamay-ari na teknolohiya ng Google na idinisenyo upang mag-embed ng mga hindi mahahalatang signal na nagbibigay-daan sa mga user na matukoy na ang nilalaman ay nilikha gamit ang AI at umaangkop sa mga inisyatibo tulad ng mga label ng pagiging tunayMaaaring beripikahin ang mga markang ito sa ibang pagkakataon gamit ang platform ng pagpapatunay ng SynthID.

Tungkol sa paglikha ng mga persona, may mga partikular na kontrol depende sa rehiyon.Sa mga bansang European Union, United Kingdom, Switzerland, at MENA, mas mahigpit ang mga pinapayagang halaga para sa parameter na person generation: sa Veo 3, tanging ilang uri ng adult generation lamang ang pinapayagan, at sa Veo 2, ang default na halaga ay hindi ang pagbuo ng mga tao, maliban kung iba ang ipinahiwatig sa loob ng mga minarkahang limitasyon.

Kinokontrol din ang pagpapanatili ng videoAnumang nabuong clip ay itinatago sa mga server ng Google nang maximum na dalawang araw bago ito burahin. Kung babalikan mo ang video na iyon sa panahong iyon (halimbawa, para pahabain ito), magsisimula muli ang timer, ngunit dapat mong palaging ipagpalagay na pansamantala lamang ang imbakan.

Paano sumulat ng mga makapangyarihang prompt para sa mga cinematic video

Ang tunay na "trick" para gumana nang maayos ang Veo 3.1 Ang mahalaga ay kung gaano kahusay mong isinusulat ang iyong mga tagubilin. Nag-aalok ang Google ng isang kumpletong gabay sa pagdidisenyo ng mga video prompt kung saan napakalinaw na ang mga detalye ang siyang makakagawa ng malaking pagkakaiba.

Sa isang banda, inirerekomenda nila ang paggamit ng deskriptibo at konkretong wikana may mga pang-uri at pang-abay na tumutukoy sa tono: masayahin, malungkot, nakakabagabag, mainit, malamig, surreal, antigo, futuristic, atbp. Hinihikayat din nila ang pagtukoy kung kailan mo gustong ang mukha ang maging pokus ng imahe, gamit ang mga salitang tulad ng portrait, extreme close-up, o pokus sa ekspresyon ng mukha.

Sa kabilang banda, iminumungkahi nilang hatiin ang ideya sa mga bahagiNakakatulong ito sa modelo na maunawaan ang mga malikhaing prayoridad at maiwasan ang pagkaligaw. Anong paksa ang lilitaw, anong aksyon ang kanilang ginagawa, anong istilo ng sine ang nais, paano gumagalaw ang kamera, paano binubuo ang kuha, anong uri ng lente ang ginagaya, at anong ilaw at kulay ang nangingibabaw sa eksena.

Bukod pa rito, posibleng gamitin ang "mga negatibong tagubilin" upang ipahiwatig ang mga elementong ayaw mong makita.Gayunpaman, may kakaibang pagkakaiba ang Google dito: sa halip na magsulat ng mga utos tulad ng "walang gusaling lilitaw", mas mainam na ilarawan ang mga konseptong ibukod (halimbawa, urban na kapaligiran, artipisyal na mga istruktura, nagbabantang kapaligiran) upang malaman ng modelo kung ano ang dapat iwasan nang hindi nalilito sa mga tahasang negasyon.

Audio, mga diyalogo at mga sound effect gamit ang Veo 3

Sa Veo 3, ang paglikha ng tunog ay hindi na isang third-party na add-on. at maisasama sa mismong modelo ng video. Maaari mong tukuyin ang diyalogo, mga sound effect, at ingay sa paligid nang direkta sa prompt, at susubukan ng system na i-synchronize ang mga ito sa visual na aksyon.

Ang rekomendasyon ng Google ay gumamit ng mga panipi para sa literal na pananalita na dapat bigkasin ng mga tauhan, upang linawin kung sino ang nagsasalita at sa anong tono. Halimbawa: “Ito na siguro ang susi,” bulong niya, o Babae: (nakakatense na boses) “Ano nga ba iyon?”. Ang ganitong uri ng mga direksyon sa entablado ay nakakatulong upang matiyak ang pare-parehong intonasyon.

Kinakailangan ang mga tahasang paglalarawan para sa mga sound effect (SFX).: paglangitngit ng mga gulong, ugong ng makina, mga yabag sa basang lupa, mga nababasag na sanga, pagbagsak ng mga pinto, atbp. Gayundin, para sa ingay sa paligid, makakatulong na tukuyin ang pangkalahatang tanawin ng tunog: isang patuloy na ugong na de-kuryente, mga nakahiwalay na ibon sa malayo, bulong ng lungsod, mahinang alon sa paligid.

  Ipagpapaliban ng Google Chrome ang paglo-load ng mga video at audio para sa mas mabilis na mga pahina.

Gayunpaman, kapag pinahaba mo ang isang video, maaari lamang pahabain ng modelo ang boses kung ang boses na iyon ay lilitaw sa huling bahagi ng orihinal na clip.Kung ang pangungusap ay nagtatapos bago ang huling bahaging iyon, ang sistema ay walang sapat na batayan upang ipagpatuloy ito nang natural, kaya kadalasan ay mas mahusay itong gumagana sa mga ambient effect at musika kaysa sa mga diyalogo na nagpapabago ng nilalaman.

Flow, Flow TV, at kung paano matuto sa pamamagitan ng pagkopya ng mga totoong prompt

Higit pa sa API, ang Google ay nagpapatakbo ng isang malikhaing kapaligiran na tinatawag na FlowAng Flow, na siyang ebolusyon ng isang nakaraang eksperimento na kilala bilang VideoFX, ay inaalok sa mga subscriber ng Google AI Pro at Google AI Ultra sa Estados Unidos at nakatuon sa paglikha ng interactive na video gamit ang mga AI tool, kabilang ang maagang pag-access sa Veo 3 na may katutubong audio.

Isa sa mga pinaka-kawili-wiling tampok para sa pag-aaral kung paano sumulat ng magagandang prompt Ito ay ang Flow TV, isang seksyon kung saan maaari kang manood ng isang uri ng channel ng mga video na ginawa gamit ang Flow. Ang mahalaga ay makikita mo ang prompt na ginagamit upang gawin ang bawat clip, para mapag-aralan mo kung paano nakabalangkas ang mga tagubilin na nagbibigay ng pinakamahusay na resulta.

Sinasabi ng ilang tagalikha na isa ito sa mga pinakamahusay na paraan upang mabilis na mapabuti.: manood ng mga video na gusto mo, repasuhin ang tekstong nagbigay-daan sa mga ito at iakma ang istrukturang iyon sa sarili mong mga ideya, baguhin ang mga sitwasyon, tauhan o istilo, ngunit pinapanatili ang kayamanan ng detalye at ang lohika ng paglalarawan.

Bukod pa rito, sinasamantala ng ilang gumagamit ang Gemini upang magsagawa ng malalimang pananaliksik. sa mga agarang pamamaraan, pangangalap ng mga tip at pagkatapos ay paghiling sa modelo na i-convert ang mga ulat na iyon sa mga visual na infographic na nagbubuod ng mga pinakamahusay na kasanayan. Isa pa itong kawili-wiling paraan upang gamitin ang Gemini at Veo bilang mga malikhaing kagamitan sa pagkatuto, hindi lamang bilang mga generation engine.

Mga kinakailangan at kung paano subukan ang mga video gamit ang Gemini sa labas ng Estados Unidos

Sa ngayon, ang paggawa ng video gamit ang Gemini gamit ang Veo 3 ay hindi pa magagamit ng lahat.Ipinapahiwatig mismo ng Google na, sa ngayon, ang kakayahang ito ay inaalok sa mga gumagamit ng mga partikular na bayad na plano sa Estados Unidos, na nagtulak sa maraming tagalikha mula sa ibang mga bansa na maghanap ng mga shortcut.

Para masubukan ang Veo 3 mula sa Gemini web interface, kailangan mo ng dalawang pangunahing bagay.: isang aktibong subscription sa Google AI Pro (o isang katumbas na plano na nagbibigay ng access sa mga pinakabagong feature ng video) at isang koneksyon na tila matatagpuan sa Estados Unidos, kadalasan sa pamamagitan ng isang kagalang-galang na VPN.

Ang karaniwang proseso na inirerekomenda ng maraming tutorial ay ang pagkonekta sa isang server sa US gamit ang isang VPN.Para ma-access ang Gemini, buksan ito sa iyong browser (ang feature na ito ay kasalukuyang hindi available sa mga mobile app), at hanapin ang button na Video sa itaas ng interface. Minsan, mabilis na kumikislap o nawawala ang button na ito, kaya madalas na nire-reload ng mga tao ang pahina at inihahanda ang kanilang mouse para mag-click sa sandaling makita nila ito.

Kapag pinagana na ang opsyon, kailangan mo lang ilarawan ang clip na gusto mong likhain.Dahil alam mong bubuo ang sistema ng humigit-kumulang 8 segundong video sa 720p MP4 format, mas mainam na huwag magsiksik ng napakaraming aksyon sa napakaikling oras at sa halip ay magtuon sa iisang eksena na may malinaw na istilo ng biswal.

Ayon sa ilang mga gumagamit, limitado ang bilang ng mga video na maaari mong gawin kada linggo.Bagama't hindi ito masyadong ini-advertise ng Google, may mga ulat ng humigit-kumulang 10 o 12 lingguhang paggawa sa loob ng ilang partikular na plano, kaya kailangan mong maingat na pamahalaan ang iyong mga pagtatangka at, kung maaari, pinuhin ang iyong mga prompt bago gamitin ang isang bagong henerasyon.

Mga plano at pakikipagtulungan ng Google AI sa mga filmmaker

Ginagamit ng Google ang mga plano ng subscription na AI Pro at AI Ultra bilang daan patungo sa mga advanced na kakayahang ito.Nagbibigay ang AI Pro ng access sa mahahalagang feature ng Flow at buwanang bilang ng mga nilikha (halimbawa, humigit-kumulang 100 bawat buwan sa ilang mga kaso), habang pinapataas ng AI Ultra ang mga limitasyon at nagbubukas ng maagang access sa Veo 3 gamit ang native audio.

Kasabay nito, ang kumpanya ay nakikipagtulungan sa mga propesyonal na filmmaker upang maunawaan kung paano umaangkop ang AI sa mga totoong daloy ng trabaho sa produksyon ng audiovisual. Ginamit ng mga direktor tulad ni Dave Clark ang mga tool ng Google at iba pang solusyon sa AI upang kunan ang mga kamakailang maiikling pelikula, sa pamamagitan ng pag-eeksperimento sa pinaghalong tradisyonal na pagbaril at mga kuha na binuo ng AI.

Ang nakasaad na layunin ay para sa isang bagong henerasyon ng mga tagalikha na maibahagi ang kanilang mga kwento nang may mas kaunting teknikal at pang-ekonomiyang mga hadlang.Gamit ang AI para sa mabilisang mga preview at mga huling sequence, binigyan ng Google ng maagang access sa Flow ang mga piling filmmaker, na nagpapahintulot sa kanila na mangalap ng feedback upang pinuhin ang tool at iakma ito sa wika at pangangailangan ng industriya.

Ipinapaliwanag ng hybrid na pamamaraang ito kung bakit napakaraming reperensya sa wika ng kamera at mga klasikong istilo ng pelikula ang Veo 3.1.Ang ideya ay hindi lamang para makabuo ng magagandang video para sa social media, kundi para mag-alok din ng sapat na mahusay na kontrol sa komposisyon, galaw, at atmospera upang maisama sa mas seryosong mga proyekto sa pagsasalaysay.

Kung isasaalang-alang ang lahat ng nabanggit, malinaw na ang paggawa ng mga cinematic video gamit ang Gemini 3 at Veo 3.1 Hindi ito basta pagpindot lang ng buton kundi pag-aaral na mag-isip at magsulat na parang isang film crew na pinaikli sa isang prompt: kapag natuto ka nang mag-aspect ratio, mga parameter ng modelo, mga reference image, audio at, higit sa lahat, kung paano tumpak na ilarawan ang mga eksena, ang 8 segundo ng bawat clip ay nagiging isang nakakagulat na makapangyarihang canvas para sa pagkukuwento at pagbuo ng sarili mong estetika, maging para sa mga personal na proyekto, social media o kahit na mas malalaking propesyonal na piraso.

Mga sinematikong video na pinapagana ng NotebookLM AI
Kaugnay na artikulo:
Ang NotebookLM at ang mga bagong cinematic video na pinapagana ng AI