Nano Banana ng Google: Ang editor ng imahe na pinapagana ng AI na pumapasok sa Gemini

Huling pag-update: 1 Setyembre, 2025
  • Ang Nano Banana ay ang panloob na palayaw para sa modelo ng Gemini 2.5 Flash Image ng Google para sa pag-edit at paglikha ng larawan.
  • Binibigyang-daan ka nitong mag-edit gamit ang natural na wika, mapanatili ang pare-parehong mga character at istilo, at pagsamahin ang maraming larawan sa isa.
  • Pinapalakas ang kalidad gamit ang mga pagpapahusay sa mukha at kamay, SynthID watermark, at mga filter ng seguridad.
  • Available nang libre sa Gemini app na may mga limitasyon sa paggamit; propesyonal na pag-access sa pamamagitan ng Google AI Studio at Vertex AI.

Ang tool sa pag-edit na pinapagana ng AI ng Google

Sa mga nakaraang araw, ang pangalan “Nano Banana” ay nagiging popular sa mga forum at network bilang ang palayaw para sa bagong panukala ng Google para sa pagtatrabaho sa mga larawan gamit ang artificial intelligence. Sa likod ng palayaw na ito ay Gemini 2.5 Flash na Larawan, isang modelo na isinama sa Gemini app at nag-opt para sa isang edisyon simple at tumpak na may mga tagubilin sa natural na wika.

Ang ideya ay bawasan ang friction sa pinakamababa: mag-upload ka ng larawan, ilarawan kung ano ang gusto mong baguhin, at ipapatupad ng system ang order sa ilang segundo. Ang pinagkaiba nito ay ang kakayahan nito pangalagaan ang istilo, karakter o produkto sa maraming pag-aayos, pag-iwas sa mga tipikal na error sa pagkakapare-pareho na dinanas ng ibang mga generator at editor IA.

Ano ang "Nano Banana" at ano ang nasa likod ng pangalan?

Gumaganap ang Nano Banana ng Google

Ang "Nano Banana" ay ang Codename na lumabas sa mga pampublikong pagsubok at pagraranggo tulad ng LMArena bago ang opisyal na anunsyo nito. Kinumpirma ng kumpanya na ito ang modelo Gemini 2.5 Flash na Larawan, na idinisenyo upang bumuo at mag-edit ng mga larawan sa isang pare-pareho at nakatutok na paraan mapag-usap.

  Huminto ang Google Chrome sa pag-update sa macOS Big Sur: Ano ang ibig sabihin nito para sa iyong Mac

Inaatake ng modelo ang dalawang harapan nang sabay-sabay: sa isang banda, ang paglikha mula sa simula; sa kabilang banda, umuulit na pag-edit sa isang umiiral na larawan. Ang dalawahang diskarte na ito ay naglalagay ng presyon sa parehong mga purong generator (tulad ng mga dalubhasang makina) at mga klasikong retouching tool, kapag nilulutas ang mga karaniwang gawain gamit ang natural na mga order.

Isa sa mga pinakatanyag na pagsulong ay ang visual na pagkakaugnay-ugnay sa pagitan ng mga pag-edit: pagpapanatili ng parehong karakter sa iba't ibang eksena, pagpapanatili ng hitsura ng isang produkto mula sa maraming anggulo, o pagbuo ng mga asset ng brand nang walang mga hindi gustong pagbabago sa mga katangian o proporsyon.

Pag-edit sa Pag-uusap: Mga Pangunahing Tampok at Kaso ng Paggamit

Pag-edit ng imahe sa pag-uusap

Ang pakikipag-ugnayan ay tuloy-tuloy: maaari mong itanong ang "gawing mas dramatic ang langit”, “tanggalin ang taong iyon”, “palitan ang kulay ng kotse sa pula” o “magdagdag ng asong nakaupo sa bangko” nang hindi na-restart ang proseso. Binabawasan ng dialogic na pag-edit na ito ang trial at error at pinalalapit ang daloy sa pagdidirekta. taga-disenyo ng tao.

Bilang karagdagan, pinapayagan nito pumili ng mga partikular na lugar upang baguhin at igalang ang liwanag, mga anino, at pananaw kapag nagsasama ng mga bagong elemento. Kabilang sa mga pinakakaraniwang aksyon ay tanggalin ang mga bagay, ganap na baguhin ang mga background, muling kulayan ang mga damit o ayusin ang contrast, kulay at itim at puti na may iisang mensahe.

  Ang Google Chrome ay nahaharap sa bagong kumpetisyon mula sa mga browser na pinapagana ng AI

Ang isa pang kapaki-pakinabang na bago ay ang posibilidad ng pagsamahin ang maraming larawan sa isang magkakaugnay na komposisyon. Nag-upload ka ng ilang mga larawan, tinukoy ang layunin, at isinasama ng system ang nilalaman ng isa sa isa, pinapanatili ang konteksto at ang pangkalahatang aesthetics ng eksena.

Salamat sa pagkakapare-parehong ito, nabubuksan ang malikhain at propesyonal na paggamit: mula sa mga ilustrasyon para sa mga kampanya at mga materyales sa pagba-brand sa mga komiks, card, o prototype ng produkto. Ang susi ay ang modelo ay gumagamit ng kaalaman sa mundo mula sa Gemini upang mas maunawaan kung ano ang hinihiling at maipahayag ito sa mas kaunting mga artifact.

Nag-aambag din ito "memorya" sa session, upang ang mga tagubilin ay magkakadena hanggang sa makamit ang ninanais na resulta. Ibig sabihin, hindi na kailangang ulitin ang bawat detalye: naaalala ng system ang estado ng larawang iyong ginagawa.

Kalidad, kaligtasan at kakayahang magamit

Nano Banana Availability sa Gemini

Sa kalidad, itinatampok ng Google ang pag-unlad sa photorealism, na may nakikitang mga pagpapahusay sa mga mukha at kamay, dalawang klasikong kahinaan ng AI. Ang layunin ay para sa mga pagbabago na maisama nang walang putol. natural at anatomically correct, binabawasan ang mga deformation o inconsistencies.

Para sa seguridad, lahat ng nabuo o na-edit na mga imahe ay isinasama SynthID, isang hindi mahahalata na digital watermark para sa madaling pag-verify. Mayroon ding mga filter upang harangan ang nilalaman. marahas o tahasang sekswal at upang maiwasan ang mga sensitibong isyu na kinasasangkutan ng mga tunay na tao o mga kilalang tao.

  Namumuhunan ang Google sa hydroelectric power para mapagana ang mga AI data center nito

Ang access ng end user ay libre mula sa Gemini app, parehong sa web at mga mobile na bersyon (iOS at Android). Nalalapat ang Google mga limitasyon sa paggamit na maaaring i-update sa pana-panahon upang matiyak ang katatagan ng serbisyo.

Para sa mga developer at negosyo, available ang modelo sa pamamagitan ng Google AI Studio y Vertex AINag-aalok ang kumpanya ng isang scheme ng presyo bawat token (hal. $30 bawat milyon) na nakatuon sa masinsinang pagsasama at mga workload na nangangailangan kapasidad sa pag-compute.

Sa pangakong ito, pinalalakas ng Google ang presensya nito sa karera para sa Generative AI laban sa mga karibal gaya ng OpenAI, Adobe o Stability AI. Ang kumbinasyon ng pag-edit sa pakikipag-usap, pagkakapare-pareho ng karakter at mga kontrol sa seguridad ay naglalagay ng "Nano Banana" bilang isang gitnang piraso mula sa platform ng Gemini.

Ang tool ay nakakuha ng pansin sa mga pagtatasa ng komunidad tulad ng LMArena at sa mga pampublikong demonstrasyon, kung saan nakita ang kakayahan nitong magpanatili pagkakakilanlan at istilo sa pamamagitan ng paglilipat ng parehong paksa sa iba't ibang setting na may mga simpleng tagubilin.

Ang "Nano Banana" ay humuhubog upang maging isang praktikal na paraan para sa sinumang makapag-edit at makabuo ng mga larawan nang walang advanced na kaalaman: Malinaw na mga tagubilin, pare-parehong mga resulta, at direktang pagsasama sa Gemini na nag-aalis ng pangangailangang mag-install ng karagdagang software.

Kaugnay na artikulo:
Mga modernong pag-unlad ng teknolohiya: epekto at hinaharap

Mag-iwan ng komento