Gjenerimi i imazheve me IA gjeneruese është bërë një mjet i përdorur gjerësisht si për individët ashtu edhe për bizneset, duke u lejuar atyre të krijojnë menjëherë pamjet e tyre të synuara pa pasur nevojë për ndonjë ekspertizë në dizajn. Në thelb, këto mjete mund të përshpejtojnë detyrat që përndryshe do të merrnin një sasi të konsiderueshme kohe, duke i përfunduar ato në vetëm sekonda.

Me përparimin e teknologjisë dhe konkurrencës, janë publikuar shumë produkte moderne dhe të përparuara të gjenerimit të imazheve, të tilla si Stable Diffusion, Midjourney, DALL-E, Imagen dhe shumë të tjera. Secili ofron avantazhe unike për përdoruesit e tij. Megjithatë, Google kohët e fundit pati një ndikim të rëndësishëm në peizazhin e gjenerimit të imazheve me publikimin e Gemini 2.5 Flash Image (ose nano-banana).
Nano-banana është modeli i avancuar i gjenerimit dhe redaktimit të imazheve i Google, që paraqet aftësi si krijimi realist i imazheve, përzierja e shumë imazheve, qëndrueshmëria e personazheve, transformimet e synuara të bazuara në kërkesa dhe aksesueshmëria publike. Modeli ofron kontroll shumë më të madh se modelet e mëparshme nga Google ose konkurrentët e saj.

Ky artikull do të shqyrtojë aftësinë e nano-banana për të gjeneruar dhe redaktuar imazhe. Ne do t’i demonstrojmë këto veçori duke përdorur platformën Google AI Studio dhe Gemini API brenda një mjedisi Python.
Le të fillojmë.
Testimi i Modelit Nano-Banana
Për të ndjekur këtë tutorial, do të duhet të regjistroheni për një llogari Google dhe të identifikoheni në Google AI Studio. Gjithashtu do t’ju duhet të merrni një çelës API për të përdorur Gemini API, i cili kërkon një plan të paguar pasi nuk ka një nivel falas në dispozicion.
Nëse preferoni të përdorni API me Python, sigurohuni që të instaloni bibliotekën Google Generative AI me komandën e mëposhtme:
pip install google-genai
Pasi të jetë konfiguruar llogaria juaj, le të shqyrtojmë se si të përdorni modelin nano-banana.
Së pari, shkoni te Google AI Studio dhe zgjidhni modelin Gemini-2.5-flash-image-preview, i cili është modeli nano-banana që do të përdorim.
Me modelin e zgjedhur, mund të filloni një bisedë të re për të gjeneruar një imazh nga një kërkesë. Siç sugjeron Google, një parim themelor për të marrë rezultatet më të mira është të përshkruani skenën, jo vetëm të listoni fjalët kyçe. Kjo qasje narrative, që përshkruan imazhin që imagjinoni, zakonisht prodhon rezultate superiore.

Në ndërfaqen e bisedës së AI Studio, do të shihni një platformë si ajo më poshtë ku mund të futni kërkesën tuaj.
Ne do të përdorim kërkesën e mëposhtme për të gjeneruar një imazh fotorealist për shembullin tonë.
Një portret fotorealist nga afër i një artizaneje indoneziane të batikut, me duart e lyer me dyll, duke vizatuar një motiv rrjedhës në pëlhurë indigo me një stilolaps të pjerrët. Ajo punon në një tavolinë druri në një verandë me erë; tekstilet e palosura dhe enët e bojës turbullohen pas saj. Drita e dritares së mëngjesit të vonë depërton nëpër pëlhurë, duke zbuluar vija të holla dylli dhe fibrat e drurit tik. Kapur në një 85 mm në f/2 për ndarje të butë dhe bokeh kremoz. Atmosfera e përgjithshme është e fokusuar, prekëse dhe krenare.

Imazhi i gjeneruar tregohet më poshtë:
Siç mund ta shihni, imazhi i gjeneruar është realist dhe i përmbahet me besnikëri kërkesës së dhënë.





2 Comments
Pingback: Italia miraton ligje të guximshme për inteligjencën artificiale: dënime të rënda për deepfakes - Technews.al
Pingback: Gemini po vjen në Google TV dhe sjell një mori veçorish të reja - Technews.al