Muzika gjeneruese del nga laboratori dhe futet në telefon. Google shtyp butonin “play”. Dhe e bën këtë me një emër skenik: Lyria 3. Është modeli më i fundit gjenerues audio i Google DeepMind, tani i integruar në aplikacionin Gemini. Përkthim: shkruaj një fjali, merr një këngë. Në 30 sekonda.
Nuk është një sintetizues. Është një jukebox që lexon sugjerime.
Mekanizmi është i thjeshtë. Ju përshkruani një ide – ‘R&B i ngadaltë, komik për një çorape që gjen shpirtin e tij binjak’ – dhe Gemini kompozon një këngë të plotë, duke përfshirë tekstet. Nuk keni nevojë të dini si të shkruani vargje. Lyria 3 i gjeneron ato. Nuk keni nevojë të dini BPM. Mund t’i kërkoni. Nuk keni nevojë për një grup muzikor. Një frazë është e mjaftueshme.
Platforma krijon këngë 30-sekondëshe, me kopertinë të gjeneruar nga Nano Banana, gati për t’u shkarkuar ose ndarë me një lidhje. Nuk është albumi i vitit. Është kolona zanore e përditshmërisë. Një meme që luhet, një mesazh zanor me ritëm, një kartolinë përshëndetëse e shndërruar në një mini-hit.
Krahasuar me versionin e mëparshëm, hapi është teknik. Lyria 3 shkruan automatikisht tekste nga kërkesa. Ofron më shumë kontroll mbi stilin, vokalet dhe ritmet në minutë. Dhe mbi të gjitha, përmirëson realizmin: struktura muzikore më komplekse, më pak aranzhime mekanike, një ndjesi më ‘njerëzore’. Është ndryshimi midis një zileje polifonike dhe një demo në studio shtëpiake.
Prapa skenave ekziston një model multimodal. Nuk funksionon vetëm me tekst. Mund të fillojë nga imazhe, dokumente, diapozitiva. Ngarkoni fotografi të qenit në pyll dhe merrni një baladë indie. Vendosni një prezantim të korporatës dhe bëhet një xhingël motivues. Është logjika e modeleve të mëdha gjuhësore të aplikuara në audio: tokena që nuk janë vetëm fjalë, por nota, timbre, ritme. Nëse chatbot-et parashikojnë fjalën tjetër, Lyria parashikon notën e duhur.
Audienca e synuar nuk është vetëm kurioziteti. Janë krijuesit. Lyria 3 vjen gjithashtu në Dream Track të YouTube dhe shtrihet tek krijuesit jashtë SHBA-së. Në një ekosistem ku ngarkohen miliona filma të shkurtër çdo ditë, kolona zanore është identiteti. Një këngë e personalizuar vlen më shumë se muzika standarde. Është markë e menjëhershme e zërit.
Lexo edhe: Samsung rikthen Bixby si asistent i IA për të sfiduar Siri dhe Alexa
Nyja e të drejtave të autorit mbetet. Të gjitha këngët e gjeneruara në aplikacionin Gemini përfshijnë SynthID, filigranin dixhital të padukshëm të Google. Ai shërben për të identifikuar përmbajtjen e gjeneruar nga IA. Madje mund të ngarkoni një skedar audio dhe ta pyesni Gemini nëse është prodhuar me IA të Google. Është rripi i sigurimit i IA muzikore. Nuk eliminon trafikun, por ndez dritat.
Google premton vëmendje ndaj të drejtave dhe filtrave për të shmangur imitimet direkte të artistëve ekzistues. Nëse citoni një emër të famshëm, sistemi e interpreton atë si një frymëzim të gjerë, jo si një kopje. Megjithatë, vija është e hollë. Dhe tregu i muzikës, mbi 30 miliardë dollarë amerikanë në vit në nivel global, nuk është garazh për eksperimente.
Lyria 3 nuk i zëvendëson muzikantët. Ajo ndryshon aksesin. Ashtu siç bëri Instagram me fotografinë. Ashtu siç bënë chatbot-et me shkrimin. Pyetja e vërtetë nuk është nëse inteligjenca artificiale do të shkruajë një hit. Është se sa mikro-këngë të personalizuara do të dëgjojmë çdo ditë.





2 Comments
Pingback: Pentagoni i kërkon Anthropic akses pa kufizime mbi IA, por kompania refuzon - Technews.al
Pingback: Gemini i Google Home tani sheh transmetime të drejtpërdrejta të kamerave - Technews.al