Ndërsa shtohen falsifikimet e thella, OpenAI po përmirëson teknologjinë e përdorur për klonimin e zërave – por kompania këmbëngul se po e bën këtë me përgjegjësi.
Sot shënon debutimin paraprak të OpenAI’s Voice Engine, një zgjerim i API-së ekzistuese tekst-në-fjalë të kompanisë. Në zhvillim për rreth dy vjet, Voice Engine i lejon përdoruesit të ngarkojnë çdo mostër zëri prej 15 sekondash për të gjeneruar një kopje sintetike të atij zëri. Por nuk ka ende një datë për disponueshmërinë publike, duke i dhënë kompanisë kohë për t’u përgjigjur se si modeli përdoret dhe abuzohet.
“Ne duam të sigurohemi që të gjithë të ndihen mirë për mënyrën se si po vendoset – se ne e kuptojmë peizazhin se ku kjo teknologji është e rrezikshme dhe ne kemi masa zbutëse për këtë,” tha Jeff Harris, një anëtar i stafit të produktit në OpenAI. TechCrunch në një intervistë.
Trajnimi i modelit
Modeli gjenerues i AI që fuqizon Voice Engine është fshehur në pamje të qartë për disa kohë, tha Harris.
I njëjti model mbështet aftësitë e zërit dhe të “leximit me zë të lartë” në ChatGPT, chatbot i hapur me AI të OpenAI, si dhe zërat e paracaktuar të disponueshëm në API-në e tekstit në të folur të OpenAI. Dhe Spotify e ka përdorur atë që nga fillimi i shtatorit për të dubuar podkaste për hostë të profilit të lartë si Lex Fridman në gjuhë të ndryshme.
E pyeta Harrisin se nga erdhën të dhënat e trajnimit të modeles – një temë paksa prekëse. Ai do të thoshte vetëm se modeli Voice Engine ishte trajnuar mbi një përzierje të të dhënave të licencuara dhe të disponueshme publikisht.
Modele si ai që fuqizon Voice Engine janë trajnuar në një numër të madh shembujsh – në këtë rast, regjistrime të të folurit – zakonisht me burim nga faqet publike dhe grupe të dhënash në ueb. Shumë shitës gjenerues të AI i shohin të dhënat e trajnimit si një avantazh konkurrues dhe kështu i mbajnë ato dhe informacionet në lidhje me të afër gjoksit. Por detajet e të dhënave të trajnimit janë gjithashtu një burim i mundshëm i padive të lidhura me IP, një tjetër dekurajues për të zbuluar shumë.




