Studiuesit nga Stanford dhe Universiteti i Uashingtonit kanë krijuar një model të ri “arsyetimi” të AI, të quajtur s1, për vetëm 50 dollarë në kredite kompjuterike. Ky model, i publikuar në GitHub së bashku me kodin dhe të dhënat për trajnimin, rivalizon modelet e avancuara si o1 i OpenAI dhe R1 i DeepSeek në aftësitë matematikore dhe koduese.
Ekipi arriti këtë sukses duke përdorur distilimin, një metodë që transferon aftësitë “arsyetimi” nga një model më i madh. Ata e bazuan s1 tek Gemini 2.0 Flash Thinking Experimental i Google, duke krijuar një grup të dhënash me 1000 pyetje dhe përgjigje të kuruara me kujdes.
Procesi i trajnimit zgjati më pak se 30 minuta dhe përdori 16 GPU Nvidia H100. Studiuesit zbuluan gjithashtu një truk të thjeshtë, por efektiv: shtimi i fjalës “prit” gjatë përgjigjeve përmirësoi saktësinë e modelit.
Lexo edhe: OpenAI sapo u ribrandua dhe kjo është logoja e re (FOTO)
Ky zhvillim tregon se inovacionet e AI nuk janë të rezervuara vetëm për kompanitë me buxhete miliardëshe. Megjithatë, ai ngre pyetje mbi komoditizimin e modeleve të avancuara dhe ndikimin që kjo mund të ketë në konkurrencën teknologjike.




