Meta po krijon gjuhën e saj të "Machine Learning"

Ky nuk është një sistem me të cilin mund të flisni, por, përkundrazi, një mjet kërkimi që Meta shpreson që të tjerët ta përdorin për të zgjidhur disa nga problemet që mundojnë modelet e gjuhës së AI.

Zhurma e teknologjisë këto javët e fundit është përqendruar drejtpërdrejt në modelet e gjuhës të zhvilluara dhe të vendosura nga Microsoft, Google dhe OpenAI. Por Meta, kompania mëmë e Facebook, vazhdon të bëjë punë të rëndësishme në këtë fushë dhe po nxjerr sot një gjenerator të ri të gjuhës AI të quajtur LLaMA.

LLaMA nuk është si ChatGPT ose Bing; nuk është një sistem me të cilin mund të flasë kushdo. Përkundrazi, është një mjet kërkimi që Meta thotë se po e ndan me shpresën për të “demokratizuar aksesin në këtë fushë të rëndësishme, që ndryshon me shpejtësi”. Me fjalë të tjera: për të ndihmuar ekspertët të zgjidhin problemet e modeleve të gjuhës së AI, nga paragjykimi dhe toksiciteti deri te tendenca e tyre për të krijuar thjesht informacion.

Për këtë qëllim, Meta po lëshon LLaMA (i cili në fakt nuk është një sistem i vetëm, por një kuartet modelesh me përmasa të ndryshme) nën “një licencë jokomerciale të fokusuar në rastet e përdorimit të kërkimit”, me akses të dhënë për grupe si universitetet, OJQ-të dhe laboratorët e industrisë. .

“Ne besojmë se i gjithë komuniteti i AI – studiues akademikë, shoqëria civile, politikëbërësit dhe industria – duhet të punojnë së bashku për të zhvilluar udhëzime të qarta rreth AI përgjegjëse në përgjithësi dhe modele të përgjegjshme gjuhësore të mëdha në veçanti”, shkroi kompania në postimin e saj. “Ne presim të shohim se çfarë mund të mësojë komuniteti – dhe përfundimisht të ndërtojë – duke përdorur LLaMA.”

Në një punim kërkimor, Meta pretendon se versioni i dytë më i vogël i modelit LLaMA, LLaMA-13B, performon më mirë se modeli popullor GPT-3 i OpenAI “në shumicën e standardeve”, ndërsa më i madhi, LLaMA-65B, është “konkurrues me modelet më të mira”, si Chinchilla70B e DeepMind dhe PaLM 540B e Google. (Numrat në këta emra i referohen miliarda parametrave në secilin model – një masë e madhësisë së sistemit dhe një përafrim i përafërt i sofistikimit të tij, megjithëse këto dy cilësi nuk janë domosdoshmërisht të shkallëzuara.)

Pasi të trajnohet, LLaMA-13B mund të funksionojë gjithashtu në një GPU të vetme të klasës së qendrës së të dhënave Nvidia Tesla V100. Ky do të jetë një lajm i mirëpritur për institucionet më të vogla që dëshirojnë të kryejnë teste në këto sisteme, por nuk do të thotë shumë për studiuesit e vetmuar për të cilët një pajisje e tillë është e paarritshme.

Lëshimi i Meta-s është gjithashtu i dukshëm pjesërisht për shkak se i ka humbur disa nga zhurmat që rrethojnë chatbot-et e AI. (Megjithatë, kjo mund të mos jetë një gjë e keqe, duke pasur parasysh kritikat që Microsoft ka marrë për nxitimin e lëshimit të Bing dhe rënies së çmimit të aksioneve të Google pasi chatbot-i i tij bëri një gabim në një demonstrim.)

Meta në të vërtetë ka lëshuar chatbot-et e veta të aksesueshme me AI në të kaluarën, por pritja ka qenë më pak se yjore. Njëri, i quajtur BlenderBot, u kritikua se ishte thjesht… jo shumë i mirë, ndërsa një tjetër, i quajtur Galactica, i cili ishte krijuar për të shkruar punime shkencore, u tërhoq jashtë linje pas vetëm tre ditësh pasi vazhdonte të prodhonte marrëzi shkencore.

Me kuartetin LLaMA, Meta me sa duket shpreson për një pritje më të këndshme.

“Sot ne po nxjerrim një model të ri të gjuhës së madhe të teknologjisë artificiale, të quajtur LLaMA, i krijuar për të ndihmuar kërkuesit të avancojnë punën e tyre”, tha CEO Mark Zuckerberg në një postim në Facebook. “LLM-të kanë treguar shumë premtime në gjenerimin e tekstit, bisedat, përmbledhjen e materialit të shkruar dhe detyrat më të ndërlikuara si zgjidhja e teoremave të matematikës ose parashikimi i strukturave proteinike. Meta është e përkushtuar ndaj këtij modeli të hapur kërkimi dhe ne do ta bëjmë modelin tonë të ri të disponueshëm për komunitetin e kërkimit të AI.”

Bashkohuni në Newsletter

What's Hot

Meta po krijon gjuhën e saj të “Machine Learning”

Related Posts

Leave A Reply Cancel Reply