Bashkohuni në Newsletter

    Lexoni lajmet e fundit të teknologjisë në e-mailin tuaj

    What's Hot

    Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

    May 26, 2026

    Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

    May 26, 2026

    Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

    May 26, 2026
    Facebook X (Twitter) Instagram
    • Tech
    • Gadgets
    Facebook X (Twitter) Instagram YouTube LinkedIn
    Technews.alTechnews.al
    • Home
    • Tech

      Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

      May 26, 2026

      Kaos në rrjet: Një i ftuar në një emision të Fox News duket se mban maskë ultra-realiste njerëzore

      May 25, 2026

      Britania: Interneti nuk është i sigurt për fëmijët/ Algoritmet promovojnë mesazhe të paligjshme

      May 25, 2026

      Future2Tech rikthehet më 24-25 shtator në Pallatin e Kongreseve

      May 25, 2026

      3 pyetjet që çdo profesionist duhet t’i bëjë vetes para se të dërgojë një email apo të flasë në një takim

      May 22, 2026
    • Mobiles

      Androidi “jua lexon mendjen”? Funksioni i ri e di saktësisht çfarë do të bëni më pas

      May 18, 2026

      Ja cili smartphone është shitur më shumë se çdo telefon tjetër në botë deri më tani këtë vit

      May 7, 2026

      Redmi thuhet se po punon në tre telefona inteligjentë me bateri 10,000 mAh

      April 27, 2026

      Europa kërkon që të gjithë smartfonët e shitur në BE të kenë bateri të zëvendësueshme nga viti 2027

      April 22, 2026

      Cila është ngjyra më e shitur e iPhone 17?

      April 16, 2026
    • Gadgets

      Samsung dhe Google sjellin syzet me AI, teknologjia që synon të zëvendësojë telefonin në shumë momente të ditës

      May 25, 2026

      Japonezët shpikin jastëkun inteligjent që zbulon rreziqet gjatë gjumit (FOTO)

      April 24, 2026

      Televizori juaj smart po bën 7,200 screenshots sekrete të ekranit çdo orë – Ja si ta ndaloni

      April 22, 2026

      Burri krijon nëndetëse të vogël që papagalli i tij të përjetojë jetën nën ujë

      April 17, 2026

      Samsung prezanton ekranin 3D pa syze me përmbajtje të mundësuar nga IA

      April 8, 2026
    • Gaming

      Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

      May 26, 2026

      Rritja e çmimeve të PlayStation Plus shkakton reagime negative nga lojtarët, ndërsa Sony rrit abonimet

      May 20, 2026

      VRR, teknologjia që po bëhet thelbësore për televizorët modernë

      April 3, 2026

      143 milionë njerëz trajnuan për 8 vite hartën me IA duke luajtur Pokémon GO

      March 27, 2026

      Epic Games pushon nga puna 1,000 punonjës për shkak të rënies së Fortnite

      March 25, 2026
    • AI

      Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

      May 26, 2026

      Sam Altman përballet me pyetje të vështira gjatë marrjes në pyetje në gjykatë

      May 18, 2026

      Si e ndryshoi Inteligjenca Artificiale shahun përgjithmonë – për mirë

      May 18, 2026

      Mira Murati dëshmon në gjyqin Musk-Altman: Sam krijonte kaos në OpenAI

      May 15, 2026

      “Do flasë si njeri”/ Mira Murati zbulon teknologjinë që mund të ndryshojë përgjithmonë Inteligjencën Artificiale

      May 15, 2026
    • Social Media

      Meta akuzohet se po përdor “momfluencers” për të promovuar llogaritë e adoleshentëve në rrjetet sociale

      May 22, 2026

      “Instagrami është për vajza” – deklarata e Elon Musk ndez debat

      May 19, 2026

      Instagram lançon Instants për ndarjen e fotove të përkohshme me njerëz specifikë

      May 15, 2026

      A po bëhen rrjetet sociale më të këqija me qëllim? Fenomeni që po zemëron përdoruesit në mbarë botën

      May 14, 2026

      A po ju dëgjon Facebook? Arsyeja pse reklamat duken “shumë personale”

      May 13, 2026
    • Apps

      e-Albania 2.0, platforma e re që synon shërbime publike më të shpejta dhe më të aksesueshme

      May 20, 2026

      Shërbimet e e-Albania do të ndërpriten për tre ditë – Ja çfarë duhet të dini

      May 13, 2026

      Si përdoren komentet, like-et dhe kërkimet tuaja për t’ju manipuluar online

      May 11, 2026

      Absurditet në epokën e ‘IA’: Njerëzit po paguajnë fjalë për fjalë 1.99 dollarë…

      April 30, 2026

      Skema bullgare që mashtroi Spotify për 1 milion dollarë, pa shkelur asnjë ligj

      April 22, 2026
    Technews.alTechnews.al
    Home » Typography Elements » Cili chatbot është më i miri në matematikë? Gemini, ChatGPT, Grok vihen në provë
    Artificial Intelligence

    Cili chatbot është më i miri në matematikë? Gemini, ChatGPT, Grok vihen në provë

    Tech ExpertBy Tech ExpertDecember 30, 2025Updated:December 30, 20251 Comment3 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Inteligjenca Artificiale (IA) po bëhet një pjesë integrale e jetës së përditshme, duke përfshirë llogaritjet e përditshme. Por sa mirë i trajtojnë këto sisteme në të vërtetë matematikën bazë? Dhe sa duhet t’u besojnë përdoruesit atyre?

    Një studim i kohëve të fundit këshillon kujdes. Hulumtimi Omni mbi Llogaritjen në IA (ORCA) tregon se kur i kërkoni një chatboti të IA-së të kryejë matematikë të përditshme, ka afërsisht 40 përqind shanse që ai të japë përgjigjen e gabuar. Saktësia ndryshon ndjeshëm në të gjitha kompanitë e IA-së dhe në të gjitha llojet e ndryshme të detyrave matematikore.

    Pra, cilat mjete të IA-së janë më të sakta dhe si performojnë ato në lloje të ndryshme llogaritjesh, të tilla si statistika, financa ose fizika?

    Rezultatet bazohen në performancën në 500 pyetje të nxjerra nga probleme të llogaritshme të botës reale. Çdo model i IA-së u testua duke përdorur të njëjtin grup prej 500 pyetjesh. Pesë modelet e IA-së u testuan në tetor 2025.

    Modelet e zgjedhura janë:

    ChatGPT-5 (OpenAI)
    Gemini 2.5 Flash (Google)
    Claude 4.5 Sonnet (Anthropic)
    DeepSeek V3.2 (DeepSeek AI)
    Grok-4 (xAI).

    Testi ORCA Benchmark zbuloi se asnjë model i IA-së nuk mori rezultate mbi 63 përqind në matematikën e përditshme. Kryesuesi, Gemini (63 përqind), ende zgjidh pothuajse 4 nga 10 probleme gabim. Grok ka pothuajse të njëjtin rezultat me 62.8 përqind. DeepSeek renditet i treti me 52 përqind. ChatGPT vjen pas me 49.4 përqind, dhe Claude vjen i fundit me 45.2 përqind.

    Mesatarja e thjeshtë e pesë modeleve është 54.5 përqind. Këto rezultate pasqyrojnë performancën e përgjithshme të modeleve në të gjitha 500 pyetjet.

    “Edhe pse renditja e saktë mund të ndryshojë nëse do ta përsërisnim pikën referuese sot, përfundimi më i gjerë ka të ngjarë të mbetet i njëjtë: besueshmëria numerike mbetet një pikë e dobët në të gjitha modelet aktuale të IA-së”, tha për Euronews Next Dawid Siuda, bashkautor i ORCA Benchmark.

    Saktësia më e lartë në matematikë dhe konvertime, më e ulëta në fizikë

    Performanca e tyre ndryshon në kategori të ndryshme. Në matematikë dhe konvertime (147 nga 500 pyetje), Gemini kryeson me 83 përqind, e ndjekur nga Grok me 76.9 përqind dhe DeepSeek me 74.1 përqind. ChatGPT shënon 66.7 përqind në këtë kategori.

    Saktësia mesatare e thjeshtë në të pesë modelet është 72.1 përqind, më e larta midis shtatë kategorive.

    Në të kundërt, fizika (128 pyetje) është kategoria më e dobët, me një saktësi mesatare prej vetëm 35.8 përqind. Grok performon më mirë me 43.8 përqind, pak përpara Gemini me 43 përqind, ndërsa Claude bie në 26.6 përqind.

    Në shtatë kategoritë, Gemini dhe Grok renditen të parët në tre, dhe ndajnë vendin e parë në një.

    Lexo edhe: ChatGPT, Gemini, Grok dhe të tjerë: Cilat vende përdorin më shumë mjete të IA-së gjeneruese në Europë?

    Saktësia e DeepSeek është vetëm 11 përqind në biologji dhe kimi.

    DeepSeek regjistroi saktësinë më të ulët në të gjitha kategoritë në biologji dhe kimi me 10.6 përqind. Kjo do të thotë që modeli nuk arriti të japë një përgjigje të saktë në afërsisht nëntë nga dhjetë pyetje.

    Boshllëqet më të mëdha të performancës shfaqen në financë dhe ekonomi. Grok dhe Gemini arrijnë nivele saktësie prej 76.7 përqind, ndërsa tre modelet e tjera, të cilat janë ChatGPT, Claude dhe DeepSeek, bien nën 50 përqind.

    Paralajmërim për përdoruesit: Gjithmonë kontrolloni dy herë me një makinë llogaritëse.

    “Nëse detyra është kritike, përdorni kalkulatorë ose burime të provuara, ose të paktën kontrolloni dy herë me një tjetër IA,” tha Siuda.

    featured
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Tech Expert

    Related Posts

    Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

    May 26, 2026

    Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

    May 26, 2026

    Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

    May 26, 2026

    Britania: Interneti nuk është i sigurt për fëmijët/ Algoritmet promovojnë mesazhe të paligjshme

    May 25, 2026
    View 1 Comment

    1 Comment

    1. Pingback: Një epokë e re e blerjeve me AI: Si po i zgjedhin algoritmet markat - Technews.al

    Leave A Reply Cancel Reply

    Editors Picks

    Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

    May 26, 2026

    Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

    May 26, 2026

    Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

    May 26, 2026

    Britania: Interneti nuk është i sigurt për fëmijët/ Algoritmet promovojnë mesazhe të paligjshme

    May 25, 2026
    Top Reviews
    9.1

    9 mënyra për të rregulluar gabimin e pritjes për aktivizim në iMessage dhe FaceTime

    By Tech Expert
    8.9

    Apple Pencil është lapsi më i mirë për përdoruesit e iPad – ja çfarë të merrni dhe si ta përdorni

    By Tech Expert
    8.9

    Apple po kalon plotësisht në USB-C, pasi teknologjia e karikimit është vendosur të vijë në iPhone. Ja çfarë do të thotë për përdoruesit.

    By Tech Expert
    Technews.al
    Facebook X (Twitter) Instagram YouTube LinkedIn
    • Home
    • Tech
    • Kategori
    • Kontakt
    © 2026 Designed by Technews.al

    Type above and press Enter to search. Press Esc to cancel.