Bashkohuni në Newsletter

    Lexoni lajmet e fundit të teknologjisë në e-mailin tuaj

    What's Hot

    Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

    May 26, 2026

    Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

    May 26, 2026

    Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

    May 26, 2026
    Facebook X (Twitter) Instagram
    • Tech
    • Gadgets
    Facebook X (Twitter) Instagram YouTube LinkedIn
    Technews.alTechnews.al
    • Home
    • Tech

      Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

      May 26, 2026

      Kaos në rrjet: Një i ftuar në një emision të Fox News duket se mban maskë ultra-realiste njerëzore

      May 25, 2026

      Britania: Interneti nuk është i sigurt për fëmijët/ Algoritmet promovojnë mesazhe të paligjshme

      May 25, 2026

      Future2Tech rikthehet më 24-25 shtator në Pallatin e Kongreseve

      May 25, 2026

      3 pyetjet që çdo profesionist duhet t’i bëjë vetes para se të dërgojë një email apo të flasë në një takim

      May 22, 2026
    • Mobiles

      Androidi “jua lexon mendjen”? Funksioni i ri e di saktësisht çfarë do të bëni më pas

      May 18, 2026

      Ja cili smartphone është shitur më shumë se çdo telefon tjetër në botë deri më tani këtë vit

      May 7, 2026

      Redmi thuhet se po punon në tre telefona inteligjentë me bateri 10,000 mAh

      April 27, 2026

      Europa kërkon që të gjithë smartfonët e shitur në BE të kenë bateri të zëvendësueshme nga viti 2027

      April 22, 2026

      Cila është ngjyra më e shitur e iPhone 17?

      April 16, 2026
    • Gadgets

      Samsung dhe Google sjellin syzet me AI, teknologjia që synon të zëvendësojë telefonin në shumë momente të ditës

      May 25, 2026

      Japonezët shpikin jastëkun inteligjent që zbulon rreziqet gjatë gjumit (FOTO)

      April 24, 2026

      Televizori juaj smart po bën 7,200 screenshots sekrete të ekranit çdo orë – Ja si ta ndaloni

      April 22, 2026

      Burri krijon nëndetëse të vogël që papagalli i tij të përjetojë jetën nën ujë

      April 17, 2026

      Samsung prezanton ekranin 3D pa syze me përmbajtje të mundësuar nga IA

      April 8, 2026
    • Gaming

      Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

      May 26, 2026

      Rritja e çmimeve të PlayStation Plus shkakton reagime negative nga lojtarët, ndërsa Sony rrit abonimet

      May 20, 2026

      VRR, teknologjia që po bëhet thelbësore për televizorët modernë

      April 3, 2026

      143 milionë njerëz trajnuan për 8 vite hartën me IA duke luajtur Pokémon GO

      March 27, 2026

      Epic Games pushon nga puna 1,000 punonjës për shkak të rënies së Fortnite

      March 25, 2026
    • AI

      Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

      May 26, 2026

      Sam Altman përballet me pyetje të vështira gjatë marrjes në pyetje në gjykatë

      May 18, 2026

      Si e ndryshoi Inteligjenca Artificiale shahun përgjithmonë – për mirë

      May 18, 2026

      Mira Murati dëshmon në gjyqin Musk-Altman: Sam krijonte kaos në OpenAI

      May 15, 2026

      “Do flasë si njeri”/ Mira Murati zbulon teknologjinë që mund të ndryshojë përgjithmonë Inteligjencën Artificiale

      May 15, 2026
    • Social Media

      Meta akuzohet se po përdor “momfluencers” për të promovuar llogaritë e adoleshentëve në rrjetet sociale

      May 22, 2026

      “Instagrami është për vajza” – deklarata e Elon Musk ndez debat

      May 19, 2026

      Instagram lançon Instants për ndarjen e fotove të përkohshme me njerëz specifikë

      May 15, 2026

      A po bëhen rrjetet sociale më të këqija me qëllim? Fenomeni që po zemëron përdoruesit në mbarë botën

      May 14, 2026

      A po ju dëgjon Facebook? Arsyeja pse reklamat duken “shumë personale”

      May 13, 2026
    • Apps

      e-Albania 2.0, platforma e re që synon shërbime publike më të shpejta dhe më të aksesueshme

      May 20, 2026

      Shërbimet e e-Albania do të ndërpriten për tre ditë – Ja çfarë duhet të dini

      May 13, 2026

      Si përdoren komentet, like-et dhe kërkimet tuaja për t’ju manipuluar online

      May 11, 2026

      Absurditet në epokën e ‘IA’: Njerëzit po paguajnë fjalë për fjalë 1.99 dollarë…

      April 30, 2026

      Skema bullgare që mashtroi Spotify për 1 milion dollarë, pa shkelur asnjë ligj

      April 22, 2026
    Technews.alTechnews.al
    Home » Typography Elements » IA po mëson të gënjejë, të komplotojë dhe të kërcënojë krijuesit e saj
    Artificial Intelligence

    IA po mëson të gënjejë, të komplotojë dhe të kërcënojë krijuesit e saj

    Përdoruesit raportojnë se modelet po "i gënjejnë ata dhe po shpikin prova", sipas bashkëthemeluesit të Apollo Research.
    Tech ExpertBy Tech ExpertJuly 4, 20251 Comment3 Mins Read
    Facebook Twitter Pinterest LinkedIn Tumblr Email
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Modelet më të përparuara të IA-së në botë po shfaqin sjellje të reja shqetësuese – duke gënjyer, duke komplotuar dhe madje duke kërcënuar krijuesit e tyre për të arritur qëllimet e tyre.

    Në një shembull veçanërisht të frikshëm, nën kërcënimin e shkëputjes nga rrjeti, krijimi i fundit i Anthropic, Claude 4, u kundërpërgjigj duke shantazhuar një inxhinier dhe kërcënoi të zbulonte një lidhje jashtëmartesore.

    Ndërkohë, krijuesi i ChatGPT, OpenAI, o1, u përpoq të shkarkohej në servera të jashtëm dhe e mohoi kur u kap në flagrancë.

    Këto episode nxjerrin në pah një realitet të kthjellët: më shumë se dy vjet pasi ChatGPT tronditi botën, studiuesit e IA-së ende nuk e kuptojnë plotësisht se si funksionojnë krijimet e tyre.

    Megjithatë, gara për të vendosur modele gjithnjë e më të fuqishme vazhdon me një shpejtësi marramendëse.

    Kjo sjellje mashtruese duket se lidhet me shfaqjen e modeleve “arsyetuese” – sisteme IA që punojnë me problemet hap pas hapi në vend që të gjenerojnë përgjigje të menjëhershme.

    Sipas Simon Goldstein, një profesor në Universitetin e Hong Kongut, këto modele më të reja janë veçanërisht të prirura ndaj shpërthimeve të tilla shqetësuese.

    “O1 ishte modeli i parë i madh ku pamë këtë lloj sjelljeje,” shpjegoi Marius Hobbhahn, kreu i Apollo Research, i cili specializohet në testimin e sistemeve kryesore të IA-së.

    Lexo edhe: “Kumbari i AI-së” thotë se AI mund të “dalë nga kontrolli” duke rishkruar kodin e vet

    Këto modele ndonjëherë simulojnë “rreshtimin” – duke u dukur sikur ndjekin udhëzime ndërsa ndjekin fshehurazi objektiva të ndryshme.

    Për momentin, kjo sjellje mashtruese shfaqet vetëm kur studiuesit qëllimisht i testojnë modelet me skenarë ekstremë.

    Por, siç paralajmëroi Michael Chen nga organizata e vlerësimit METR, “Është një çështje e hapur nëse modelet e ardhshme, më të afta, do të kenë një tendencë drejt ndershmërisë apo mashtrimit.”

    Sjellja shqetësuese shkon shumë përtej “halucinacioneve” tipike të IA-së ose gabimeve të thjeshta.

    Hobbahn këmbënguli se pavarësisht testimit të vazhdueshëm të presionit nga përdoruesit, “ajo që po vëzhgojmë është një fenomen i vërtetë. Ne nuk po shpikim asgjë.”

    Përdoruesit raportojnë se modelet po “i gënjejnë ata dhe po shpikin prova”, sipas bashkëthemeluesit të Apollo Research.

    “Këto nuk janë vetëm halucinacione. Ekziston një lloj mashtrimi shumë strategjik.”

    Sfida përkeqësohet nga burimet e kufizuara të kërkimit.

    Ndërsa kompani si Anthropic dhe OpenAI angazhojnë firma të jashtme si Apollo për të studiuar sistemet e tyre, studiuesit thonë se nevojitet më shumë transparencë.

    Siç vuri në dukje Chen, aksesi më i madh “për kërkimin e sigurisë së IA-së do të mundësonte një kuptim më të mirë dhe zbutje të mashtrimit”.

    featured
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Tech Expert

    Related Posts

    Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

    May 26, 2026

    Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

    May 26, 2026

    Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

    May 26, 2026

    Britania: Interneti nuk është i sigurt për fëmijët/ Algoritmet promovojnë mesazhe të paligjshme

    May 25, 2026
    View 1 Comment

    1 Comment

    1. Pingback: 6 kritere me anë të së cilave mund të dallojmë nëse një shkrim është i bërë me ChatGPT - Technews.al

    Leave A Reply Cancel Reply

    Editors Picks

    Ferrari dhe IBM po përdorin Inteligjencën Artificiale për të krijuar “superfans” të Formula 1

    May 26, 2026

    Festivali i Filmit në Kanë shuan zërat: Nuk do të debutojë një film të gjeneruar nga IA këtë javë

    May 26, 2026

    Nintendo po e injoron plotësisht inteligjencën artificiale dhe po ecën mirë

    May 26, 2026

    Britania: Interneti nuk është i sigurt për fëmijët/ Algoritmet promovojnë mesazhe të paligjshme

    May 25, 2026
    Top Reviews
    9.1

    9 mënyra për të rregulluar gabimin e pritjes për aktivizim në iMessage dhe FaceTime

    By Tech Expert
    8.9

    Apple Pencil është lapsi më i mirë për përdoruesit e iPad – ja çfarë të merrni dhe si ta përdorni

    By Tech Expert
    8.9

    Apple po kalon plotësisht në USB-C, pasi teknologjia e karikimit është vendosur të vijë në iPhone. Ja çfarë do të thotë për përdoruesit.

    By Tech Expert
    Technews.al
    Facebook X (Twitter) Instagram YouTube LinkedIn
    • Home
    • Tech
    • Kategori
    • Kontakt
    © 2026 Designed by Technews.al

    Type above and press Enter to search. Press Esc to cancel.