Romain Beaumont, krijuesi i img2dataset, një platformë që grumbullon të dhëna nga faqe të ndryshme interneti, ka thënë se administratorët e faqeve të internetit që duan që mjeti i tij të ndalojë së mbledhuri të dhëna, duhet ta bëjnë këtë kërkesë në mënyrë aktive.
Në faqen GitHub të img2dataset, Beaumont shprehu trishtimin që njerëzit nuk e kuptojnë potencialin e AI, dhe se po luftojnë ngritjen e saj të pashmangshme. Img2dataset është një platformë pa pagesë që përdoruesit mund ta përdorin për të shkarkuar dhe ndryshuar përmasat e një liste URL-sh, për të krijuar databaza imazhesh. Këto imazhe, më pas përdoren për të trajnuar modele të AI që gjenerojnë imazhe si Imagen e Google, DALL-E e OpenAI, dhe modeli Stable Diffusion.
Img2dataset do të përpiqet të grumbullojë imazhe nga çdo faqe interneti, përveç rasteve kur administratorët e faqeve shtojnë tituj si “X-Robots-Tag: noai” dhe “X-Robots-Tag: noindex”. Me fjalë të tjera, img2dataset mbledh të dhëna në mënyre automatike pa marrë aprovimin nga administratorët e faqeve, gjë që konsiderohet e padrejtë nga shumë njerëz. Terence Eden, i cili vuri re se img2dataset po grumbullonte të dhëna nga faqja e tij, OpenBenches, kërkoi që Beaumont të ndryshonte mënyrën e grumbullimit të të dhënave.
Rasti i Img2dataset ka ngritur pikëpyetje në lidhje me pronësinë intelektuale dhe marrjen e aprovimit nga krijuesit e imazheve, çështje që janë ngritur nga Featured Snippets të Google, dhe News Feed të Facebook. Mjete si ChatGPT dhe Stable Diffusion kanë grumbulluar të dhëna tashmë nga një pjesë e madhe e faqeve të internetit, gjë që ngre pikëpyetje në lidhje me kompanitë që ndërtojnë platforma të tilla pa pëlqimin e përdoruesve.
Përdorimi i mjeteve të AI është bërë më popullor, dhe ka ngritur pikëpyetje në lidhje me pronësinë intelektuale dhe marrjen e aprovimit nga krijuesit e imazheve, çështje që kanë ekzistuar që nga fillimi i epokës së internetit. Platformat si ChatGPT dhe Stable Diffusion funksionojnë sepse ata tashmë kanë grumbulluar informacion nga një pjesë e madhe e faqeve të internetit, duke përfshirë artikuj, postime në forum, art, fotografi, etj., që përdoruesit i kanë ndarë në internet me miqtë ose fansat, pa iu marrë ndonjëherë aprovimi. Shumica e këtyre të dhënave i paraprijnë ekzistencës së OpenAI, Stability AI, ose bazës së të dhënave LAION.
Mjetet AI, si ato të krijuara nga OpenAI dhe Stable Diffusion, mund të zëvendësojnë potencialisht 80% të vendeve të punës në SHBA dhe të paraqesin “rreziqe masive” për shoqërinë. Këto pretendimeve duhen trajtuar me skepticizëm. Sidoqoftë, vlen të përmendet se kompanitë që merren me trajnimin e AI po e bëjnë këtë pa pyetur kurrë përdoruesit e internetit, përpjekjet e të cilëve po fuqizojnë AI.
Fakti që Beaumont beson se pronarët e faqeve duhet të tërhiqen aktivisht nga img2dataset ngre një pyetje të rëndësishme në lidhje me marrjen e aprovimit nga krijuesit e imazheve. Në rastin e img2dataset, administratorët e faqeve të internetit duhet të shmangin grumbullimin e të dhënave nga palë të treta, duke shtuar tituj në faqet e tyre. Ky është një proces kompleks, veçanërisht për administratorët e faqeve të internetit të cilët nuk kanë njohuri të specializuara në këtë fushë. Barra e përjashtimit bie mbi administratorët e faqeve të internetit, shumë prej të cilëve nuk e kanë idenë se img2dataset po funksionon në faqen e tyre. Prandaj, është thelbësore që të ketë një diskutim rreth marrjes së aprovimit nga krijuesit, dhe përdorimit të mjeteve të AI për të shmangur çdo konflikt në të ardhmen.





2 Comments
Pingback: Përsëri probleme për Microsoft! Kompania gjobitet për shkeljen e privatësisë së të miturëve - Technews.al
Pingback: Trashëgimia e Snowden: Një dekadë nga rilindja e luftës për privatësi! - Technews.al