Rasti i Img2dataset ngre pikëpyetje mbi privatësinë online

Romain Beaumont, krijuesi i img2dataset, një platformë që grumbullon të dhëna nga faqe të ndryshme interneti, ka thënë se administratorët e faqeve të internetit që duan që mjeti i tij të ndalojë së mbledhuri të dhëna, duhet ta bëjnë këtë kërkesë në mënyrë aktive.

Në faqen GitHub të img2dataset, Beaumont shprehu trishtimin që njerëzit nuk e kuptojnë potencialin e AI, dhe se po luftojnë ngritjen e saj të pashmangshme. Img2dataset është një platformë pa pagesë që përdoruesit mund ta përdorin për të shkarkuar dhe ndryshuar përmasat e një liste URL-sh, për të krijuar databaza imazhesh. Këto imazhe, më pas përdoren për të trajnuar modele të AI që gjenerojnë imazhe si Imagen e Google, DALL-E e OpenAI, dhe modeli Stable Diffusion.

Img2dataset do të përpiqet të grumbullojë imazhe nga çdo faqe interneti, përveç rasteve kur administratorët e faqeve shtojnë tituj si “X-Robots-Tag: noai” dhe “X-Robots-Tag: noindex”. Me fjalë të tjera, img2dataset mbledh të dhëna në mënyre automatike pa marrë aprovimin nga administratorët e faqeve, gjë që konsiderohet e padrejtë nga shumë njerëz. Terence Eden, i cili vuri re se img2dataset po grumbullonte të dhëna nga faqja e tij, OpenBenches, kërkoi që Beaumont të ndryshonte mënyrën e grumbullimit të të dhënave.

Rasti i Img2dataset ka ngritur pikëpyetje në lidhje me pronësinë intelektuale dhe marrjen e aprovimit nga krijuesit e imazheve, çështje që janë ngritur nga Featured Snippets të Google, dhe News Feed të Facebook. Mjete si ChatGPT dhe Stable Diffusion kanë grumbulluar të dhëna tashmë nga një pjesë e madhe e faqeve të internetit, gjë që ngre pikëpyetje në lidhje me kompanitë që ndërtojnë platforma të tilla pa pëlqimin e përdoruesve.

Përdorimi i mjeteve të AI është bërë më popullor, dhe ka ngritur pikëpyetje në lidhje me pronësinë intelektuale dhe marrjen e aprovimit nga krijuesit e imazheve, çështje që kanë ekzistuar që nga fillimi i epokës së internetit. Platformat si ChatGPT dhe Stable Diffusion funksionojnë sepse ata tashmë kanë grumbulluar informacion nga një pjesë e madhe e faqeve të internetit, duke përfshirë artikuj, postime në forum, art, fotografi, etj., që përdoruesit i kanë ndarë në internet me miqtë ose fansat, pa iu marrë ndonjëherë aprovimi. Shumica e këtyre të dhënave i paraprijnë ekzistencës së OpenAI, Stability AI, ose bazës së të dhënave LAION.

Mjetet AI, si ato të krijuara nga OpenAI dhe Stable Diffusion, mund të zëvendësojnë potencialisht 80% të vendeve të punës në SHBA dhe të paraqesin “rreziqe masive” për shoqërinë. Këto pretendimeve duhen trajtuar me skepticizëm. Sidoqoftë, vlen të përmendet se kompanitë që merren me trajnimin e AI po e bëjnë këtë pa pyetur kurrë përdoruesit e internetit, përpjekjet e të cilëve po fuqizojnë AI.

Fakti që Beaumont beson se pronarët e faqeve duhet të tërhiqen aktivisht nga img2dataset ngre një pyetje të rëndësishme në lidhje me marrjen e aprovimit nga krijuesit e imazheve. Në rastin e img2dataset, administratorët e faqeve të internetit duhet të shmangin grumbullimin e të dhënave nga palë të treta, duke shtuar tituj në faqet e tyre. Ky është një proces kompleks, veçanërisht për administratorët e faqeve të internetit të cilët nuk kanë njohuri të specializuara në këtë fushë. Barra e përjashtimit bie mbi administratorët e faqeve të internetit, shumë prej të cilëve nuk e kanë idenë se img2dataset po funksionon në faqen e tyre. Prandaj, është thelbësore që të ketë një diskutim rreth marrjes së aprovimit nga krijuesit, dhe përdorimit të mjeteve të AI për të shmangur çdo konflikt në të ardhmen.

Bashkohuni në Newsletter

What's Hot

Rasti i Img2dataset ngre pikëpyetje mbi privatësinë online

Related Posts

2 Comments

Leave A Reply Cancel Reply