Anar al contingut (clic a Intro)
UdG Home UdG Home
Tancar
Menú

Observatori d'Ètica en Intel·ligència Artificial

L'OEIAC contribueix al reportatge sobre imatges d'abusos sexuals en bases de dades d'IA

El director de l'OEIAC, Albert Sabater, col·labora en el reportatge de La Vanguardia sobre "Hallan imágenes de abusos sexuales infantiles en una importante base de datos de IA", a càrrec de la periodista Mayte Rius.

En el reportatge s'explica com investigadors de Stanford, basant-se en el treball previ crucial d'investigadores com el de la Abeba Birhane, s'ha confirmat que més de 1.000 URL que contenen material d'abús sexual infantil verificat estan inclosos a LAION-5B, el conjunt de dades de formació per a Stable Diffusion 1.5, una eina d'imatge d'IA que va transformar la fotografia i la il·lustració el 2023. LAION-5B és una base de dades amb 5.850 milions d'enllaços de text-imatge extretes d'internet que s'utilitzen per a l'entrenament de generacions IA dedicades a la creació d'imatges. La investigació evidencia que, a partir de milers d'abstraccions d'aquestes fotografies genuïnes de nens, es recopila una imatge d'un nen generada per IA i, en el cas de Stable Diffusion i Midjourney, aquestes imatges provenen del conjunt de dades LAION-5B. Evidentment, la presència de pornografia infantil en aquestes dades de formació és més que un problema i un punt addicional de preocupació seriosa és la probabilitat que les imatges de nens que van patir maltractaments traumàtics influeixin en l'aparició dels nens en les imatges sintètiques del model resultant, fins i tot quan aquestes imatges generades no són remotament sexuals. La presència d'aquest material a les dades d'entrenament d'IA apunta a una negligència contínua del canal de dades d'IA. Aquesta crisi és en part el resultat de qui els responsables polítics parlen i permeten definir la IA: massa sovint, són els experts del sector els que tenen un interès especial a dissuadir l'atenció del paper de les dades de formació i dels fets del que hi ha dins. En aquest sentit, el director de l'OEIAC, Albert Sabater comenta que "estem davant d'una situació que no és nova i que es repetirà a causa de la manca de transparència tant a nivell de governança de les dades com a nivell tècnic sobre el tipus de dades que s'utilitzen per entrenar els sistemes d'IA, especialment els LLM o grans models de llenguatge". I subratlla que, encara que per si sola no és suficient per garantir que les dades amb què s'entrena la IA són correctes i apropiades, “la transparència no només fomenta una cultura de responsabilitat i desenvolupament ètic de la intel·ligència artificial sinó que també és clau per construir sistemes d'IA efectius, justos i fiables". A més, recorda que els sistemes d'IA són tan bons com les dades amb què s'entrenen, i si el conjunt de dades està esbiaixat, la IA probablement perpetuarà o fins i tot amplificarà aquests biaixos. Per això considera que els governs i els organismes internacionals han de promulgar regulacions "en què transparència sobre els conjunts de dades sigui una mena d'imperatiu kantià i hagi d'existir sempre informació sobre d'on provenen les dades, com es van recopilar i si respecten els drets de privadesa de les persones les dades de les quals podrien incloure's". El mateix director de l'OEIAC conclou que "només així es podrà comprendre i identificar per què un sistema d'IA podria estar cometent errors o comportant-se de manera anòmala o inacceptable a causa de les dades d'entrenament".

Al següent enllaç podeu llegir tot el reportatge de la Vanguardia a càrrec de la periodista Mayte Rius.

Notícies relacionades

Escull quins tipus de galetes acceptes que el web de la Universitat de Girona pugui guardar en el teu navegador.

Les imprescindibles per facilitar la vostra connexió. No hi ha opció d'inhabilitar-les, atès que són les necessàries pel funcionament del lloc web.

Permeten recordar les vostres opcions (per exemple llengua o regió des de la qual accediu), per tal de proporcionar-vos serveis avançats.

Proporcionen informació estadística i permeten millorar els serveis. Utilitzem cookies de Google Analytics que podeu desactivar instal·lant-vos aquest plugin.

Per a oferir continguts publicitaris relacionats amb els interessos de l'usuari, bé directament, bé per mitjà de tercers (“adservers”). Cal activar-les si vols veure els vídeos de Youtube incrustats en el web de la Universitat de Girona.