Tecnología

Lo que ChatGPT sabe de ti: Amnistía Internacional cuestiona cómo se entrenan las IA

Amnistía Internacional advierte que las principales plataformas de inteligencia artificial generativa fueron entrenadas con extracción masiva de datos personales desde internet, muchas veces sin consentimiento

Publicidad

La inteligencia artificial (IA) generativa vive uno de sus momentos de mayor expansión global. Herramientas capaces de escribir textos, crear imágenes, responder preguntas o generar videos en segundos se han integrado a la vida cotidiana, desde oficinas y universidades hasta redes sociales y medios de comunicación.

Sin embargo, detrás de esa revolución tecnológica existe una enorme infraestructura de recopilación de datos que ahora comienza a generar cuestionamientos éticos y legales cada vez más serios.

Un nuevo informe de Amnistía Internacional encendió las alarmas al asegurar que muchos de los sistemas de IA generativa más populares del mundo “violan la privacidad desde su diseño”, debido a que fueron desarrollados a partir de la extracción masiva de contenidos publicados en internet, incluidos datos personales de millones de personas.

La investigación, titulada Unlawful by Design: Exposing the Human Rights Costs of Generative AI, apunta directamente a modelos como GPT-3 de OpenAI, Gemini de Google, Llama de Meta, DeepSeek, Midjourney y Stable Diffusion.

Según Amnistía Internacional, estas plataformas dependen de enormes volúmenes de datos obtenidos automáticamente de páginas web, publicaciones en redes sociales, fotografías, foros y otros contenidos públicos, muchas veces sin autorización expresa de quienes los crearon.

“Las empresas están recopilando enormes cantidades de datos mediante prácticas que, en muchos casos, son ilegales”, afirmó Likhita Banerji, directora del Laboratorio de Rendición de Cuentas sobre el Uso de Algoritmos de la organización.

¿Cómo se entrenan las inteligencias artificiales?

El informe pone el foco en uno de los temas menos visibles para los usuarios: el entrenamiento de los modelos.

Los sistemas de IA generativa funcionan aprendiendo patrones a partir de gigantescas bases de datos. Mientras más información reciben, mayor capacidad tienen para producir respuestas complejas, redactar textos naturales o generar imágenes hiperrealistas.

Para lograrlo, las empresas tecnológicas utilizan procesos automatizados conocidos como “web scraping”, una técnica que permite recopilar información pública de internet a gran escala.

El problema, según Amnistía Internacional, es que en ese proceso terminan almacenándose fotografías, comentarios, perfiles, publicaciones y datos personales de millones de personas que nunca dieron consentimiento para participar en el entrenamiento de estos sistemas.

La organización sostiene que esta práctica convierte a muchos modelos de IA en sistemas “ilegales desde su concepción”, porque la vulneración de la privacidad ocurre desde la propia arquitectura tecnológica.

Sesgos, discriminación y manipulación

Más allá de la privacidad, el informe también advierte que estos modelos heredan y amplifican prejuicios presentes en internet.

Debido a que los datos utilizados para entrenar las IA provienen de contenido real publicado en la web, los sistemas absorben sesgos raciales, culturales y de género existentes en la sociedad. Esto puede traducirse en respuestas discriminatorias, estereotipos negativos o asociaciones problemáticas en los resultados generados por los modelos.

Amnistía Internacional asegura que las comunidades históricamente marginadas son las más vulnerables frente a estos errores, porque los sistemas replican patrones ya existentes en los contenidos digitales.

La organización también menciona riesgos relacionados con la libertad de pensamiento. Según el informe, las IA generativas pueden influir progresivamente en la manera en que las personas interpretan información, toman decisiones o forman opiniones, especialmente cuando las respuestas automatizadas se vuelven una fuente cotidiana de consulta.

El enorme costo ambiental de la IA

Otro de los puntos centrales del documento es el impacto ambiental asociado al auge de la inteligencia artificial.

Entrenar modelos avanzados requiere enormes capacidades de procesamiento, lo que implica centros de datos cada vez más grandes y microprocesadores de alto consumo energético.

Esto se traduce en mayores necesidades de electricidad, refrigeración y agua.

IA ENERGÍA
Solar energy and wind power stations

Amnistía Internacional cita el informe de sostenibilidad de Google de 2024, donde la compañía reconoció un aumento de 48% en sus emisiones de gases de efecto invernadero desde 2019, principalmente por la expansión de sus centros de datos y operaciones vinculadas a IA.

Microsoft, por su parte, reportó un incremento de 29% en emisiones entre 2020 y 2024, también asociado al crecimiento de infraestructura tecnológica para inteligencia artificial.

La expansión de centros de datos ya está generando tensiones en distintas regiones del mundo. El informe menciona casos en Chile, México y Estados Unidos donde comunidades locales se han opuesto a nuevos proyectos por temor al impacto sobre recursos hídricos y sistemas eléctricos en zonas afectadas por sequías.

Las empresas responden

Como parte de la investigación, Amnistía Internacional contactó a compañías como Google, OpenAI, Meta, Midjourney, Stability AI y DeepSeek para presentarles sus hallazgos y ofrecerles la posibilidad de responder.

Hasta el momento de la publicación del informe, solo Microsoft, Amazon, Intel, OpenAI y Meta habían enviado comentarios a la organización.

Amnistía insiste en que el problema no es inevitable ni exclusivamente tecnológico, sino resultado de decisiones empresariales.

“Debemos cuestionar las decisiones de diseño adoptadas por empresas que crean sistemas de IA generativa basándose en datos extraídos sin consentimiento y a gran escala”, señaló Banerji.

El debate apenas comienza

La investigación aparece en un momento donde gobiernos y organismos internacionales intentan acelerar regulaciones sobre inteligencia artificial.

Europa ya aprobó algunas de las normativas más estrictas del mundo sobre IA, mientras en Estados Unidos y América Latina el debate sigue abierto sobre privacidad, transparencia y uso responsable de datos.

Para Amnistía Internacional, los Estados deberían prohibir sistemas entrenados mediante extracción ilegal de datos y exigir responsabilidades a las empresas tecnológicas cuando existan impactos sobre derechos humanos.

El informe deja sobre la mesa una pregunta que comienza a ganar fuerza en todo el mundo tecnológico: si la inteligencia artificial necesita alimentarse de enormes cantidades de información personal para existir, ¿hasta dónde estamos dispuestos a ceder nuestra privacidad para seguir utilizando estas herramientas?

Publicidad
Publicidad