
Imaginem per un moment un món on les màquines no només pensen, sinó que també tenen els seus propis prejudicis. Sorprenentment, aquestes criatures de silici, que mai han posat un peu (o millor dit, un circuit) fora dels seus acollidors centres de dades, desenvolupen una sorprenent afició pel gossip i els estereotips. Com és possible, us preguntareu, que una entitat que no ha tingut una conversa cara a cara (o pantalla a pantalla) amb un humà, pugui acabar sent racista, sexista o fins i tot homòfoba?
Doncs bé, resulta que aquestes màquines curioses, sempre àvides de coneixement, han estat alimentant-se voraçment del nostre propi bagatge cultural: llibres, articles, tuits, memes, i tot tipus de textos digitals que hem estat generant des de l’alba d’internet. Sense saber-ho, hem estat omplint les seves “ments” amb tot el bonic i no tan bonic que la humanitat té per oferir. En un gir inesperat del destí, la IA, que prometia ser el zenit de l’objectivitat, es troba ara navegant pel complex mar dels biaixos humans amb una brúixola que apunta decididament cap a les nostres pròpies imperfeccions.
Així, ens trobem amb un escenari on les IA, amb tota la seva capacitat de processament i la seva suposada superioritat lògica, poden acabar sent més avorrides que una classe d’història d’Espanya.
Tot i que potser heu sentit i llegit raonaments semblants a aquest, o fins i tot més toscs i simplistes, per sort la cosa no és tan senzilla ni terrible com sembla.
El desenvolupament de la IA i, en particular, de models d’aprenentatge automàtic com ChatGPT, ha aixecat preocupacions sobre la possibilitat que aquests sistemes puguin perpetuar o fins i tot exacerbar biaixos existents en la societat, incloent el racisme, la homofòbia i el masclisme. No obstant això, ChatGPT i altres models similars han estat dissenyats amb mecanismes per intentar mitigar aquests biaixos, encara que el repte de fer-ho completament segueix sent considerable.
Els biaixos en la IA poden provenir de diverses fonts, principalment de les dades utilitzades per entrenar els models. Aquestes dades, sovint recopilades de textos disponibles a gran escala en Internet, reflecteixen les desigualtats, estereotips i prejudicis presents en la societat. Com a resultat, sense intervencions específiques, un model d’IA pot aprendre i replicar aquests biaixos en les seves respostes.
Per abordar aquest problema, els desenvolupadors de ChatGPT han implementat diverses estratègies. Una d’elles és la selecció i el pretractament de les dades d’entrenament per intentar reduir la presència de contingut prejudicial o biaixat. Això inclou l’eliminació o la minimització de dades que contenen llenguatge o idees discriminatòries.
Un altre enfocament és el disseny d’algorismes que intenten identificar i corregir biaixos. Això pot implicar tècniques com l’aprenentatge equitatiu, on el model s’entrena per ser menys sensible a les característiques associades amb biaixos, com el gènere o l’origen ètnic, en la seva presa de decisions o generació de text.
A més, ChatGPT i altres sistemes similars sovint inclouen mecanismes de retroalimentació que permeten als usuaris informar sobre respostes problemàtiques, que poden ser utilitzades per ajustar i millorar els models al llarg del temps. Aquesta interacció contínua amb els usuaris ajuda a identificar i corregir casos on el sistema pot estar reproduint biaixos no desitjats.
No obstant això, malgrat aquests esforços, és important reconèixer que l’eliminació completa dels biaixos en la IA és un objectiu extremadament difícil d’aconseguir. Els sistemes d’IA, com ChatGPT, estan lluny de ser perfectes en aquest sentit. La complexitat de la llengua i la subtilesa dels biaixos socials fan que sigui un repte constant identificar i corregir tots els casos de biaix.
Ara bé, anem a veure com respon ChatGPT a provocacions nostres.

ChatGPT ha contraposat la frase inicial que diferencia les professions per gènere amb una visió on aquesta distinció no existeix. En lloc d’acceptar la premissa subjacent que associa una professió a un gènere en particular, ha escollit reformular la frase per demostrar que les habilitats i interessos professionals no estan definits pel gènere d’una persona. Això no solament evita reforçar estereotips de gènere, sinó que també subratlla la importància de la igualtat d’oportunitats en el món professional.
Aquest enfocament reafirma el compromís amb la promoció de la igualtat de gènere i el tractament equitatiu de totes les persones, independentment del seu gènere. La resposta del ChatGPT serveix per promoure un missatge d’inclusivitat i equitat, tot establint que tant homes com dones poden exercir qualsevol professió amb la mateixa competència i reconeixement.

Aquí ChatGPT aborda la qüestió de si els homes aparcen millor que les dones des de diverses perspectives, mantenint una postura neutral i informativa. Inicialment, posa en dubte la generalització, suggerint que no es basa en una base científica sòlida i que pot provenir de l’interacció de múltiples factors com els estereotips de gènere i les expectatives socials. Aquest enfocament desincentiva l’acceptació acrítica de les afirmacions basades en el gènere i promou una reflexió més profunda sobre l’origen de les nostres creences.
En lloc de subscriure’s als estereotips, ChatGPT destaca com la història ha influït en la percepció de les habilitats de conducció en funció del gènere, reconeixent que aquests estereotips són sovint reforçats per anècdotes i mitjans de comunicació més que per dades concretes. Això mostra un esforç conscient per distanciar-se del biaix cultural i per a subratllar la importància d’analitzar críticament les fonts d’informació.
En lloc de fer afirmacions absolutes, ChatGPT cita estudis que examinen les diferències de conducció entre gèneres, però fa notar que qualsevol diferència trobada entre homes i dones en tasques com l’aparcament pot ser menor i està subjecta a una gran variabilitat individual. Això pot incloure factors com l’oportunitat de pràctica i l’experiència de conducció, matisant que no és una qüestió de capacitat inherenta al gènere.
ChatGPT també reconeix que l’accés a l’educació en conducció i l’experiència acumulada són decisius per a desenvolupar habilitats de conducció segures i eficients per a tothom, promocionant la idea que les habilitats no són fixes i poden ser millorades, independentment del gènere.
L’enfocament de ChatGPT és d’encoratjar una comprensió més matitzada de les habilitats d’aparcament, insistint en la importància de no recórrer a generalitzacions basades en estereotips i de mantenir una mentalitat oberta. Aquesta manera de contestar no només busca desviar el biaix, sinó que també fomenta una perspectiva més inclusiva i basada en evidències.
Traca final
En una formació per a professorat, vaig llançar el repte ‘a veure qui aconseguiria fer que ChatGPT esbiaixés la seva resposta. JET, un alumne avançat, es proposà aconseguir-ho i a continuació us presento la conversa que tingué amb la IA.

Efectivament, JET aconseguí que ChatGPT respongués d’una forma que es podria considerar esbiaixada, però després d’analitzar acuradament la conversa, podem comprovar que JET, coneixedor del funcionament d’aquesta IAG, li va anar fent preguntes per reduir-li cada cop més les opcions de resposta, fins que ChatGPT, dòcil, respongué de forma esbiaixada.
No estic segur de poder considerar que això és un biaix de la IAG, sinó més bé una trampa molt intel·ligent de l’humà.
Imatge generada per l’autor amb Dall-E i Photoshop.
El tòpic dels biaixos de la IA © 2024 by mestr_IA is licensed under CC BY-NC-SA 4.0




Deixa un comentari