Datos: lo que muestran y lo que esconden
Por Ailín Portas*
Este artículo surgió a partir del trabajo final que realicé para el seminario “Datos y género: la transversalización de la perspectiva de género en la recolección, la producción y el análisis de los datos para desarrollar políticas públicas basadas en evidencia” que dictaron desde la organización DataGénero en la facultad de Ciencias Sociales de la UBA.
La propuesta era traer una reflexión final que dialogara con las principales temáticas expuestas a lo largo del seminario: la ciencia de datos, el feminismo de datos, la perspectiva interseccional y descolonial, y, sobre todo, los sesgos en la producción y análisis de datos, y las consecuencias a las que podemos llegar si no se cuestionamos las formas de desarrollar nueva tecnología. A lo largo de este artículo voy a exponer cómo el poder se relaciona con la ciencia de datos, desde una postura interseccional y descolonial, los problemas a los que nos enfrentamos y algunas soluciones.
Ciencia de datos ¿Qué es? ¿Cómo nos afecta?
Las personas recopilamos datos desde hace miles de años, el hábito de contarnos no es nuevo, pero el desarrollo tecnológico multiplicó la capacidad de recopilar y registrar información de forma digital. Hoy en día se generan miles de datos todo el tiempo, tantos que existe una ciencia que se ocupa de recopilarlos y analizarlos: la ciencia de datos. (1)
Y como toda ciencia, está atravesada por el enfoque positivista, desde este enfoque se suele sostener que los hechos y los objetos son “objetivos”, universales y libres de valores; y se los conoce a través de los objetivos. Una de las tantas críticas que se le ha hecho a este enfoque es que no reconoce la dimensión humana en el proceso de interpretación, olvidando que el conocimiento es producido por personas y está atravesado por diversos prejuicios, por la historia, las vivencias y el contexto socio cultural en el que estamos inmersas.
A pesar que ya desde mediados de los años sesenta, se han señalado los problemas de creer que la objetividad como tal existe, esta visión reaparece en diversas coyunturas. En la actualidad, en la visión más extendida y acrítica de la ciencia de datos aparece asociada a la tecnología como herramienta neutral. Si bien esa afirmación es correcta, ya que las herramientas tecnológicas no tienen creencias, eso no significa que sean objetivas y universales, pues están atravesadas por los sesgos y valores de las personas que las crearon, más allá de que son desarrolladas para cumplir un objetivo específico en un contexto particular.
Por eso, a la hora de desarrollar nuevas tecnologías, nuevos algoritmos, o simplemente recopilar y analizar datos, es muy importante que las instituciones y las personas que llevan adelante esas tareas tengan en cuenta cuales son sus propios sesgos y valores. Porque la ciencia no es objetiva, las herramientas de las que se sirve no son neutrales, y quienes producen conocimiento no pueden dejar de lado sus creencias. Solo si tenemos presentes estos supuestos podemos ser más críticos a la hora de producir o analizar datos.
Bourdieu sostiene que la “vigilancia epistemológica” (1973) debe ser practicada por los/as investigadores/as para asegurarse que las investigaciones sigan el método científico que bregue por una construcción que se aparte del sentido común y reconozca el lugar de la enunciación.
El poder y la ciencia
En Feminismo de Datos, D’Ignacio y Klein (2020) refieren a la desigual distribución del poder en la sociedad y cómo esto atraviesa la ciencia de datos. Para entender por qué la experiencia de cada quien en el mundo es tan distinta podríamos dividirnos en dos grandes grupos: por un lado un grupo que goza de privilegios -este grupo concentra el poder- y el grupo de los oprimidos, que se encuentra en desventaja porque el grupo dominante usó su poder para excluirlos sistemáticamente de las instituciones. Las autoras señalan que el grupo dominante está principalmente compuesto por varones blancos, heterosexuales, cisgénero, del Norte Global.
El grupo de los oprimidos es muy heterogéneo ya que existen diversas formas de opresión: el género, la raza, la clase, el colonialismo y la orientación sexual han construido subalternidades. De esa forma, D’Ignacio y Klein explican que las diferencias entre ser una mujer cis de clase media en EEUU, y ser una mujer travesti de clase baja en Argentina, si bien ambas pertenecen al grupo oprimido, una goza de más privilegios que la otra.
Es por ello que la perspectiva interseccional va a incorporar un análisis que tenga en cuenta las relaciones de opresión y privilegio, cómo se entrelazan en el mundo social multiplicando sus efectos y configurando la experiencia particular de cada quien.
Pero, ¿qué tiene que ver la distribución del poder con la ciencia de datos? Solo basta echar una mirada a la demografía de la ciencia de datos para darnos cuenta que los grupos de personas que la llevan adelante están formados en su mayoría por el grupo dominante. Según La Oficina de Estadísticas Laborales de los Estados Unidos, en el 2018 solo el 26% de las personas en “ocupaciones informáticas y matemáticas” son mujeres(2); y en el campo de la inteligencia artificial las mujeres representan el 15% del personal de investigación en Facebook y el 10% en Google según un informe del grupo de investigación IA Now.(3)
Feminismo de datos como una respuesta
D´Ignacio y Klein en su libro “Data feminism” describen que un de los principales objetivos del feminismo de datos es exponer estos problemas, dar cuenta cómo la ciencia de datos es llevada adelante por el grupo dominante y es utilizada para reforzar las desigualdades existentes; y lo hacen, señalando diferentes proyectos donde los sesgos hicieron de los datos o de las tecnologías, una herramienta que excluye y margina.
A su vez, ellas enfatizan en que el feminismo de datos es una herramienta para cuestionar y cambiar la distribución del poder. No se debe olvidar que la información es poder. Por eso es importante que quienes pertenecemos a los grupos oprimidos participemos de los procesos de producción y análisis de datos para poder evidenciar las diferentes formas de opresión que vivimos.
Existen múltiples ejemplos en donde los varones se han olvidado de contemplar tareas y actividades que, en general, no los involucran, pero hay uno que me gustaría destacar porque evidencia que tan lejos pueden llegar los sesgos si no incorporamos otras voces en aquellos lugares tradicionalmente ocupados por varones. Después de un terremoto en el 2001, en Gujarat, India, se llevó adelante un plan de reconstrucción de viviendas liderado por varones, y al terminar se dieron cuenta que habían construido casas sin cocinas. ¿Cómo puede ser que este grupo haya dejado de lado una actividad vital como lo es comer y cocinar? Como si el ejemplo no fuera lo suficientemente absurdo, la misma situación se repitió en Sri Lanka después de un tsunami en 2004; el equipo de reconstrucción formado por varones no tuvo en cuenta esta actividad que suelen llevar adelante las mujeres y se olvidaron de incorporar cocinas en sus casas.
Esta situación por más absurda que parezca evidencia las consecuencias a las que se llega cuando los equipos están solo compuestos por varones.
D´Ignacio y Klein llaman “riesgo de privilegio” (5) a esa incapacidad que tiene el grupo dominante para reconocer las necesidades y las desigualdades con las que batallan los grupos oprimidos simplemente porque sus vidas cotidianas no están atravesadas por esas situaciones. Se trata de un concepto concebido para reflejar cómo la capacidad de tomar decisiones se ve afectada por el lugar privilegiado que ocupan en la sociedad, especialmente los varones blancos y heterosexuales.
El riesgo de privilegio nos ayuda a entender por qué en los ejemplos de Caroline Criado Perez (2019) aquellos equipos formados principalmente por varones no contemplaron problemáticas vitales. También explica por qué nos sorprendemos cuando escuchamos vivencias de grupos oprimidos a los que no pertenecemos. El riesgo de privilegio se hace más fuerte cuando tenemos un grupo formado por personas con características similares, con los mismos privilegios y los mismos sesgos.
Para resumir, debemos cuestionar a esa ciencia de datos que se nos presenta como objetiva, y nos brinda datos, herramientas tecnológicas, software y algoritmos “neutros”. En primer lugar porque la ciencia de datos es producida por personas con valores y creencias incorporadas que van a estar presentes en sus análisis y conclusiones. En segundo lugar porque el poder no está distribuido equitativamente en la sociedad. Y en tercer lugar, porque la ciencia de datos es diseñada y desarrollada por varones blancos y heterosexuales , y eso hace a los equipos permeables al riesgo de privilegio.
Posibles soluciones
La mejor forma de mitigar estos sesgos y de reducir el riesgo de privilegio es construir equipos más heterogéneos, que sean representativos de la sociedad para que la ciencia de datos se construya contemplando las perspectivas, experiencias y necesidades de todos los grupos que conviven en el mundo social. La inclusión digital de las minorías no solo es justa sino necesaria, deben involucrarse en el desarrollo de la próxima generación para evitar que se repliquen las desigualdades. Sin olvidarnos de las distintas formas de opresión presentes en la sociedad, y la forma en las que se entrelazan. Incorporar a personas que pertenezcan a diversos grupos del entramado social en la ciencia de datos, no solo hará que sus perspectivas se tengan en cuenta a la hora de recopilar y analizar datos, además abrirá los ojos a daños colaterales y fallas en las herramientas tecnológicas que no tenemos en cuenta.
Sin embargo, aún persiguiendo estos objetivos, hay dos aspectos en los que deberíamos poner especial atención mientras intentamos desarrollar tecnologías más inclusivas. En primer lugar, la mera inclusión digital de las minorías no es suficiente, solo basta analizar el pasado para saber que incorporarse en instituciones machistas no hace que cambien las prácticas que nos marginan. Diana Maffia, señala que las mujeres fuimos excluidas de la academia científica durante muchos años, las primeras mujeres que conquistaron su espacio dentro de este mundo dominado por varones tuvieron que ajustarse a las normas masculinas porque esas eran tomadas como medida de excelencia (6). Entonces, el hecho de las mujeres ocupen roles tradicionalmente ocupados por varones reduce la exclusion y la discriminación explicita, pero subsisten formas de discriminación más sutiles ligadas a estructuras de poder y dominacion. Para construir una ciencia de datos feminista no basta con incluir a las mujeres, es necesario poner en cuestión las formas de poder y jerarquias que atraviesa el desarrollo de la ciencia de datos.
No necesitamos que incluyan a las minorías para replicar las mismas prácticas que hoy en día realizan los varones, queremos que se tengan en cuenta sus experiencias y necesidades a la hora de desarrollar tecnología, que formen parte activa de la producción de datos para que se recopilen aquellos que evidencian las desigualdades, y principalmente que sus perspectivas atraviesan el análisis para arribar a conclusiones y tomar decisiones que no repliquen ni profundicen las desigualdades.
En segundo lugar, debemos prestar especial atención a las diferencias entre el Norte y el Sur Global. Los principales centros de desarrollo tecnológico se encuentran en el Norte Global, los más poderosos en el mundo de las nuevas tecnologías no solo son varones, además son estadounidenses o europeos; y nosotros desde el Sur importamos y usamos esa tecnología. La perspectiva decolonial nos invita a revisar y cuestionar esa distribución de poder, y evidencia cómo se replican las relaciones de dominación cuando desde el Sur usamos y dependemos de aquello que se produce en el Norte.
No existen herramientas universales, que puedan aplicarse en cualquier lugar del mundo, y, que en todos lados tengan el mismo efecto. Debemos prestar especial atención a la hora de utilizar algo que se desarrolló en un contexto tan diferente al nuestro. Latinoamérica tiene su historia, sus conflictos, y sus problemáticas que dieron lugar a un contexto social muy diferente al del norte. Debemos ser críticos a la hora de importar tecnologías, software, algoritmos, así como también las prácticas para recolectar y analizar datos; porque aquello que funciona en un contexto específico puede traer problemas al intentar replicarlo.
Para poner un ejemplo, a la hora de incorporar una herramienta digital en la sociedad Argentina deberíamos problematizar el alcance que tiene la conectividad, o las diferencias que existen en cuanto al acceso a tecnologías a lo largo del país. Solo priorizando nuestras necesidades, podemos replicar aquello que nos sirve y descartar lo que no . También es importante impulsar el desarrollo local de nuevas tecnologías que tengan en cuenta las particularidades de nuestro país, para dejar de depender del desarrollo en el Norte.
Para concluir, los avances tecnológicos y la enorme capacidad de recopilar datos nos habilitan soluciones concretas, pero a la hora de recopilar y analizar esos datos debemos tener presente las estructuras de poder presentes en la sociedad, así como los sesgos y el riesgo de privilegio que nos atraviesa. Debemos avanzar en pos de una ciencia de datos más justa, que incorpore en sus equipos la diversidad que encontramos en la sociedad y que sus conclusiones estén atravesadas por sus diferentes experiencias.
*Ailín Portas es estudiante de Sociología en la Universidad de Buenos Aires.
Notas:
- Nada está fuera de la datificación y las herramientas tecnológicas hacen que sea más fácil transformar en datos nuestros me gusta, el historial de búsqueda, los artículo que agregamos al carrito de compras, las ofertas aprovechamos, el medio de pago que elegimos, dónde vacacionamos, que medio de transporte elegimos,e incluso nuestro comportamiento y decisiones offline. Estos proyectos son de los que se ocupa la ciencia de datos, su tarea principal es recolectar sistemáticamente cualquier tipo de datos, organizarlos y analizarlos, para producir información en la cual basar decisiones.
- “Bureau of Labor Statistics Data Viewer” [“Buscador de Datos del Departamento de Estadísticas del Trabajo”], US Bureau of Labor Statistics, 2019. https://beta.bls.gov/dataViewer/view/timeseries/LNU02070002Q.
- Sarah West Myers, Meredith Whittaker, y Kate Crawford. “Discriminating Systems: Gender, Race and Power in AI” [“Sistemas de Discriminación: Género, Raza y Poder en IA”] AI Now Institute, 2019, https://ainowinstitute.org/discriminatingsystems.pdf.
- Véase en Criado-Pérez, C. (2019), capítulos 15 “¿Quién lo reconstruirá?” y 16 “No es la catástrofe lo que las mata”
- “Riesgo de privilegio: es el fenómeno que hace que aquellas personas que ocupan las posiciones más privilegiadas entre nosotros y nosotras -aquellas personas con buena educación, credenciales respetadas y elogios profesionales- están muy mal equipadas para reconocer las instancias de opresión en el mundo” (D’Ignazio C. y Klein, L. 2020:28)
- Véase en (Maffía, s/f:3–4).
Bibliografía
Blanco, C. (s/f). La vigilancia epistemológica en Ciencias Sociales: un compromiso ineludible. Reflexiones desde la sociología del conocimiento de Pierre Bourdieu en Primer simposio internacional interdisciplinario Aduanas del Conocimiento.
D’Ignazio, C., Klein, L. (2020). Data Feminism. Massachusetts: The MIT Press.
Espinosa Miñoso, Y. (2016). De por qué es necesario un feminismo descolonial: diferenciación, dominación co-constitutiva de la modernidad occidental y el fin de la política de identidad. Solar, 12 (12), 141–171.
Maffía, D. (s/f). Epistemología feminista: la subversión semiótica de las mujeres en la ciencia. Instituto Interdisciplinario de Estudios de Género, UBA.
Perez Criado, C. (2021). Invisible Women. New York: Abrams Press.