Para hablar de la sociedad, los datos no bastan

Algunas reflexiones sociológicas sobre la producción de datos con perspectiva de género.

DataGénero - Observatorio
13 min readJul 22, 2021

Por Mailén García*

Este artículo parte de la construcción de conocimiento en y desde la frontera para reflexionar sobre la imbricada relación que existe entre el territorio y el escritorio para la producción de información estadística. El principal objetivo es plantear cuatro puntos nodales, cuatro debates, que atraviesan a los procesos de producción y recolección de datos y estadísticas y que nos invitan a modificar algunas de las prácticas ritualizadas que se reproducen en la actualidad.

  1. Cuantitativo y maximizable vs. cualitativo y singular
Autora: Micaela Lattanzio

La dicotomía entre la metodología cuantitativa y cualitativa parece no tener fin. Existen una serie de discusiones teóricas que bregan por su conjunción y hasta intentos por tener cátedras de “metodología de la investigación social” en las que se las estudie en relación. Sin embargo, en el ejercicio profesional de la Sociología no me he topado más que con enormes barreras simbólicas y materiales entre unas y otras.

Los datos y la posibilidad de realizar análisis de grandes volúmenes de información permiten construir una imagen, una especie de primera foto en blanco y negro de cómo está la situación. Por supuesto, son y serán incapaces de contarnos lo que efectivamente le ocurre a esa persona pero permitirán comprender tendencias, frecuencias, prevalencias, modas. ¿Por qué son importantes? Porque evidencian que lo que ocurre no es individual sino colectivo.

El feminismo de los años sesenta de Estados Unidos y Francia (Friedan y De Beauvoir) supo poner en cuestión que los problemas de las mujeres no eran individuales, sino colectivos y partían de una matriz de opresión.

datos + datos = patrón → comprender matrices de dominación, de opresión, de desigualdad.

Por su parte, las metodologías cualitativas focalizan en las personas, en las experiencias individuales para narrar, así siguiendo con la metáfora de las fotos, éstas toman color. Las metodologías cualitativas permiten aprehender cómo un conjunto de personas experimenta determinadas opresiones, conocer historias de vida o acceder a testimonios de primera mano. En definitiva, nos recuerdan constantemente que detrás de los números hay personas. Siguiendo con la experiencia individual, en lo personal, pienso que las metodologías cualitativas nos previenen de caer en la deshumanización de creer en variables o tendencias como si fueran entes en sí mismo y no construcciones ficticias que utilizamos para hacer inteligible la realidad y explicar lo que le ocurre a cientos, miles o millones de personas.

voces + experiencias = relatos de vida → comprender cómo se siente esa persona y conocer su trayectoria de vida.

Sin embargo, la barrera invisible que se teje entre las metodologías cuantitativas y cualitativas es tal que es posible encontrarse con matemáticos que diseñan muestras censales según probabilidades y no consideran factores como la estacionalidad de las viviendas en ciudades turísticas porque alteran la aleatoriedad de la muestra. Y luego, se enojan con las bajas tasas de respuestas porque quedan seleccionadas una enorme cantidad de viviendas deshabitadas. Tristemente esta anécdota es una historia real, son algunas de las discusiones que presencié mientras trabajaba en estadística.

También existen instituciones e investigadores a los que cuando se les pregunta por los datos que sustentan tal o cual afirmación, no hacen más que argumentar que “es lo que se ve en el barrio”, “es lo que dicen mis informantes”. El problema aquí, no son las opiniones, sino el riesgo de que argumentos sin sustento empírico sean utilizados para la producción de conocimiento científico o el desarrollo de políticas públicas.

El desafío por superar esta dicotomía no es nuevo ni actual aunque se reactualiza conforme las discusiones sobre big data avanzan. Esto se debe a que se incrementa el riesgo de ver números sin pensar en las personas que conforman ese universo de análisis.

Es por ello que, se torna indispensable volver a centrar esta discusión para pensar articulaciones posibles entre ambas metodologías, puentes que den lugar a formas de construcción de conocimiento que condensen los aspectos centrales de cada una.

2. La urgencia de la desigualdad y la importancia de los datos.

“grey-scale photo of people protesting with We Are Better Than This signage” por Jerry Kiesewetter en Unsplash

El segundo debate sobre el cual me gustaría referirme y que debería estructurar algunos de los trabajos que existen en la actualidad en políticas de datos, es el de la desigualdad. Vivimos en la región más desigual del mundo y el 63% de las infancias en Argentina son pobres. ¡Sí 63%!

Las ciencias sociales han teorizado y debatido sobre las condiciones estructurales de la pobreza en la región, algunas incluso han pasado a la acción con programas de políticas públicas focalizados en la reducción de brechas. En Argentina se han producido solo por nombrar algunos estudios, abordajes desde la historiografía (Adamovsky, 2012), desde un enfoque de estratificación social (Torrado, 1994, 2012), de la estructura social argentina (Del Cueto y Luzzi, 2008), de la desigualdad (comps. Salvia, 2019), de la pobreza (Kessler y Di Virgilio, 2008) y con un enfoque desde en las infancias desde el Observatorio de la Deuda Social de la Universidad Católica Argentina (Tuñón, 2018).

A su vez, es posible encontrar ejemplos de políticas públicas focalizadas en la reducción de la pobreza en la región a través de transferencias condicionadas de ingresos. Sin embargo, entre la crisis del COVID-19 y la crisis económica, la pobreza no ha hecho más que aumentar. Incluso recientemente, el informe ‘El estado de la inseguridad alimentaria en el mundo 2021′ (SOFI), elaborado por cinco agencias de Naciones Unidas, evidencia los peores datos de la década en términos de hambre y malnutrición.

¿Pueden los datos contribuir a la reducción de la pobreza? La respuesta es un gran “sí, pero…”. Sí pueden, pero necesitamos que las personas que toman las decisiones de implementación de políticas públicas los utilicen para maximizar sus resultados. La información vale y es vital para solucionar este problema. Sin embargo, pareciera que ni el Estado ni las áreas de responsabilidad social empresarial resultan muy interesados en utilizar la big data para reducir la desigualdad.

Un ejemplo de ello está en el mismo Ministerio de Desarrollo Social de la Nación, que no cuenta con un área consolidada en datos, con mapas y tableros en tiempo real que le permitan desarrollar políticas focalizadas donde las urgencias son mayores (en el conurbanos bonaerense la pobreza infantil alcanza 72,7%) y políticas a largo plazo para mejorar la situación de las infancias.

Otro ejemplo de la falta de creación de datos para comprender dinámicas de pobreza y poder desarrollar políticas para reducirla lo encontramos en las muestras de la mayoría de las encuestas nacionales realizadas por el Instituto Nacional de Estadísticas y Censos (INDEC). Estas no incluyen relevamiento en villas y asentamientos, donde viven las personas más vulneradas del país. ¿Qué sabemos sobre la situación crítica y de vulnerabilidad en las que viven las personas en Argentina? Muy poco.

Ahora bien, la pobreza en las infancias debe ser analizada con datos (que no tenemos muchos) y con perspectiva de género. ¿Por qué? Porque la pobreza está feminizada, las mujeres son más pobres (63% de mujeres se ubican en el primer decil de ingreso sobre 37% de varones, inversamente 37% de mujeres se ubican en el decil más alto de ingresos sobre 63% de varones), según los datos publicados por INDEC para el 3° trimestre de 2020. Son las mujeres las que crían solas a las infancias pobres, son las mujeres las que no acceden a puestos de trabajo de mejor remuneración, son las mujeres las que cargan con toda la responsabilidad y son las mujeres a las que el Estado elige invisibilizar.

Una aclaración en este sentido: las mujeres no son las únicas que viven en situaciones de vulnerabilidad y el Estado elige invisibilizar, una situación similar atraviesan las personas trans, especialmente las feminidades trans, sobre las que poquísimos datos tenemos. Sabemos por sus historias de vida, por investigaciones cualitativas que viven en condiciones de exclusión y marginalidad. No tenemos datos sobre cuántas de ellas viven en condiciones de pobreza e indigencia, ni tampoco sobre sus condiciones de empleo o acceso a la vivienda.

El debate sobre las condiciones que generan y estructuran la pobreza es vasto. Lo que me interesa puntualizar aquí está en relación con la responsabilidad política de que ciertos datos no existan y en consecuencia, que no se desarrollen políticas públicas que partan de análisis empíricos con solidez metodológica. Así como tampoco que estas políticas públicas produzcan datos confiables para el monitoreo y evaluación, con el objetivo de medir si efectivamente logran reducir la pobreza. Mientras tanto, la pobreza apremia e hipoteca futuros y los datos no parecen ser insumos dispuestos a utilizarse.

3. Los transfeminismos interseccionales y decoloniales

“Because God said so” de Alexandra Gallagher

La tercera discusión que me gustaría recuperar para pensar los procesos de producción de la información y de los datos deviene de los postulados de los transfeminismos interseccionales y decoloniales.

Los feminismos, especialmente el feminismo negro, el feminismo decolonial, y el feminismo queer, se escribe y se piensa desde las márgenes, desde el Sur, desde lo subalterno, discute contra hegemonía blanca de los varones y las mujeres cis del Hemisferio Norte. Estos feminismos vienen a plantear que sus demandas, que sus problemas, que sus vidas nada tienen que ver con las de las mujeres cis, heterosexuales, de centros urbanos de países ricos. Así, sus propuestas y sus llamamientos a la acción están centrados en los márgenes, en la posibilidad de ser “otredades”.

Sus postulados, nos legan la posibilidad de narrar vidas y posibilidades de ser que la hegemonía niega sistemáticamente. Es por ello que, si pensamos en el mundo de los datos, no nos alcanza con revisar algunas de las formas en las que se registran ciertas variables.

La pregunta que dispara la reflexión es ¿queremos continuar con los mismos procesos de producción de los datos estadísticos que históricamente invisibilizaron a las mujeres, a las personas trans, a las personas en situación de vulnerabilidad? Si la respuesta es “no”, entonces es necesario revisar integralmente su proceso de producción.

Otero en su clásico estudio sobre los primeros Censos de Población (1999) señala la relación política entre el encuestador y el modelo del Estado argentino. De esta manera pone de manifiesto una producción estadística al servicio de los ideales de la Nación recién emergida. Por tanto, si no somos capaces de revisitar las discusiones del feminismo negro, del feminimo decolonial, de los estudios queer, de la teoría travesti de Wayar, difícilmente seremos capaces de tener datos que nominen a las identidades trans.

En el 2021, desde DataGénero, el Observatorio de Datos con Perspectiva de Género que creamos junto a Ivana Feldfeber y Yasmín Quiroga, organizamos la Datatón Transfeminista de Datos Faltantes. En esta oportunidad, dirigí junto a dos compañeras trans, una feminidad trans y una persona trans no binaria, la mesa “faltamos nosotres campeón” desde la que se impulsaron discusiones en relación con la falta de datos de personas trans y no binarias y durante el proceso de trabajo, comprendí como “no son los mismos datos los que necesitamos”. Las personas cis-género y especialmente los varones, han dominado tanto la producción de datos y de estadística que existen formas y datos que son incomensurables desde las vivencias trans y no binarias. No solo que los datos no los nombran sino que tampoco explican sus vidas.

De modo que, si no queremos continuar reproduciendo información que es producida bajo estructuras patriarcales y hegemónicas, necesitamos repensar los sistemas de producción de los datos desde el Sur, haciendo partícipes al colectivo de personas trans y no binarias, es decir, con un proceso colaborativo, con perspectiva de género e interseccional.

4. La epistemología y la metodología de investigación en juego

La última y más estructurante de las discusiones es la de la construcción epistémica o, dicho más en criollo, la de cómo intentar matar de una vez y para siempre al universal androcéntrico.

La ciencia no es objetiva, mucho menos la ciencia de datos. Catherine O’Neil en una charla TED sostiene que los algoritmos son opiniones que se convierten en código. En esta línea, Diana Maffía señala que los sesgos en los algoritmos pueden ocurrir en tres partes: la definición del objetivo, al introducir los datos y al elegir un atributo.

Sin embargo, ¿hay una fetichización en el término inteligencia artificial? ¿El algoritmo emerge como un ente fuera de lo humano y a su vez como una “mercancía” insesgada? Podríamos argumentar, a raíz de escandalosos ejemplos como los de modelos predictivos de suicidios que perpetúan disparidades raciales[1] o los modelos de predicción algorítmica de la policía de Estados Unidos que son racistas[2], que la inteligencia artificial no es inteligente ni es artificial: es humana, es sesgada y precisa ser estrictamente supervisada.

En esta línea, quisiera plantear dos consideraciones sobre la pretensión de objetividad y neutralidad en inteligencia artificial. La primera es que ésta reproduce concepciones estereotipadas y sesgadas de la ciencia sobre la objetividad que han sido discutidas en torno a la posición epistémica y el rol de la ciencia desde Tomás Kuhn en adelante. La segunda, es que bajo la noción de objetividad y universalidad se esconde el más profundo androcentrismo, el que piensa desde y como un investigador del siglo XIX (o lo que es igual a decir como varones cis blancos del Hemisferio Norte con pretensiones de saber).

Las epistemologías feministas con Harding y Haraway a la cabeza, vuelven manifiesto el carácter histórico, singular y situado de la producción científica. No hay universales, no hay un “hombre”, hay mujeres cis, varones cis, mujeres trans, varones trans y personas trans no binarias. Sin embargo, esta discusión parece no estar presente en el campo de la ciencia de datos.

Como socióloga no puedo dejar preguntarme por los motivos que hacen que en pleno siglo XXI, la inteligencia artificial emerja como una especie de “salvador universal y objetivo” de los problemas, en una forma totalizante y mística, sin siquiera considerar que los sesgos que produce y reproduce están en estrecha relación con las personas que investigan. Tampoco puedo evitar volver a Bourdieu (2004) para recuperar la vigilancia epistemológica [3], como concepto y como praxis. Así y solo así tendremos la oportunidad de revisar los procesos de producción, recolección, análisis y publicación de los datos con rigurosidad técnica y perspectiva de género que nos prevenga de seguir reproduciendo concepciones estereotipadas sobre lo femenino y lo masculino, lo universal y lo particular. Formas que están mucho más en relación con el sentido común de los investigadores que con la ciencia misma.

Howard Becker escribió “Para hablar de la sociedad, la sociología no basta”, un libro que muestra cómo las pretensiones de saber, explican pero no bastan. En este texto y con la licencia de hacer una alusión a su obra, juego con las palabras para pensar que para hablar de la sociedad, los datos y los algoritmos no bastan. Los datos proporcionan información para interpretar problemas sociales y evidencian sesgos y estereotipos presentes en la sociedad. Sí, los datos son una parte del entramado de representaciones que necesitamos para interpretar el mundo en el que vivimos y nos urge que sean más representativos, más justos y más igualitarios. Pero no debemos olvidar que los datos, los sistemas de información, los modelos algorítmicos y las redes neuronales son generados por personas, están lejos de ser objetivos y no reflejan el panorama completo. Es urgente comenzar a cuestionar la presunción de objetividad y de buenas intenciones en el mundo tecnológico, donde las empresas son las que llevan la delantera y marcan el ritmo de lo que se desarrolla y también de lo que no.

*Mailén García es Directora de Planificación Estratégica de DataGénero. Licenciada en Sociología (UNMDP) y Magíster en Derechos Humanos y Democratización en América Latina y el Caribe (UNSAM). Actualmente trabaja como investigadora especialista en estadísticas sociales con perspectiva de género (Ministerio de Hacienda y Finanzas de la provincia de Buenos Aires) y como coordinadora académica de la Especialización en Políticas Pública y Perspectiva de Género (IFPyGP-GCBA).

Bibliografía

Adamovsky, E. (2012). Historia de las clases populares. Buenos Aires: Sudamericana

Kessler, Gabriel y Di Virgilio, María Mercedes. (2008). La nueva pobreza urbana: dinámica global, regional y argentina en las últimas dos décadas. Santiago de Chile: CEPAL.

Becker, Howard. (2015). Para hablar de la sociedad. La sociología no basta. Buenos Aires: Siglo XXI.

Bourdieu, Pierre; Chamboredon, Jean Claude y Passeron, Jean Claude. (2004). El oficio del sociólogo. Buenos Aires: Siglo XXI.

Criado-Pérez, Caroline. (2019). La mujer invisible: descubre cómo los datos configuran un mundo hecho por y para los hombres. New York: Abrams Press.

Del Cueto, Carla y Luzzi, Mariana (2008). Rompecabezas : transformaciones en la estructura social argentina. Los Polvorines: Univ. Nacional de General Sarmiento; Buenos Aires: Biblioteca Nacional.

Haraway, Donna. (1991). Conocimientos situados: la cuestión científica en el feminismo y la perspectiva parcial. En Donna Haraway, Ciencia, cyborgs y mujeres. La reinvención de la naturaleza (pp. 313–346). Madrid: Cátedra.

Harding, Sandra (2016). Ciencia y feminismo. Madrid: Ediciones Morata

Kuhn, Thomas. ([1962] 2004). La estructura de las revoluciones científicas. Ciudad Autónoma de Buenos Aires: Fondo de Cultura Económica.

Maffía, Diana. (2020). Sesgos de género en la Inteligencia Artificial. En Intervenciones feministas para la igualdad y la justicia. Ed: JusBaires del Consejo de la Magistratura (pp. .319–356).

O’Neil, Catherine. (2016). Weapons of Math Destruction: how big data increases inequality and threatens democracy. New York: Crown Publishing.

Otero, H. (1999). Demografía política e ideología estadística en la estadística censal argentina, 1869–1914. Anuario IEHS: Instituto de Estudios histórico sociales, (14), 43–70.

Salvia, Agustín y Rubio, María Berenice comp. (2019). Tendencias sobre la desigualdad : aportes para pensar la Argentina. Ciudad Autónoma de Buenos Aires : Universidad de Buenos Aires. Instituto de Investigaciones Gino Germani.

Torrado, Susana. (1994). Estructura social de la Argentina. Buenos Aires: Ediciones de la Flor.

Torrado, Susana. (2007). Población y Bienestar en la Argentina del primero al segundo centenario. Buenos Aires: Editorial Edhasa.

Tuñon, Ianina. (2018). (In)equidades en el ejercicio de los derechos de niñas y niños. Derechos humanos y sociales en el período 2010–2017. Buenos Aires: EDUCA. ISBN 978–987–620–363–0.

Notas al pie

[1] Véase más en https://healthitanalytics.com/news/suicide-risk-prediction-models-could-perpetuate-racial-disparities

[2] Véase más en https://www.technologyreview.com/2020/07/17/1005396/predictive-policing-algorithms-racist-dismantled-machine-learning-bias-criminal-justice/

[3] La vigilancia epistemológica es un concepto utilizado por Pierre Bourdieu para señalar aquella actividad que ejerce la persona que investiga cuando logra reconocer la separación entre el discurso científico y la opinión común y aplica, para evitar caer en la sociología espontánea, técnicas de objetivación, una estrategia de construcción teórica del objeto de estudio y otras estrategias de decisión sobre los métodos y técnicas a utilizar.

La vigilancia epistemológica es una práctica que la persona que investiga debe tomar a lo largo de todo el proceso de investigación, y responde, en definitiva a los actos epistemológicos del procedimiento científico: ruptura, construcción y comprobación.

--

--

DataGénero - Observatorio

Sin igualdad de datos no hay igualdad de género 💜✊ | https://www.datagenero.org / | Twitter e Instagram: @datagenero