Leyendo a propósito que Facebook organizó una pre-conferencia para sociólogos antes de la reunión de la Asociación Americana de Sociología, me encuentro que en el blog donde lo leí se plantea lo siguiente criticando algunas de las premisas del análisis de datos de Facebook (link aquí)
This is common: “big” data is more natural and objective because researchers can peer in and gather data without disturbing what happens in this highly-recordable social context. Big N’s and small p’s from the comfort of the screen. At this point, methodologists are pulling their hair out: Facebook, or any social platform, isn’t “natural” (even when sidestepping nerdier debates if anything at all is ‘natural”). That Facebook “big” data is made by users unaware of or unconcerned about social science researchers doesn’t change the fact it is made through and around a structure engineers have coded. Yes, researchers, quant and qualitative, bias data in the collection process, but of course so does the Facebook and any site’s data collection process.
Ahora, creo que la crítica es, lamentablemente, profundamente equivocada. Los datos de Facebook son datos naturales porque corresponden (estrictamente) a un proceso social real. Es un hecho ‘natural’ de ese proceso el que esté limitado y sesgado por las formas en que los ingenieros lo codificaron; del mismo modo que otros procesos están sesgados y limitados por otros elementos (por ejemplo, estructuras legales o la influencia de quienes tienen poder o cualquier otro proceso que usted se le ocurra). La vida social es una vida sesgada.
Los datos de Facebook son datos naturales, en última instancia, porque en ellos el registro del proceso es el proceso: la conversación en Facebook es precisamente lo que queda registrado en sus datos; las relaciones en Facebook son las conexiones de amistades, de ‘me gusta’, ‘comentar’, ‘compartir’ que aparecen en las bases de datos. En ese sentido, el dato del proceso y el proceso son lo mismo. Algo que no sucede en otras situaciones: el discurso sobre un tema no es que lo recogen nuestras entrevistas o focus; la opinión de las personas no es lo que aparece en las encuestas. Aunque, por cierto, si corresponde a otras situaciones: la discusión en la esfera pública es lo que aparece en los medios (en las columnas de opinión, en las entrevistas de periódicos, en la actualidad además ahora en lo que aparece en blogs, en conversaciones en Twitter etc.)
El argumento anterior, para funcionar, requiere entender algo: Los datos de Facebook son datos naturales sobre procesos bien específicos: No son datos naturales de las conversaciones sociales en general, sino de las conversaciones en Facebook; no de las conexiones sociales en general, sino de las conexiones en Facebook. Eso puede ser menos que los que promueven el big data les gustaría, pero no deja de ser relevante -dado que las redes sociales en general (y Facebook en particular) son partes importantes en sí mismas de la realidad social.
Con sus limitaciones, siguen siendo datos naturales, y sus sesgos de operación son equivalentes a los que ocurren en procesos sociales reales.