Una de las formas normales en que uno puede evaluar la corrección e interés de modelos explicativos es usando la idea de varianza explicada. Un buen modelo es aquel que explica más la varianza. A lo más, si se hace la observación que un modelo que explica más varianza poniendo millones de variables no es mucho lo que sirve, uno podría decir que el mejor modelo es aquel que explica más varianza usando menos variables. Pero la idea sigue siendo evaluar explicaciones desde el punto de la varianza.
Y eso resulta insuficiente. La razón es muy sencilla: Una explicación de la varianza deja todavía el nivel absoluto fuera totalmente de la explicación. Y en varios casos lo que nos puede interesar, más que cuanto varía un parámetro determinado, es el nivel en el que se encuentra.
Pensemos en el siguiente ejemplo. Supongamos que cuando Becker planteaba que el delito se explica por factores racionales (en particular, por el costo asociado) tiene razón. Supongamos que cuando uno retruca que el delito no se puede explicar sólo por lo anterior -porque, digamos, independiente de los costos y beneficios mucha gente sencillamente no cometería un determinado delito (digamos, no se le ocurriría asesinar a alguien), también se tiene razón.
Uno bien podría decir que la cantidad de la población que puede cometer delitos se establece por factores sociales y culturales. Y para el resto de la población, la decisión de cometer o no cometer un delito se toma en función de los costos y beneficios. En este modelo, es importante hacer notar que prácticamente toda la variación se puede explicar a la Becker, pero la explicación seguiría siendo incompleta.
No tengo la menor idea de si la idea anterior es correcta empíricamente -aunque resulta algo plausible. Pero si nos muestra que un modelo de explicación basado en sólo explicar la varianza resulta insuficiente. Eso sí, es más fácil, nos basta establecer que tales variables están asociadas en sus movimientos para pensar que hemos explicado todo lo que hay que explicar.
Hola Juan:
No estoy muy seguro de haber entendido tu entrada. Pero así, a primera vista, me parece que la distinción no es enteramente válida. Pues supón que para explicar por qué algunos cometen delitos y otros no en términos culturales, llegas a la conclusión de que los evangélicos no lo hacen, pero sí los ateos 😉
Ahí también estarías “explicando” la varianza, pero de una variable dicotómica (comete v/s no comete delito).
La gracia de Becker, me imagino, es que no sólo “explica” la varianza, sino que propone un mecanismo de generación de las decisiones, que es una verdadera explicación, es decir, va más allá de la mera asociación de variables. La idea de esta asociación es que, de existir, “prueba” en cierto modo que esa explicación causal es válida (o al menos señala que no es posible rechazarla).
Explicar la varianza, en otras palabras, es lo poco que pueden hacer los cientistas sociales cuando no es posible experimentar.
De hecho, podrías explicar los “niveles” de delincuencia en un país, si eres capaz de explicar la “varianza” entre países.
Ahora, explicar el nivel de delincuencia del mundo es dificil pues no tienes otros mundos disponibles, aunque podrías resolver eso si examinas la varianza a través del tiempo, y supones que es variable estacionaria y ergódica.
Saludos
EH
Recuerda que el ejemplo es solo a titulo de ilustración -no estoy planteando que sea un modelo correcto.
La idea es que supongamos que el modelo correcto es que hay un determinado conjunto de personas que nunca realizaría un delito y hay un determinado conjunto de personas que realizaría o no un delito dependiendo de consideraciones racionales. O más general y saliendonos del ejemplo, hay un conjunto que no tiene X, y un conjunto que puede tener X depende de ciertas situaciones (los elementos que producen el conjunto pueden ser individuos, países, grupos etc.)Ahora, la varianza podría ser completamente capturable por una teoría que se refiriera a ese segundo conjunto(porque es el que varía su conducta entre situaciones), pero dejaríamos todavía una parte importante de la realidad fuera.
Ahora, puede que el mundo no funcione de esa forma, pero son modelos posibles. Y es una realidad que no sería entendida por una idea que entiende que explicar es explicar la varianza.
Juan:
mi punto es que la “varianza” es lo único que te permite hacer “pseudo-experimentos”, esto es, interrogar a la realidad para contrastar tu teoría.
De lo contrario tu teoría cae más bien en la especulación filosófica, y no en las ciencias sociales.
E insisto: tener vs no tener es también un tipo de “varianza”. Tal vez no pueda capturarse de la misma manera que la “otra”, pero no es fundamentalmente diferente. Podría ser un modelo probit o logit, con variables explicativas “culturales”.
De hecho, existen maneras en que estadísticamente es posible combinar ambos tipos de variación entre casos (creo que se llaman regresiones truncadas).
Slds
EH
Tener / no tener es una forma de varianza, pero no cambia el argumento. El tema no es la diferencia entre variables nominales y variables numéricas, sino una entre lo que es parte de una constante y lo que es parte de la varianza.
Un modelo que explica toda la varianza de acuerdo a la variable X y Z, deja la constante fuera. Si por ejemplo usamos regresion logistica (para pensar en variables categoriales) y decimos que tener X sube tu posibilidades (¿como se traduce odds?) en tal número, no tengo todavía una predicción si cuento los efectos de todas las variables hasta que introduzco la constante.
Puedo explicar toda la varianza y todavía se me quedan cosas fuera.
¿Es lo mejor que puede hacerse dado que tenemos a lo mas seudo-experimentos? (Aunque, de hecho, hay más experimentos en ciencias sociales de lo que solemos pensar) Puede que así sea, pero reconocer las limitaciones es uno de los pasos para empezar a ver como se superan.
Juan:
El punto de mis ejemplos era esa constante.
La constante de Chile puede ser diferente de la de otros países: la variabilidad entre países ahí te sirve.
Para ponerlo en términos más concretos: en Chile un 20% no comete delitos, y explicamos la cantidad de delitos del otro 80% en base a cualquier teoría (por ejemplo Becker). Pero ese 15% es 20% en un país muy católico, como irlanda, y sólo 5% en países nórdicos (muy ateos). Entonces esa variabilidad nos permite explicar eso que era una constante. 😉
Ahora bien, puede haber una constante común a todos los países: ahí te sirve la variación temporal, si es que asumimos ergodicidad.
Volviendo a los delitos: en Chile tenemos ese 15%, pero 10 años antes era un 20%. Esa variabilidad nos permitirá decir algo sobre quienes no cometen delitos.
Pero si hablas de una especie de constante universal sociológica (¿Existe alguna?), ¡ni siquiera la física puede explicar el valor preciso de sus constantes!
Saludos
EH