Descripción

Una variable proxy (o variable sustituta) es una medida fácilmente observable o medible que se utiliza en un o modelo en lugar de una variable de interés que es difícil, costosa o imposible de medir directamente. Aunque no es el valor que realmente interesa, debe tener una fuerte correlación (positiva o negativa) con la variable subyacente que intenta representar. Sirve como un sustituto o indicador indirecto de esa variable inobservable o latente.

Investigación cuantitativa

La principal razón para usar proxy es la falta de datos directos. Esto ocurre en varios escenarios:

  • Inobservabilidad: La variable es un concepto abstracto (como la «felicidad,» el «capital humano» o la «inteligencia») que no se puede medir con una sola métrica física.

  • Coste: La recopilación de datos directos sería demasiado costosa o consumiría mucho tiempo.

  • Disponibilidad: Los datos directos no están disponibles en la fuente o el formato necesario para el estudio.

El uso de una variable proxy siempre introduce un grado de imprecisión en el análisis. La efectividad de un proxy depende del grado de fortaleza y precisión de su correlación con la variable de interés. Un proxy deficiente puede llevar a conclusiones sesgadas o incorrectas, por lo que su elección y justificación son cruciales en la investigación.

Investigación cualitativa

En la , la idea de un proxy no se utiliza formalmente para la sustitución de variables en una fórmula, sino que se manifiesta en la elección de casos de estudio o indicadores para representar conceptos más amplios.

Aquí el propósito del uso de un proxy es seleccionar un caso, un evento o una característica observable que se presume que es representativa de un fenómeno o proceso más amplio e intangible. Se utiliza para la operacionalización del estudio y la obtención de datos ricos en contexto. En lugar de buscar una correlación numérica, se busca la representatividad contextual o la saturación teórica.

Mientras que en la la proxy es una sustituta dentro de un modelo, en la investigación cualitativa se asemeja más a la selección estratégica de casos o indicadores contextuales que permiten acceder y representar el fenómeno de interés.

Ejemplos

Variable de interés (difícil de medir) Variable proxy (fácil de medir) Razón
Nivel de vida / Bienestar económico PIB per cápita. El per cápita se correlaciona con el nivel de riqueza y servicios disponibles.
Habilidades / Capital humano Años de educación completados. Se asume que más educación se relaciona con mayores habilidades y conocimientos.
Inteligencia o capacidad cognitiva Promedio de calificaciones o puntuaciones de pruebas estandarizadas. Estas métricas se utilizan como indicadores del rendimiento intelectual.
Niveles de obesidad Índice de Masa Corporal (IMC). El IMC es una medición rápida que se correlaciona con el porcentaje de grasa corporal real.

Estudio de un caso particular

Si se quiere entender la variable eficacia de la reforma educativa nacional (un concepto inobservable y vasto), la investigación cualitativa podría estudiar a fondo «una escuela rural específica» que se considera ejemplar o paradigmática. La escuela específica actúa como un proxy o una ventana para comprender el fenómeno mayor.

Indicadores de un tema

Para estudiar la variable clima laboral deficiente (intangible), el equipo investigador puede centrarse en observar y analizar como indicadores o proxies de ese clima los índices de rotación de personal y las quejas formales, los cuales son obtenidos de entrevistas o documentos.

Imaginemos la siguiente situación: estamos intentando desarrollar un modelo para determinar qué impulsan el crecimiento del PIB en diferentes países.

Variable de interés (inobservable)

Uno de los factores teóricos más importantes que influyen en el crecimiento económico a largo plazo es el capital humano; esto es, el stock de conocimientos, habilidades, competencias y atributos incorporados en los individuos que facilitan la creación de bienestar económico.

Problema de medición

No existe una métrica única y fácil para cuantificar directamente el conocimiento o las habilidades totales de la población de un país.

Elección de la variable proxy

Dado que no podemos medir el capital humano directamente, buscamos un indicador que esté fuertemente correlacionado con él. La proxy más común utilizada en este tipo de estudios es el nivel promedio de escolaridad de la población adulta.

  • Variable proxy: Promedio de años de educación formal completados por los adultos de 25 años o más.

Se asume que, en promedio, una población con más años de escolaridad tiene un mayor nivel de conocimientos y, por lo tanto, un mayor capital humano.

El modelo económico

En lugar de incluir la variable inobservable capital humano () en la ecuación, se sustituye con la variable proxy años de educación ().

Donde:

  • es la .

  • es otra .

  • (la proxy) representa el efecto del capital humano en el crecimiento.

  • es el coeficiente que mide cuánto contribuyen los años de educación al crecimiento económico.

Interpretación

Si el modelo arroja que el coeficiente es positivo y estadísticamente significativo, el análisis económico concluye que hay una relación positiva entre el capital humano (medido a través de la proxy de educación) y el crecimiento económico.

El uso de la proxy permite a los investigadores cuantificar un concepto abstracto () y obtener resultados que pueden ser utilizados para la formulación de políticas públicas (por ejemplo, justificar la inversión en educación).

En resumen, la variable años de educación actúa como un sustituto medible del concepto abstracto de capital humano para que el modelo pueda ejecutarse y generar conclusiones significativas.

Sinónimos:
variable sustituta