By Jaime Díez MedranoDirector del WVS Archive y del Archivo {ASEPJDS}
El fichero de datos del WVS se hace cada vez más extenso con el tiempo, gracias a la incorporación de nuevas oleadas de nuevos o antiguos países participantes. Por consiguiente, los investigadores no sólo disponen de una fuente de datos que les permite comparar sociedades con valor creciente, sino también de una herramienta avanzada que requiere cierto dominio.
El archivo de datos WVS responde a diario a muchas preguntas planteadas por investigadores de todas partes del mundo. La mayoría de estas preguntas guardan relación con temas como ponderación, índices especiales y combinación de oleadas: ¿Qué variable se debe utilizar para ponderar? ¿Por qué existen tantas variables de ponderación? ¿Cómo se calculan dentro de cada país?
El propósito de este capítulo es aclarar todas las dudas sobre ponderación e introducir a los lectores a algunos conceptos nuevos como ponderación equilibrada en cuanto a población. Utilizaremos ejemplos de sintaxis para ilustrar los procedimientos o referiremos a nuestros lectores a los documentos que pueden ser descargados desde el sitio web www.worldvaluessurvey.org.
Trabajando con muestras ponderadas del Values Studies
El fichero oficial de 5 oleadas World Values Survey incluye seis variables de ponderación diferentes y puede ser descargado desde el sitio web del WVS www.worldvaluessurvey.org. Con tal cantidad de variables uno se pregunta inmediatamente cuál de ellas utilizar.
Las variables que incluye son:
S017 – S017A
Ponderación original del país
S018 – S018A
Ponderación equilibrada a N=1000
S019 – S019A
Ponderación equilibrada a N=1500
S017 es la variable de ponderación original proporcionada por cada país participante. El objetivo de S017 es compensar pequeñas desviaciones en la muestra resultante con respecto a una o varias dimensiones de referencia que son importantes para obtener resultados fidedignos. Estas dimensiones pueden ser: distribución por edad y sexo, por población urbana-rural, o incluso distribución según la educación del encuestado. Cada país participante decide qué método de ponderación se utilizará. En general, no es apropiado utilizar la ponderación para compensar desviaciones significativas de la muestra real respecto de la diseñada.
Sea cual sea el criterio utilizado, los procedimientos para calcular factores de ponderación son similares. Normalmente, se define una matriz de datos con la proporción estimada de cada combinación de categorías que sería presentada en la muestra. Podemos obtener esta estimación a partir del censo, de las estadísticas del país, etc. Esta es la matriz de distribución objetivo. Luego se calcula la distribución real de cada combinación de categorías para la muestra realizada. La ponderación es, por definición, la matriz de factores que se multiplican por la matriz de datos de la muestra realizada para obtener la matriz de distribución objetivo.
A continuación, ilustraremos un ejemplo de ponderación simple por Edad y Sexo.
Muestra teórica
Hombres
Mujeres
18-29
11,8%
11,3%
30-49
18,5%
18,3%
50-64
9,5%
9,9%
65 y más
8,8%
12,0%
Muestra real
10,1%
9,8%
20,7%
19,3%
10,4%
11,0%
Factores de ponderación
1.1710
1.1491
0.8902
0.9482
0.9559
0.9570
0.9940
1.0927
En este ejemplo, el valor 1,1710 (18-29, Hombres) es el resultado de la división de 11.8% (porcentaje real de Hombres de 18-29 años) por 10.1%, el porcentaje real, obtenido del fichero de datos. De esta manera, cada registro de encuestados correspondiente a hombres de 18 a 29 años de edad debería contar como 1,1710 en lugar de 1 caso.
Esto no lo demostraremos aquí ya que cae fuera del alcance del capítulo, pero el método indicado arriba mantiene el tamaño de la muestra. Esto quiere decir que, si el archivo tiene un N de 1200 casos, tendríamos igualmente un N de 1200 casos si utilizamos los factores de ponderación arriba calculados.
El sitio web WVS ( www.worldvaluessurvey.org) incluye secciones especiales como Technical Information y Documentation of Data con información metodológica a nivel de la muestra del país. Podrá encontrar ahí información específica sobre el criterio utilizado para calcular la ponderación, si fuera el caso.
Ponderación original del país, equilibrada 1000 y 1500
S018 and S019 son variables de ponderación derivadas de S017 que sirven para convertir el N de la muestra en 1000 o 1500. Igualar todas las Ns de la muestra puede ser de utilidad para varios propósitos.
Ambas variables se obtienen multiplicando los factores de S017 por un mismo valor constante, de tal modo que el N final varía. De este modo no cambian las proporciones por sexo, edad etc de la muestra ponderada por S017.
El primer propósito de S018 y S019 es equilibrar todas las muestras para que sean iguales en un análisis combinado. En el estudio WVS 2005 la muestra de India es 2001, mientras que la de Estados Unidos es 1249. Si utilizamos S017 como variable de ponderación en un análisis combinado, la muestra de India excedería a la de Estados Unidos ya que su N es mayor. Si utilizamos S1018, que es proporcional a S017, ambas muestras tendrían 1000 casos (o 1500 si se utiliza la variable S019).
El segundo objetivo de crear S018 es servir de base para la construcción de variables de ponderación para escalar las muestras por su población real. Estas variables de escala darían una N para cada país igual al tamaño de la población de la región cubierta por la muestra. Con dicha ponderación, la N de India sería igual a 1,165,720,000 y la N de Estados Unidos igual a 306,790,000 (con las proyecciones de sus respectivas poblaciones para el 2009). De esta manera, Estados Unidos e India tendrían muestras diferentes en un análisis combinado, pero por lo menos habría un criterio para esta diferencia en ponderación.
En general, S018 se puede utilizar para calcular toda clase de ponderación especial que clasifique los países en cualquier dimensión cuantificada (económica, cultural, etc.).
La fórmula para dicha ponderación es sencilla:
Wpaís=S018/1000 x Población país
Téngase en cuenta que en la mayoría de análisis estadísticos, la influencia de las Ns de un país no tendrá mayor importancia. Además, al comparar cifras relativas por país no habrá ningún impacto en la N del país, ya que las cifras relativas no cambiarán a nivel nacional.
Construyendo una variable de ponderación por población para el fichero de datos de 5 oleadas
El fichero agregado de 5 oleadas, que puede ser descargado del sitio web del World Values Survey, no incluye ninguna ponderación basada en la población y por lo tanto es decisión del investigador construirla o no.
Para facilitar el trabajo de los usuarios, aquí ponemos a su disposición la sintaxis en estilo SPSS para construir dicha variable.
COMPUTE POPWEIGHT=0.
FORMAT POPWEIGHT (F15.5).
IF (S003=8) POPWEIGHT=S018/1000*3639459. /*Albania*/
IF (S003=12) POPWEIGHT=S018/1000*33769669. /*Algeria*/
IF (S003=20) POPWEIGHT=S018/1000*887000. /*Andorra*/
IF (S003=31) POPWEIGHT=S018/1000*8238672. /*Azerbaijan*/
IF (S003=32) POPWEIGHT=S018/1000*40135000. /*Argentina*/
IF (S003=36) POPWEIGHT=S018/1000*21831000. /*Australia*/
IF (S003=40) POPWEIGHT=S018/1000*8356707. /*Austria*/
IF (S003=50) POPWEIGHT=S018/1000*150448340. /*Bangladesh*/
IF (S003=51) POPWEIGHT=S018/1000*3230100. /*Armenia*/
IF (S003=56) POPWEIGHT=S018/1000*10741000. /*Belgium*/
IF (S003=70) POPWEIGHT=S018/1000*3981239. /*Bosnia and Herzegovina*/
IF (S003=76) POPWEIGHT=S018/1000*191403000. /* Brazil*/
IF (S003=100) POPWEIGHT=S018/1000*7602100. /* Bulgaria*/
IF (S003=112) POPWEIGHT=S018/1000*9671900. /*Belarus*/
IF (S003=124) POPWEIGHT=S018/1000*33698000. /*Canada*/
IF (S003=152) POPWEIGHT=S018/1000*16929000. /*Chile*/
IF (S003=156) POPWEIGHT=S018/1000*1331540000. /*China*/
IF (S003=158) POPWEIGHT=S018/1000*23027672. /*Taiwan*/
IF (S003=170) POPWEIGHT=S018/1000*44981000. /*Colombia*/
IF (S003=191) POPWEIGHT=S018/1000*4432000. /*Croatia*/
IF (S003=196) POPWEIGHT=S018/1000*8016. /*Cyprus*/
IF (S003=203) POPWEIGHT=S018/1000*10474600. /*Czech Republic*/
IF (S003=208) POPWEIGHT=S018/1000*5515287. /*Denmark*/
IF (S003=214) POPWEIGHT=S018/1000*9365818. /*Dominican Republic*/
IF (S003=222) POPWEIGHT=S018/1000*7185218. /*El Salvador*/
IF (S003=231) POPWEIGHT=S018/1000*79221000. /*Ethiopia*/
IF (S003=233) POPWEIGHT=S018/1000*1340341. /*Estonia*/
IF (S003=246) POPWEIGHT=S018/1000*5337719. /*Finland*/
IF (S003=250) POPWEIGHT=S018/1000*65073482. /*France*/
IF (S003=268) POPWEIGHT=S018/1000*4382100. /*Georgia*/
IF (S003=276) POPWEIGHT=S018/1000*82062200. /*Germany*/
IF (S003=288) POPWEIGHT=S018/1000*23416500. /*Ghana*/
IF (S003=300) POPWEIGHT=S018/1000*11262500. /*Greece*/
IF (S003=320) POPWEIGHT=S018/1000*13000000. /*Guatemala*/
IF (S003=344) POPWEIGHT=S018/1000*7008900. /*Hong Kong*/
IF (S003=348) POPWEIGHT=S018/1000*10029900. /*Hungary*/
IF (S003=352) POPWEIGHT=S018/1000*319326. /*Iceland*/
IF (S003=356) POPWEIGHT=S018/1000*1165720000. /*India*/
IF (S003=360) POPWEIGHT=S018/1000*230512000. /*Indonesia*/
IF (S003=364) POPWEIGHT=S018/1000*70495782. /*Iran*/
IF (S003=368) POPWEIGHT=S018/1000*31234000. /*Iraq*/
IF (S003=372) POPWEIGHT=S018/1000*4517800. /*Ireland*/
IF (S003=376) POPWEIGHT=S018/1000*7411500. /*Israel*/
IF (S003=380) POPWEIGHT=S018/1000*60090400. /*Italy*/
IF (S003=392) POPWEIGHT=S018/1000*127580000. /*Japan*/
IF (S003=400) POPWEIGHT=S018/1000*6198677. /*Jordan*/
IF (S003=410) POPWEIGHT=S018/1000*48379392. /*South Korea*/
IF (S003=417) POPWEIGHT=S018/1000*5356869. /*Kyrgyzstan*/
IF (S003=428) POPWEIGHT=S018/1000*2256400. /*Latvia*/
IF (S003=440) POPWEIGHT=S018/1000*3350400. /*Lithuania*/
IF (S003=442) POPWEIGHT=S018/1000*4917000. /*Luxembourg*/
IF (S003=458) POPWEIGHT=S018/1000*27730000. /*Malaysia*/
IF (S003=466) POPWEIGHT=S018/1000*12000000. /*Mali*/
IF (S003=470) POPWEIGHT=S018/1000*4126000. /*Malta*/
IF (S003=484) POPWEIGHT=S018/1000*109955400. /*Mexico*/
IF (S003=498) POPWEIGHT=S018/1000*3572700. /*Moldova*/
IF (S003=504) POPWEIGHT=S018/1000*31491578. /*Morocco*/
IF (S003=528) POPWEIGHT=S018/1000*16517532. /*Netherlands*/
IF (S003=554) POPWEIGHT=S018/1000*4314100. /*New Zealand*/
IF (S003=566) POPWEIGHT=S018/1000*140003542. /*Nigeria*/
IF (S003=578) POPWEIGHT=S018/1000*4825300. /*Norway*/
IF (S003=586) POPWEIGHT=S018/1000*166783500. /*Pakistan*/
IF (S003=604) POPWEIGHT=S018/1000*29180900. /*Peru*/
IF (S003=608) POPWEIGHT=S018/1000*90500000. /*Philippines*/
IF (S003=616) POPWEIGHT=S018/1000*38130300. /*Poland*/
IF (S003=620) POPWEIGHT=S018/1000*10631800. /*Portugal*/
IF (S003=630) POPWEIGHT=S018/1000*3916632. /*Puerto Rico*/
IF (S003=642) POPWEIGHT=S018/1000*21496700. /*Romania*/
IF (S003=643) POPWEIGHT=S018/1000*141837000. /*Russian Federation*/
IF (S003=646) POPWEIGHT=S018/1000*8648248. /*Rwanda*/
IF (S003=682) POPWEIGHT=S018/1000*27601038. /*Saudi Arabia*/
IF (S003=702) POPWEIGHT=S018/1000*4839400. /*Singapore*/
IF (S003=703) POPWEIGHT=S018/1000*5413548. /*Slovakia*/
IF (S003=704) POPWEIGHT=S018/1000*86116559. /*Vietnam*/
IF (S003=705) POPWEIGHT=S018/1000*2053355. /*Slovenia*/
IF (S003=710) POPWEIGHT=S018/1000*48697000. /*South Africa*/
IF (S003=716) POPWEIGHT=S018/1000*13349000. /*Zimbabwe*/
IF (S003=724) POPWEIGHT=S018/1000*45828172. /*Spain*/
IF (S003=752) POPWEIGHT=S018/1000*9276509. /*Sweden*/
IF (S003=756) POPWEIGHT=S018/1000*7725200. /*Switzerland*/
IF (S003=764) POPWEIGHT=S018/1000*63389730. /*Thailand*/
IF (S003=780) POPWEIGHT=S018/1000*1047366. /*Trinidad and Tobago*/
IF (S003=792) POPWEIGHT=S018/1000*71517100. /*Turkey*/
IF (S003=800) POPWEIGHT=S018/1000*29592700. /*Uganda*/
IF (S003=804) POPWEIGHT=S018/1000*46143700. /*Ukraine*/
IF (S003=807) POPWEIGHT=S018/1000*2048900. /*Macedonia*/
IF (S003=818) POPWEIGHT=S018/1000*76797512. /*Egypt*/
IF (S003=826) POPWEIGHT=S018/1000*59175000. /*Great Britain*/
IF (S003=834) POPWEIGHT=S018/1000*40213160. /*Tanzania*/
IF (S003=840) POPWEIGHT=S018/1000*306790000. /*United States*/
IF (S003=854) POPWEIGHT=S018/1000*13228000. /*Burkina Faso*/
IF (S003=858) POPWEIGHT=S018/1000*3477778. /*Uruguay*/
IF (S003=862) POPWEIGHT=S018/1000*28359313. /*Venezuela*/
IF (S003=891) POPWEIGHT=S018/1000*10832545. /*Serbia and Montenegro*/
IF (S003=894) POPWEIGHT=S018/1000*11862740. /*Zambia*/
IF (S003=900) POPWEIGHT=S018/1000*61131000. /*Germany West*/
IF (S003=909) POPWEIGHT=S018/1000*1800000. /*Northern Ireland*/
EXECUTE.
Si desea revisar los resultados, realice un análisis de frecuencias correspondiente a la variable S021, que es la variable (país-oleada-estudio-set-año). Esta variable tendrá un valor diferente para cada muestra.
Como es lógico, las frecuencias arriba mencionadas muestran que existen varias muestras para cada país. Esto es normal porque la mayoría de países realizan sondeos en las diferentes oleadas, e incluso más de una vez en la misma oleada. Este es el caso de España o Turquía, que tienen datos para ambos estudios WVS y EVS; o de Marruecos, donde se realizaron dos sondeos en el 2001 para medir el impacto del atentado terrorista del 11 de septiembre en Nueva York.
Al realizar un análisis combinado con más de una muestra por país, es importante considerar el impacto de dicha ponderación. Se pueden introducir correcciones en la sintaxis indicada dividiendo la ponderación para el número de veces que aparece el país en el fichero combinado a analizar. En general, esto queda bajo criterio del investigador.