lunes, 26 de diciembre de 2011

POBLACIÓN Y MUESTRA.



Creo que casi todos los que hemos llevado algún curso de estadística en el pregrado o postgrado hemos escuchado hablar acerca de una "Población" y de una "Muestra", aquí veremos brevemente de que se tratan y comentaremos su importancia. No voy a hacer una descripción de la metodología del muestreo, pues lo dejaré para otro post.
POBLACIÓN: Intuitivamente sabemos que población es la totalidad de elementos de algo (personas, objetos, mediciones, animales, cosas, muestras de laboratotio, etc). Saber cuál va a ser nuestra población de estudio es algo muy, pero muy importante como para pasarlo por alto. La persona que investiga debe tener suficiente conocimiento y experiencia con el trabajo de los elementos de la población a la cual desea estudiar.
Muchas veces hemos pensado en la población como algo inmensamente grande a la cual no vamos a poder tener acceso total. Por ejemplo, un estudiante del distrito de Breña al querer investigar acerca de la presión arterial, pensaba en todas las personas del planeta como la población.
Definir la población va a ser tarea y preferencia de cada persona.... vamos a poner un ejemplo de cómo ir reduciendo la población de interés hasta hacerla accesible a la investigación: Volvamos al ejemplo de investigar la presión arterial media en humanos. Primero debemos saber si la población van a ser niños, adultos o ancianos; si nos decidimos por los adultos, hay que delimitar si vamos a considerar a todos los adultos o sólo a quienes no tienen antecedentes de enfermedades cardiovasculares, o si preferimos trabajar con atletas o vegetarianos, etc; el sexo del paciente también es importante si se cree que hay diferencias entre los géneros.
Una vez definidas las características de edad, sexo, antecedentes, etc, podemos aventurarnos a restringir la población a una ciudad, y si ésto nos resulta complicado, lo reducimos a un distrito, a un barrio, a un hospital, etc. Siempre que el muestreo sea adecuado y representativo de la población, se puede seguir delimitando a la misma hasta hacerla accesible.
Finalmete podemos decidir que vamos a estudiar la presión arterial media en adultos jóvenes, sin antecedentes de patologías crónicas, varones, del distrito de Breña.
Es extremadamente importante saber que la población seleccionada sea accesible (éste es un error común). Quiero decir que debemos estar seguros de que podemos obtener los datos de cualquiera de los integrantes de nuestra población. Así, si hemos elegido a un ditrito, todos los habitentes del distrito deben estar disponibles para el estudio, si hemos elegido trabajar con los habitantes de un país, todos las personas de ése país deben estar disponibles para la investigación. Si no planeamos bien ésto podemos terminar en un gran problema.
MUESTRA: La muestra va a ser una parte REPRESENTATIVA de la población, es decir, la muestra debe contener las características de la población. Por ejemplo, si quiero investigar la prevalencia de tuberculosis entre los pacientes que acuden a un hospital, no debo obtener los datos solamente de los pacientes que acuden al servicio de neumología (donde se sabe que la prevalencia es alta), sino que debo considerar una muestra que contenga pacientes tanto de neumología como de las otras especialidades en proporciones muy parecidas para poder tener una conclusión de la totalidad del hospital.
Es muy importante que la muestra represente a la población ya que de ésto depende que podamos hacer inferencias hacia la población sin tener el temor de estar sacando conclusiones falsas.
Pero, ¿Para qué es tan importante todo ésto? El gráfico inicial puede ayudar.... Si queremos utilizar nuestra muestra obtenida para sacar conclusiones acerca de la población, debemos conocer de qué población se extrajo la muestra, sino, estaremos erroneamente sacando conclusiones e infiriendo resultados hacia otra población. En el gráfico se aprecia que si la muestra es representativa de la población que se muestra como círculo, no se deben sacar conclusiones hacia la población triángulo, sino solamente hacia la población círculo. Parece sencillo, pero es un error frecuente, muy frecuente, sobre todo cuando las poblaciones se parecen tanto que hace falta haberlas delimitado desde el inicio para no cometer errores al final del trabajo.
Espero que haya sido de ayuda, y sobre todo espero que se haya comprendido.

sábado, 24 de diciembre de 2011

Variables Estadísticas. Introducción.

VARIABLES EN ESTADÍSTICA.

Jorge Luis De La Cruz Oré.


Empezaremos viendo lo que quiere decir el término “variable”. Pues como suena, significa algo que varía, que cambia de valor de acuerdo a las circunstancias. Ahora, si recordamos nuestros
cursos de matemáticas, casi siempre una variable se encuentra al lado de su constante, es decir, son un par necesario. Así, se asigna una letra a una variable, por ejemplo “x” la cual va acompañada de un valor constante, por ejemplo “5x”, aquí “5” es la constante (porque no puede tomar otro valor numérico) y “x” es la variable, la que puede tomar diferentes valores dependiendo de la situación o las reglas que se le asignen.

El significado de variable en estadística no dista de ser parecida, podemos entonces decir que una variable es un símbolo que puede tomar diferentes valores numéricos o no numéricos
dependiendo de una regla que defina claramente cuáles valores les son permitidos. Por ejemplo, la estatura de una persona de un distrito “A” viene a ser una variable ya que puede tomas diferentes valores numéricos si es medida en diferentes personas en el distrito A (aquí la regla que define los valores de la variable es: “la estatura de las personas del distrito A”). Otro ejemplo de variable que puede tomar valores no numéricos es el estado civil de una persona, en éste caso los valores posibles serían: soltero, casado, divorciado, viudo, conviviente, etc. y cada persona puede ser asignada a una categoría dependiendo de alguna regla de asignación (por ejemplo, lo que la persona responda acerca de su estado civil, o lo que aparezca en el sistema de los registros de estado civil).
Conceptualizado lo que una variable significa, pasemos a ver cómo se clasifican éstas. Vamos a diferenciar dos grupos como lo hicimos al inicio: numéricas y no numéricas (entiéndase a las no numéricas como “no necesariamente numéricas”). Como ya mencionamos, las variables numéricas pueden tomar valores de números, por ejemplo la edad de una persona medida en años, el nivel de glucosa en la sangre de un paciente, etc. éstas también son llamadas “cuantitativas”. Las variables no numéricas (o no necesariamente numéricas) también pueden
llamarse “nominales”, “cualitativas” o “categóricas” ya que nombran categorías o cualidades, por ejemplo el estado civil o la inclinación religiosa de una persona (cristiano, musulmán, budista, etc.).

Entendido entonces la diferencia entre variables cuantitativas (numéricas) y cualitativas (no numéricas, categóricas o nominales), pasaremos a ver como es que se dividen aún más cada una de ellas.

Las variables cualitativas (no numéricas) pueden tomar en algunos casos solo dos valores posibles, como es el ejemplo del género: masculino o femenino. Otros ejemplos de variables cualitativas que toman solo dos posibles categorías son: la presencia de cierta enfermedad (enfermo o no enfermo), la supervivencia después de algún evento (vivo o muerto), etc. A éstas variables cualitativas que pueden ser clasificadas en solo dos valores (si o no) se les llama variables cualitativas dicotómicas o binarias (los prefijos “di-”y “bi-” significan “dos”). Las demás
variables cualitativas que pueden tomar valores dentro de más de dos categorías reciben el nombre de variables no dicotómicas o politómicas (de poli=muchos, tomos=separar). Debe quedar claro que tales variables cualitativas no dicotómicas se podrían “dicotomizar”, es decir, de acuerdo al diseño de investigación, una variable no dicotómica se puede transformar artificialmente en una dicotómica, por ejemplo al hablar de religiones (cristiano, budista, musulmán, etc.) se puede considerar solo dos categorías si el diseño de investigación así lo permite, tales categorías podrían ser: cristiano y no cristiano. Esto funciona bien cuando estamos en un área geográfica en la que predominan los cristianos, y las otras religiones tienen menos seguidores, así, se puede ahorrar recursos y esfuerzo considerando a la variable como si fuera dicotómica.

Las variables cuantitativas (numéricas) pueden ser también de dos tipos: discretas y continuas. Las variables discretas solo pueden tomar valores enteros (número de personas, número de cajas, número de ciudades, etc. y pertenecen al conjunto de los números naturales (los números naturales no incluyen a los negativos y no tienen decimales), ejemplos incluyen al número de pacientes atendidos en un consultorio en un día (no pueden existir 25,6 pacientes). Por otro lado las variables continuas pueden tomar infinitos valores entre dos valores escogidos, es así que pueden existir dos personas que pesan 64 y 65 kg cada una, y entre ellas pueden existir infinitos valores de pesos (64,1 kg; 64,134 kg, 64, 13479 kg, 64,56 kg, etc.), tales variables continuas pertenecen al conjunto de los números reales (los números reales consideran valores como 3,141524…; √3, etc.)

Resumiendo, las variables pueden dividirse en cuantitativas (numéricas) y cualitativas (no numéricas). Las variables cualitativas pueden a su vez ser dicotómicas (binarias) o no dicotómicas (politómicas). Las variables cuantitativas pueden ser discretas (números enteros positivos) y continuas (números reales).