viernes, 22 de mayo de 2009

Correlacion Lineal Y Regresion Cuadratica.

Correlacion Lineal:
Una Correlacion Lineal es podriamos decir el patron lineal que estara hecho de acuerdo a la variable X,Y, del cual podriamos decir que una depende de la otra para que nos pueda dar un buen resultado debemos de saber cual dependende de la otra.
Podriamos decir que una correlacion lineal pefecta es cuando todos los puntos estan sobre la linea o sobre una recta inclinada ya sea con direccion hacia ariba o hacia abajo, claro siempre teniendo en cuenta los distintos datos que nos esten planteando.



Regresion Cuadratica: Es como un metodo por el cual podemos encontrar en base a los datos que se esten recolectando, entonces en base a los resultados obtenidos podremos dibujar una linea que mejor se ajuste al resultado que se esta obteniendo atravez del analisis del problema ya resuelto. O podriamos decir que lo podemos trabajar conforme el promedio de los resultados que se hayan obtenido en la investigacion que se realizo.


Sesgo y Curtosis

Sesgo: se puede decir que es como un error que aparece en dicho resultado de alguna investigacion,esto puede deberse a los factores que dependen de la recoleccion de datos que nos podrian conducir a conclusiones que pueden ser verdaderas o falsas de lo podriamos llamar la realidad.

Asimetria: esta medida nos permite identificar si los datos que se estan analizando o investigando se distribuyen de alguna forma uniforme o con cabalidad,existen tres tipos de estado las cuales pueden ser:

Asimetria positiva: se dice que esta ocurre cuando la mayoria de los datos recolectados se encuentran por encima del valor de la media aritmetica.
Simetria: esta sucede cuando los datos recolectados se distribuyen de una forma igual de ambos lados,osea que aproximadamente quedan con los mismos datos de los dos lados con respecto a la media.
Asimetria Negativa: en este caso es cuando la mayoria de los datos repilados se juntan o aglomeran en los valores menores que la media.

Ejemplo de los 3 tipos de Asimetria:









CURTOSIS: este tipo de medida determina el grado de concentracion que presentan los valores en la region central de la distribucion. Por medio de esta podremos saber si extiste una gran concentracion de valores que podriamos llamar: Leptocurtica, o una concentracion normal de los datos que se le podria llamar: Mesocurtica y en el ultimo caso una baja concentracion o aglomeracion de datos que le llamamos: Platicurtica.
Ejemplo de lo antes mencionado:

viernes, 13 de marzo de 2009

MEDIDAS DE TENDENCIA CENTRAL

Media aritmética
Llamando xl, ..., xk a los datos distintos de un carácter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmética de la distribución de frecuencias en donde n es la frecuencia total.
Mediana
La mediana es otra medida de posición, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de ésta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales.
La moda
(Mo), de una distribución estadística es el valor que más se repite. Una distribución puede tener mas de una moda o no tener ninguna. En la distribución 4,6,6,7,9,11,13, la moda es Mo = 6.

MEDIDAS DE DISPERCION

LA VARIANZA (S2 ó δ2 ):
La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es la media aritmética de la distribución.Dicho de otra forma, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza.

LA DESVIACIÓN ESTÁNDAR (S ó δ)
Se podria decir que es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersión más utilizada, se le llama también desviación típica. La desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" ( δ ) ó por la letra S mayúscula, según otros analistas.

El Coeficiente de Variación (C.V.)
Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variación de Pearson", del que se demuestra que nos da un número independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersión aquella cuyo coeficiente de variación sea menor., y que se define como la relación por cociente entre la desviación estándar y la media aritmética; o en otras palabras es la desviación estándar expresada como porcentaje de la media aritmética.

MEDIDAS DE POSICION

CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el numero en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.

PERCENTILES
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.

Tablas y Distribucion de Frecuencias

Variable
cada una de las letras que se utilizan en álgebra en expresiones algebraicas, polinomios y ecuaciones, para designar números desconocidos. También se llaman variables a las letras (x, y…) que se relacionan mediante las funciones.
Variable discreta
Los distintos valores que puede tomar un carácter cuantitativo configuran una variable estadística. La variable estatura, en cierta población estadística, toma valores en el intervalo 147-205; y la variable número de hermanos toma los valores 0, 1, 2, 3, 4, 5, 6, 7 y 8. Una variable estadística como esta última es discreta, ya que sólo admite valores aislados. Una variable estadística es continua si admite todos los valores de un intervalo, como ocurre con la estatura.
Variable continua
Un carácter puede ser cuantitativo si es medible numéricamente o cualitativo si no admite medición numérica. El número de hermanos y la estatura son caracteres cuantitativos mientras que el sexo y el estado civil son caracteres cualitativos.

viernes, 6 de febrero de 2009

tallo y hojas

Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.

CODIFICACION

BUENO CODIFICAR SIGNIFA CAMBIAR LOS DIGITOS,DE UNA MANERA MAS FACIL SIN TENER QUE HACER UN GRAN PROCEDIMIENTO

CODIFICACION