sábado, 23 de mayo de 2009

  • LA MODA...

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues sólo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolación.
Ejemplo
Número de personas en distintos carros en una carretera: 5-7-4-6-9-5-6-1-5-3-7. en este caso el número que más se repite es 5, entonces la moda es 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:La moda es el dato más repetido, el valor de la variable con mayor
frecuencia absoluta. En cierto sentido se corresponde su definición matemática con la locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues sólo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolación.
Ejemplo
Número de personas en distintos carros en una carretera: 5-7-4-6-9-5-6-1-5-3-7. en este caso el número que más se repite es 5, entonces la moda es 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:








viernes, 22 de mayo de 2009


Mediana (estadística)
Para otros usos de este término, véase mediana.
En Estadística, una mediana es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.Datos Agrupados: Media, Moda, Mediana


sábado, 9 de mayo de 2009

REGRESION Y CORRELACION SIMPLE
ECONOMETRIA
Repaso de Estadística:
Variables aleatorias: Son aquellas cuyo valor está relacionado a cierta probabilidad de ocurrencia. Por ejemplo, la ocurrencia de que caiga cara al lanzar una moneda al aire es de 50 % de los casos, de que caiga un uno al lanzar un dado es 1/6 por cada cara del dado.
Variables discretas: Toman valores enteros.
Variables continuas: Toman valores tanto enteros así como fracciones.

Medidas estadísticas:
· Medidas de tendencia central:
o Media: Es el valor representativo de la población. La media de una variable, intuitivamente, es la medida de su tendencia central. En otras palabras esperaríamos que la media sea el promedio de las observaciones de un experimento o de varios experimentos.
SX / n = X

o Moda: Es el valor más frecuente.
o Mediana: Es el valor central.

· Medidas de variabilidad:
o Varianza: Es la sumatoria de las desviaciones al cuadrado de las observaciones con respecto a su media.
S(X – X)2 =s2
o Desviación estándar: Es la raíz cuadrada de la varianza. Se presta a ser interpretado en los valores mismos de la variable.

s= S(X – X)2

Muestra aleatoria: Es aquella en la cual cada uno de los elementos del marco muestral tiene igual probabilidad de ser escogido dentro de la muestra.

Estimador insesgado: Un estimador insesgado es una medida estadística, cuya media es igual al parámetro poblacional del cual él es estimador.

Estimador consistente: Es aquel en el cual la probabilidad de existir diferencia con respecto al parámetro es mínima o prácticamente nula mientras el tamaño de muestra se incrementa.

Nota: Cuanto más grande es una muestra, más cercano será el valor del estimador (muestra) al valor del parámetro (población).

Herramientas de análisis y descripción de relaciones entre variables

Uno de los problemas centrales en econometría es el desarrollo de técnicas efectivas para la estimación de las relaciones cuantitativas entre las variables económicas.

Descripción de las relaciones estadísticas entre dos variables: Esta será mediante el uso de la covarianza y la correlación.

Las relaciones entre variables puede observarse a través de diagramas de dispersión.

La covarianza: Nos sirve para saber si dos variables están relacionadas positiva o negativamente. El valor de la covarianza puede ser mayor a 0 cuando la relación entre las variables es positiva, o ya sea menor a cero en el caso de existir una relación negativa. Sin embargo, el valor de la relación puede ser igual a 0. Esta última situación se puede presentar en dos circunstancias básicas: La primera es que ambas variables son independientes; el segundo caso es cuando las dos variables no estén relacionadas de una forma no lineal.

s2x,y = [S (X – X)(Y – Y)]/ n - 1



Coeficiente de correlación: Además de conocer si dos variables están positiva o negativamente relacionadas, también es necesario conocer qué tan fuertemente están relacionadas. La medición de la covarianza es inconveniente para medir el grado de fuerza de asociación, ya que su valor es calculado en base a las unidades propias de cada variable.
El grado de fuerza de relación entre dos variables puede ser medido a través del coeficiente de correlación, cuyo valor es independiente de las unidades particulares de cada variable.

El coeficiente de correlación se calcula de la siguiente manera:

sx,y
rx,y = --------- , donde:
sxsy


sx= E(X-mx)2 y sy= E(Y-my)2 .



Algunas propiedades del coeficiente de correlación son:
· Siempre tiene el mismo signo de la covarianza.
· Si el coeficiente de correlación es menor a cero la correlación es negativa, si es mayor a cero la correlación será positiva.
· Podemos ver que el coeficiente de correlación posee todas las características de la covarianza en términos de indicar el tipo de relación existente entre las variables.
· El valor del coeficiente de correlación puede tomar valores desde menos uno hasta uno, indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en cualquier dirección, más fuerte será la asociación lineal entre las dos variables.
· Mientras más cercano a cero sea el coeficiente de correlación indicará que más débil es la asociación entre ambas variables.
· Si es igual a cero se concluirá que no existe relación lineal alguna entre ambas variables.

Si en una relación exacta entre dos variables Y= a + bX , decimos que a es el intercepto en Y y que b es la pendiente de la función. En este caso si b<>0 el coeficiente de correlación será positivo.




REGRESIÓN SIMPLE


El análisis de regresión es un conjunto de métodos estadísticos para la formulación matemática de modelos de relaciones entre variables, las cuales pueden ser usados para predecir o hacer inferencias estadísticas. El análisis de regresión tiene los siguientes usos, el primero es obtener los estimadores de los parámetros, estimar la varianza del error, obtener los errores estandares de los parámetros estimados, probar las hipótesis sobre los parámetros, calculo de valores estimados basados en la ecuación estimada, estimar el ajuste o la falta de ajuste del modelo.

PROPIEDADES DEL MODELO DE REGRESION

La forma del modelo es correcta, o sea que todas las variables independientes importantes están incluidas.
El valor estimado del error es igual a cero.

La varianza de los errores es constante para todas las observaciones.

Los errores no están correlacionados, o sea que son independientes.

Como nosotros sabemos, teniendo Y=a+bX, a es el intercepto, b es la pendiente de la función la que nos indica el cambio marginal de Y respecto a X.

b=[S(x-X)(yt-Y)]/[S(xt-X)2]

a=Y-bX



COEFICIENTE DE DETERMINACIÓN

Al haber ya tenido, el modelo de regresión necesitamos saber la fuerza de la relación entre las variables analizadas, para lo cual necesitamos una medida de esa fuerza, para ello utilizaremos el coeficiente de determinación.

R2= [RSS]/[TSS] =[ S(Yt-Y)2 ]/[ S(Yt-Y) 2]=Suma de cuadrados de la regresión/suma de cuadrados.

Suma de cuadrados del error = TSS-RSS = ESS


R2=1, Existe una relación lineal perfecta.
R2=0, El modelo de regresión lineal no explica la relación entre variables.
R2=0.63, Decimos que la relación estimada puede explicarse 63 % de la variación la variable dependiente.
R2=0.99, Explica que existe una relación extrema entre las variables analizadas, o sea que el modelo de regresión explica el 99% de la variación y que solo el 1% es inexplicada.



EJEMPLO DE UNA REGRESION Y CORRELACION SIMPLE

EN EXCEL:

Los datos de X pongalos en la columna 1 y los de Y en la columna 2. Después de esto vaya a INSERTAR, seleccione Fx Función, seleccione ESTADÍSTICAS y por último selecciona COEF. DE CORREL, nos va a dar el coeficiente de correlación.

Para el cálculo del Coeficiente de determinación de la regresión, seleccionamos dentro de las medidas estadísticas de excel, el COEFICIENTE R2. Nos va aparecer seleccionar los valores de X y de Y.
Se puede definir a la Regresión, como una correlación matemática basada en la ecuación de la recta modificada. Existen varios tipos de regresión y todos se basan en modificaciones de la formula de regresión lineal :
Y = a + b . X (ecuación matemática de la recta)
Y es la variable dependiente (de estudio) y X la variable independiente.
a y b son factores derivados de la ecuación matemática de la recta.
Básicamente, por medio de la regresión se pretende predecir el valor de una variable llamada genéricamente “Y”, a través de otra variable llamada “X”.
La regresión se representa mediante un coeficiente R que oscila entre - 1 y + 1. Cuando la variable dependiente Y aumenta ante incrementos de la variable independiente X , el R es positivo y oscila entre 0 y 1. A su vez cuando Y disminuye ante incrementos de X el R es negativo, entre 0 y –1. Veamos algunos ejemplos para una mejor comprensión :




El gráfico muestra la relación existente entre sumatoria de puntos del Sistema Apache II a las 24 horas del ingreso y la probabilidad de mortalidad en terapia intensiva. El valor de R es 0,98 para un nivel de p < 0.001. El valor de R2 es 0.97. El R2 es un coeficiente importante en regresión. Se deduce de la elevación al cuadrado de R y es representativo del grado de relación entre variables. Un R2 de 0.97, significa que el valor de la probabilidad de mortalidad podrá ser predecido en un 97% de las veces por el valor del Apache II.
Por lo tanto el valor de R2 indica el porcentaje de variabilidad de los valores de Y que pueden ser explicadas en función de la variabilidad de los valores de X.
Los modelos de regresión no siempre son lineales y se basan en loa ecuación pura de la recta. Existen también modificaciones de esta ecuación de tal manera que se pueden practicar análisis de regresión cuadrática, cúbica, logarítmica, logística, etc. Además la regresión puede ser simple o múltiple, constituyendo un tipo de análisis multivariado.

.
USANDO BIOSTAT
http://jlopezco.topcities.com/biostat/biostat_main.htm

X * 1 Prueba nueva
Y * 2 Prueba estandarizada
X Y
50 61
55 61
60 59
65 71
70 80
75 76
80 90
85 106
90 98
95 100
100 114





Date: 28/02/2002 05:18:56 p.m.
Regression Analysis
Analisis Of Variance. Dependent Variable: Prueba estandarizada

Source DF SS MS Fc P-value

Model 1 3472.0364 3472.0364 95.811 0.00000
Error 9 326.1455 36.2384
Total 10 3798.1818

R2: 0.9141

Regression Analysis
Model Parameters and Standard Error

Parameter Estimate Std Error t Ho:B=0 P-value
Intercept -1.0000 8.7988 -0.114 0.9120
Prueba nueva 1.1236 0.1148 9.788 0.0000

Regression Analysis
Residuals, Hi and D-Cook statistics

Observed Predicted Std Res Hi D-Cook
61.0000 55.1818 1.1705 0.3182 0.3197
61.0000 60.8000 0.0380 0.2364 0.0002
59.0000 66.4182 -1.3548 0.1727 0.1916
71.0000 72.0364 -0.1843 0.1273 0.0025
80.0000 77.6545 0.4107 0.1000 0.0094
76.0000 83.2727 -1.2671 0.0909 0.0803
90.0000 88.8909 0.1942 0.1000 0.0021
106.0000 94.5091 2.0433 0.1273 0.3044
98.0000 100.1273 -0.3885 0.1727 0.0158
100.0000 105.7455 -1.0922 0.2364 0.1846
114.0000 111.3636 0.5304 0.3182 0.0656

Regression Analysis
Variance-Covariance Matrix follows:
Intercept Prueba nueva
Intercept 77.41837 -0.98832
Prueba nueva -0.98832 0.01318
REGRESION
La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico.
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. Las ecuaciones de cada relación se presentan en la siguiente tabla.
Tabla 1. Ecuaciones de regresión
REGRESIÓN
ECUACIÓN
Lineal
y = A + Bx
Logarítmica
y = A + BLn(x)
Exponencial
y = Ae(Bx)
Cuadrática
y = A + Bx +Cx2
Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya que es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace uso del coeficiente de correlación R, el cual mide el grado de relación existente entre las variables. El valor de R varia entre -1 y 1, pero en la práctica se trabaja con el valor absoluto de R, entonces, a medida que R se aproxime a 1, más grande es el grado de correlación entre los datos, de acuerdo con esto el coeficiente de correlación se puede clasificar de varias formas, como se observa en la Tabla 2.
Tabla 2. Clasificación del grado de correlación.
CORRELACIÓN
VALOR O RANGO
Perfecta
|R| = 1
Excelente
0.9 <= |R| < 1
Buena
0.8 <= |R| < 0.9
Regular
0.5 <= |R| <0.8
Mala
|R|< 0.5

Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una herramienta útil para la planeación.
Después de éste tratamiento superficial acerca de regresiones, se continua con un caso práctico relacionado con la empresa ESTIMAR LTDA. A continuación se presentan los ingresos y costos en millones obtenidos mensualmente durante todo el año 2002 y los seis primeros meses del 2003.Optamos por presentar éste caso ya que resulta muy práctico a la hora de aplicar la técnica de regresión. Además porque permite analizar como se han comportado los ingresos y costos de la empresa a partir del año 2002 y a su vez pronosticar según la tendencia arrojada, como será el comportamiento de los ingresos y costos para el resto del año 2003 y con base en ellos inferir o tomar decisiones a corto plazo.
Distribuciones BivariantesEs cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bivariantes.
Ejemplo 1:Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:
MATEMÁTICAS
2
4
5
5
6
6
7
7
8
9
LENGUA
2
2
5
6
5
7
5
8
7
10
Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bivariante.
RegresionLa regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.
Correlación
Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.
Medida De La CorrelaciónLa apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.
El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo
destacaremos una de sus propiedades
-1 < r < 1
Correlación Lineal Y Recta De RegresiónCuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta.En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
Ejemplo 2:Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).
Diagrama De DispersiónLa primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la resolución eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números
Linea De TendenciaLa línea de tendencia es la herramienta básica más importante con la que cuenta el analista técnico. Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista) o de puntos máximos (línea de tendencia bajista).Sirve para determinar en primer lugar la dirección del mercado y establecer sus objetivos de proyección. Marca los niveles de soporte o de resistencia que están proyectando los precios. Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede tomar al iniciar o cerrar una posición, tomando como referencia el precio actual respecto a línea de tendencia y su proyección. La ruptura de una línea de tendencia al alza o la baja es una de las señales que confirma un cambio en la dirección de los precios. Son la base para trazar los canales que encuadran el posible movimiento de los precios. Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.
Modelo Matematico
Llamado tambien ajuste de curvas es una ecuacion dada en un grafico, dependiendo del grado de correlacion que mas se ajuste al conjunto de datos.
AJUSTE LINEAL: Y=BX+A
AJUSTE LOGARITMICO: Y=B Ln X+A
AJUSTE EXPONENCIAL: Y=AC BX
AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX2 + BX + A
EstimativosEs una valoracion aproximada basado en datos de periodos anteriores (datos historicos o estadisticos) a traves de muestreos.
PronósticosEs estimar un valor de y dado o supesto un valor de x. Tambien se puede decir que es preveer el futuro.Enuncie Los Pasos Para Ajustar Un Conjunto De Datos Y Crear Un Conjunto Su Modelo MatematicoTener tabulado un conjunto de datos Xi, Yi cuyas variables tengan relación
Utilidades Vs Costos
Costos Vs Cantidad Producida
Utilidades Vs Mes
Costos Vs Semanas
Ingresos Vs Año
Graficar los datos Xi, Yi (Diagrama de dispersion o nube de puntos). Esto permite visualizar la linea de tendencia.Contruya el modelo matematico que mas se ajuste teniendo en cuenta el grado de correlacion.
Perfecta [r]=1
Excelente 0.9 <=[r]<=1
Regular 0.5<=[r]<0.8
Mala [r]<0.5
Series CronológicasUna SERIE cronológica es un conjunto de observaciones (ordenado en términos de tiempo). Algunos ejemplos de series cronológicas serian aspectos tales registros de precipitación pluvial diaria, las ventas semanales, el producto nacional bruto trimestral, mediciones de la temperatura.El objeto de analizar tales datos es determinar si se presentan ciertos patrones o pautas no aleatorias.Algunas veces se trata de descubrir patrones no aleatorios que se puedan utilizar para predecir el futuro.En otras coacciones, el objetivo es asegurarse de que no haya patrones no aleatorios. En estos casos, dichos patrones son considerados como una señal de que un sistema o proceso esta " fuera de control".La siguiente explicación tiene relacion con el análisis intrínseco, el cual se concentra en los datos históricos de la variable de estudio. Cabria destacar que el análisis intrínseco es ampliamente empleado en los negocios y en l a industria. El objetivo reconocido del análisis intrínseco es describir mas que explicar los patrones históricos de los datos (es decir, identificar diversos patrones). Además el supuesto en el que se basa el análisis intrínseco, estable que existe un constante sistema causal relacionado con el tiempo, el cual influye en los datos. En otras palabras, los datos históricos supuestamente reflejan l a influencia de todos los factores de manera uniforme atravez del tiempo. Por ejemplo, un estudio de ventas realizadas en un periodo de 14 años puede revelar que las ventas han aumentado de manera uniforme a razón de casi 10% anual. Con base en esto se lleva a cabo una proyección de las ventas futuras, suponiendo que cualesquiera que fuesen las fuerzas que hayan dado lugar a este patrón, continuaran en le futuro.
Números Índices Un número índice mide qué tanto una variable ha cambiado con el tiempo. Mide la variación relativa entre las variables económicas: Variaciones en los precios, en los salarios, en los ingresos, etc.Se calculan para 2 períodos de una serie de tiempo o para todos los períodos de una serie de tiempo con respecto a un período fijo llamado período base.Que importancia tienen estas tematicas para cualquier ciencia.La Estadistica es de gran importancia en las diferentes empresas, enfocadas desde cualquier area profesional ya que ayudan a lograr una adecuada planeacion y control apoyados en los estudios de pronosticos, presupuestos etc.
Motivan a la alta gerencia para que definan los objetivos basicos de la empresa.
Propician que se defina una estructura adecuada, determinando la responsabilidad y autoridad de cada una de las partes que integran la organización.
Incrementan la participación de los diferentes niveles de la organización, cuando existe motivacion adecuada.
Obligan a mantener un archivo de datos historicos controlables.
Facilitan a la administracion la utilizacion optima de los diferentes insumos.
Facilitan la coparticipación e integracion de las diferentes areas de la compañía.
Obligan a realizar un autoanalisis periodico.
Facilitan el control administrativo.
Son un reto que constantementese presenta a los ejecutivos de una organización para ejercitar su creatividad y criterio profesional a fin del mejoramiento de la empresa.
Ayudan a lograr una mayor efectividad y eficiencia en las operaciones.
Que importancia tiene para usted como contador (a) la realización de pronósticos.
Para prevenir los cambios del entorno, de manera que anticipandose a ellos sea mas fácil la adaptacion de las organizaciones.
Para integrar los objetivos y decisiones de la organización.
A traves de los pronosticos, se pueden prever las perdidas en los resultados de los estados financieros futuros, y de esta manera se pueden tomar decisiones bien sea la reduccion de costos y gastos, planear estrategias que ayuden al mejoramiento de la empresa, y que se cumpla con el objetivo de toda empresa que es obtener utilidades.
Con base en analisis de rotacion de inventarios se puede tomar la decision de aumentar o sacar del mercado un producto.
En cuales areas de su competencia profesional es útil aplicar este conocimiento.
Economia
Administración
Psicología y las demas áreas afines (Ciencias exactas y ciencias Sociales)
Medicina etc. Nosotras pensamos que estos temas de estadística son indispensables en cualquier área ya que a diario se presentan situaciones donde intervienen dos variables y es importante este conocimiento para la toma de decisiones.
3. Análisis De Resultados
Realizando un breve análisis de la EMPRESA ESTIMAR LTDA. Podemos observar la poca o nula estabilidad comercial , la cual tuvo mucha variabilidad en cada uno de los meses, donde podemos concluir que la empresa tuvo acogida por los clientes, si observamos los ingresos mensuales que fueron aumentando, sinembargo las utilidades fueron cada vez más decrecientes debido a la mala administración dada por los jefes de producción donde invirtieron mas de lo que realmente vendían. Esto a su vez, demuestra que en una situación como la que se presentó en el periodo del año 2002 y los seis primeros meses del año 2003, es más difícil lograr un punto de equilibrio; es decir, el esfuerzo en la inversión es mayor para compensar lo que se deja de ganar en el margen.
Como podemos observar en la tabla de números índices base fija (# pagina) en el mes de junio de 2003 se hace demasiado notable la mala administración por parte de la empresa debido a que tenemos una variación en el costo del 250%, una variación en los ingresos del 125% y una variación de las utilidades de un déficit del 125%; lo cual no tiene sentido alguno en el desarrollo de las actividades de una empresa, donde el objetivo general de una empresa es obtener rentabilidad.
En la tabla de números índice en base móvil, observamos que el porcentaje de variación de costos y el de los ingresos respecto a la tabla en base fija van disminuyendo a medida que avanza el periodo, mientras que el porcentaje de variación en las utilidades en las dos tablas fueron muy diferentes, el la base móvil las utilidades estuvieron muy variables entre utilidad y perdida, en cambio en la base fija siempre se presento déficit en forma creciente a medida en que avanzaba el periodo.
4. Conclusiones
Es de suma importancia que la empresa ESTIMAR LTDA. Realice una planeación de presupuesto con el fin de investigar sobre el comportamiento de los diferentes mercados, los cuales tienen incidencia directa sobre el producto, como también realizar el plan de necesidades de insumos el cual consiste en detectar los requerimientos de los diferentes recursos que intervienen en el proceso productivo de tal modo que se pueda hacer frente al plan de mercados.
Realizar el plan financiero que tiene como finalidad decidir como se resolvera el problema de liquidez y de financiamiento de la empresa, una vez que se haya pronosticado los ingresos y los desembolsos provenientes del plan de requerimientos de insumos.
Mediante un buen grado de correlación, podemos fácilmente hacer estimativos acerca de cómo se va a comportar una variable de interés (en nuestro caso los ingresos, costos y utilidades mensuales de la empresa ESTIMAR LTDA.) a través del tiempo.
Los ingresos de ESTIMAR LTDA. desde Enero de 2002, presentan una tendencia creciente y se ajustó aun modelo matemático polinomial con un grado de correlación excelente, R = 0.9627, mostrando una buena relación entre los datos manejados.
Se observa que ESTIMAR LTDA. es una empresa con una muy mala gestión administrativa, porque fueron mas altos los costos que los ingresos a pesar que estos estuvieron mas o menos por el mismo nivel afectando notablemente las utilidades en forma negativa; por tal motivo es necesario mantener en la empresa costos estándar actualizados, con el propósito de que facilite la elaboración del presupuesto de requisiciones de materia prima, mano de obra y de gastos de fabricación indirectos, ya que de otra forma, se determinarían en forma muy imprecisa
La mejor estrategia para que no suceda lo anterior estriba en tomar medidas practicas para la reducción de costos, lo cual generara mayor margen y permitirá a la empresa mejorar su posición competitiva.

REGRESION Y CORRELACION


La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico.
Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. Las ecuaciones de cada relación se presentan en la siguiente tabla.
Tabla 1. Ecuaciones de regresión
REGRESIÓN
ECUACIÓN
Lineal
y = A + Bx
Logarítmica
y = A + BLn(x)
Exponencial
y = Ae(Bx)
Cuadrática
y = A + Bx +Cx2
Sin embargo obtener el modelo de regresión no es suficiente para establecer la regresión, ya que es necesario evaluar que tan adecuado es el modelo de regresión obtenido. Para esto se hace uso del coeficiente de correlación R, el cual mide el grado de relación existente entre las variables. El valor de R varia entre -1 y 1, pero en la práctica se trabaja con el valor absoluto de R, entonces, a medida que R se aproxime a 1, más grande es el grado de correlación entre los datos, de acuerdo con esto el coeficiente de correlación se puede clasificar de varias formas, como se observa en la Tabla 2.
Tabla 2. Clasificación del grado de correlación.
CORRELACIÓN
VALOR O RANGO
Perfecta
|R| = 1
Excelente
0.9 <= |R| < 1
Buena
0.8 <= |R| < 0.9
Regular
0.5 <= |R| <0.8
Mala
|R|< 0.5

Por lo tanto el análisis de regresión es una herramienta estadística que permite analizar y predecir o estimar observaciones futuras de dos o más variables relacionadas entre sí, es decir una herramienta útil para la planeación.
Después de éste tratamiento superficial acerca de regresiones, se continua con un caso práctico relacionado con la empresa ESTIMAR LTDA. A continuación se presentan los ingresos y costos en millones obtenidos mensualmente durante todo el año 2002 y los seis primeros meses del 2003.Optamos por presentar éste caso ya que resulta muy práctico a la hora de aplicar la técnica de regresión. Además porque permite analizar como se han comportado los ingresos y costos de la empresa a partir del año 2002 y a su vez pronosticar según la tendencia arrojada, como será el comportamiento de los ingresos y costos para el resto del año 2003 y con base en ellos inferir o tomar decisiones a corto plazo.
Distribuciones BivariantesEs cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bivariantes.
Ejemplo 1:Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:
MATEMÁTICAS
2
4
5
5
6
6
7
7
8
9
LENGUA
2
2
5
6
5
7
5
8
7
10
Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bivariante.
RegresionLa regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.
Correlación
Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas.
Medida De La CorrelaciónLa apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa.
El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo
destacaremos una de sus propiedades
-1 < r < 1
Correlación Lineal Y Recta De RegresiónCuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta.En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube.
Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
Ejemplo 2:Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados.Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).
Diagrama De DispersiónLa primera forma de describir una distribución bivariante es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Un diagrama de dispersión es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son que el descubrimiento de las verdaderas relaciones de causa-efecto es la clave de la resolución eficaz de un problema, que las relaciones de causa-efecto casi siempre muestran variaciones, y que es más fácil ver la relación en un diagrama de dispersión que en una simple tabla de números
Linea De TendenciaLa línea de tendencia es la herramienta básica más importante con la que cuenta el analista técnico. Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista) o de puntos máximos (línea de tendencia bajista).Sirve para determinar en primer lugar la dirección del mercado y establecer sus objetivos de proyección. Marca los niveles de soporte o de resistencia que están proyectando los precios. Permite analizar en cada momento el nivel de Beneficio/Riesgo que se puede tomar al iniciar o cerrar una posición, tomando como referencia el precio actual respecto a línea de tendencia y su proyección. La ruptura de una línea de tendencia al alza o la baja es una de las señales que confirma un cambio en la dirección de los precios. Son la base para trazar los canales que encuadran el posible movimiento de los precios. Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras.
Modelo Matematico
Llamado tambien ajuste de curvas es una ecuacion dada en un grafico, dependiendo del grado de correlacion que mas se ajuste al conjunto de datos.
AJUSTE LINEAL: Y=BX+A
AJUSTE LOGARITMICO: Y=B Ln X+A
AJUSTE EXPONENCIAL: Y=AC BX
AJUSTE PARABOLICO, CUADRATICO O POLINOMIAL: Y= AX2 + BX + A
EstimativosEs una valoracion aproximada basado en datos de periodos anteriores (datos historicos o estadisticos) a traves de muestreos.
PronósticosEs estimar un valor de y dado o supesto un valor de x. Tambien se puede decir que es preveer el futuro.Enuncie Los Pasos Para Ajustar Un Conjunto De Datos Y Crear Un Conjunto Su Modelo MatematicoTener tabulado un conjunto de datos Xi, Yi cuyas variables tengan relación
Utilidades Vs Costos
Costos Vs Cantidad Producida
Utilidades Vs Mes
Costos Vs Semanas
Ingresos Vs Año
Graficar los datos Xi, Yi (Diagrama de dispersion o nube de puntos). Esto permite visualizar la linea de tendencia.Contruya el modelo matematico que mas se ajuste teniendo en cuenta el grado de correlacion.
Perfecta [r]=1
Excelente 0.9 <=[r]<=1
Regular 0.5<=[r]<0.8
Mala [r]<0.5
Series CronológicasUna SERIE cronológica es un conjunto de observaciones (ordenado en términos de tiempo). Algunos ejemplos de series cronológicas serian aspectos tales registros de precipitación pluvial diaria, las ventas semanales, el producto nacional bruto trimestral, mediciones de la temperatura.El objeto de analizar tales datos es determinar si se presentan ciertos patrones o pautas no aleatorias.Algunas veces se trata de descubrir patrones no aleatorios que se puedan utilizar para predecir el futuro.En otras coacciones, el objetivo es asegurarse de que no haya patrones no aleatorios. En estos casos, dichos patrones son considerados como una señal de que un sistema o proceso esta " fuera de control".La siguiente explicación tiene relacion con el análisis intrínseco, el cual se concentra en los datos históricos de la variable de estudio. Cabria destacar que el análisis intrínseco es ampliamente empleado en los negocios y en l a industria. El objetivo reconocido del análisis intrínseco es describir mas que explicar los patrones históricos de los datos (es decir, identificar diversos patrones). Además el supuesto en el que se basa el análisis intrínseco, estable que existe un constante sistema causal relacionado con el tiempo, el cual influye en los datos. En otras palabras, los datos históricos supuestamente reflejan l a influencia de todos los factores de manera uniforme atravez del tiempo. Por ejemplo, un estudio de ventas realizadas en un periodo de 14 años puede revelar que las ventas han aumentado de manera uniforme a razón de casi 10% anual. Con base en esto se lleva a cabo una proyección de las ventas futuras, suponiendo que cualesquiera que fuesen las fuerzas que hayan dado lugar a este patrón, continuaran en le futuro.
Números Índices Un número índice mide qué tanto una variable ha cambiado con el tiempo. Mide la variación relativa entre las variables económicas: Variaciones en los precios, en los salarios, en los ingresos, etc.Se calculan para 2 períodos de una serie de tiempo o para todos los períodos de una serie de tiempo con respecto a un período fijo llamado período base.Que importancia tienen estas tematicas para cualquier ciencia.La Estadistica es de gran importancia en las diferentes empresas, enfocadas desde cualquier area profesional ya que ayudan a lograr una adecuada planeacion y control apoyados en los estudios de pronosticos, presupuestos etc.
Motivan a la alta gerencia para que definan los objetivos basicos de la empresa.
Propician que se defina una estructura adecuada, determinando la responsabilidad y autoridad de cada una de las partes que integran la organización.
Incrementan la participación de los diferentes niveles de la organización, cuando existe motivacion adecuada.
Obligan a mantener un archivo de datos historicos controlables.
Facilitan a la administracion la utilizacion optima de los diferentes insumos.
Facilitan la coparticipación e integracion de las diferentes areas de la compañía.
Obligan a realizar un autoanalisis periodico.
Facilitan el control administrativo.
Son un reto que constantementese presenta a los ejecutivos de una organización para ejercitar su creatividad y criterio profesional a fin del mejoramiento de la empresa.
Ayudan a lograr una mayor efectividad y eficiencia en las operaciones.
Que importancia tiene para usted como contador (a) la realización de pronósticos.
Para prevenir los cambios del entorno, de manera que anticipandose a ellos sea mas fácil la adaptacion de las organizaciones.
Para integrar los objetivos y decisiones de la organización.
A traves de los pronosticos, se pueden prever las perdidas en los resultados de los estados financieros futuros, y de esta manera se pueden tomar decisiones bien sea la reduccion de costos y gastos, planear estrategias que ayuden al mejoramiento de la empresa, y que se cumpla con el objetivo de toda empresa que es obtener utilidades.
Con base en analisis de rotacion de inventarios se puede tomar la decision de aumentar o sacar del mercado un producto.
En cuales areas de su competencia profesional es útil aplicar este conocimiento.
Economia
Administración
Psicología y las demas áreas afines (Ciencias exactas y ciencias Sociales)
Medicina etc. Nosotras pensamos que estos temas de estadística son indispensables en cualquier área ya que a diario se presentan situaciones donde intervienen dos variables y es importante este conocimiento para la toma de decisiones.
3. Análisis De Resultados
Realizando un breve análisis de la EMPRESA ESTIMAR LTDA. Podemos observar la poca o nula estabilidad comercial , la cual tuvo mucha variabilidad en cada uno de los meses, donde podemos concluir que la empresa tuvo acogida por los clientes, si observamos los ingresos mensuales que fueron aumentando, sinembargo las utilidades fueron cada vez más decrecientes debido a la mala administración dada por los jefes de producción donde invirtieron mas de lo que realmente vendían. Esto a su vez, demuestra que en una situación como la que se presentó en el periodo del año 2002 y los seis primeros meses del año 2003, es más difícil lograr un punto de equilibrio; es decir, el esfuerzo en la inversión es mayor para compensar lo que se deja de ganar en el margen.
Como podemos observar en la tabla de números índices base fija (# pagina) en el mes de junio de 2003 se hace demasiado notable la mala administración por parte de la empresa debido a que tenemos una variación en el costo del 250%, una variación en los ingresos del 125% y una variación de las utilidades de un déficit del 125%; lo cual no tiene sentido alguno en el desarrollo de las actividades de una empresa, donde el objetivo general de una empresa es obtener rentabilidad.
En la tabla de números índice en base móvil, observamos que el porcentaje de variación de costos y el de los ingresos respecto a la tabla en base fija van disminuyendo a medida que avanza el periodo, mientras que el porcentaje de variación en las utilidades en las dos tablas fueron muy diferentes, el la base móvil las utilidades estuvieron muy variables entre utilidad y perdida, en cambio en la base fija siempre se presento déficit en forma creciente a medida en que avanzaba el periodo.
4. Conclusiones
Es de suma importancia que la empresa ESTIMAR LTDA. Realice una planeación de presupuesto con el fin de investigar sobre el comportamiento de los diferentes mercados, los cuales tienen incidencia directa sobre el producto, como también realizar el plan de necesidades de insumos el cual consiste en detectar los requerimientos de los diferentes recursos que intervienen en el proceso productivo de tal modo que se pueda hacer frente al plan de mercados.
Realizar el plan financiero que tiene como finalidad decidir como se resolvera el problema de liquidez y de financiamiento de la empresa, una vez que se haya pronosticado los ingresos y los desembolsos provenientes del plan de requerimientos de insumos.
Mediante un buen grado de correlación, podemos fácilmente hacer estimativos acerca de cómo se va a comportar una variable de interés (en nuestro caso los ingresos, costos y utilidades mensuales de la empresa ESTIMAR LTDA.) a través del tiempo.
Los ingresos de ESTIMAR LTDA. desde Enero de 2002, presentan una tendencia creciente y se ajustó aun modelo matemático polinomial con un grado de correlación excelente, R = 0.9627, mostrando una buena relación entre los datos manejados.
Se observa que ESTIMAR LTDA. es una empresa con una muy mala gestión administrativa, porque fueron mas altos los costos que los ingresos a pesar que estos estuvieron mas o menos por el mismo nivel afectando notablemente las utilidades en forma negativa; por tal motivo es necesario mantener en la empresa costos estándar actualizados, con el propósito de que facilite la elaboración del presupuesto de requisiciones de materia prima, mano de obra y de gastos de fabricación indirectos, ya que de otra forma, se determinarían en forma muy imprecisa
La mejor estrategia para que no suceda lo anterior estriba en tomar medidas practicas para la reducción de costos, lo cual generara mayor margen y permitirá a la empresa mejorar su posición competitiva.

REGRESION CUADRATICA

Regresión Cuadrática

La regresión cuadrática es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habríamos de querer ajustar nuestros datos precisamente a una parábola y no a otra función? (ver escogiendo la función de ajuste).


Una función cuadrática o de segundo grado se puede representar de manera genérica como :

Entonces lo que nos interesa es encontrar los valores de a, b y c que hacen que el valor de y calculado sea lo mas cercano posible al medido.

Deducción de las Ecuaciones:

De nuevo hacemos una definición de la función de error, y encontramos los valores de los parámetros que la minimizan, tomando derivadas parciales de la función por cada parámetro que haya:




Una vez se haya reemplazado el valor de n, y de las sumatorias, sólo habrá que solucionar el sistema de ecuaciones por su método preferido, Eliminación Gaussiana, Krammer, etc. Después de que ha solucionado el sistema de ecuaciones entonces tendrá el valor de los parámetros: a,b,c.

Ejemplo:

En determinado proceso se realizaron una serie de 24 mediciones, que luego al graficarse se determinó que es de naturaleza cuadrática. Se desea encontrar los parámetros del polinomio de segundo grado, que mejor se ajusta a esa serie de datos, y cuál es el valor de la variable dependiente, cuando el valor de la variable independiente es de 20.
La tabla con los datos medidos es la siguiente:

X
Y
0
10,08
0,5
12,03
1
11,38
1,5
18,81
2
20,53
2,5
28,50
3
31,38
3,5
38,40
4
48,39
4,5
60,60
5
66,66
5,5
82,61
6
91,37
6,5
105,44
7
122,53
7,5
137,77
8
152,74
8,5
172,65
9
188,84
9,5
207,77
10
230,94
10,5
251,35
11
274,07
11,5
295,95

Ahora, teniendo en cuenta la matriz que dedujimos anteriormente, sabemos que tenemos que encontrar los valores de la suma de x, la suma de x^2, de x^3, x^4, de Yi, xYi, x^2*Yi y n=24.

X
Y
X^2
X^3
X^4
Xyi
X^2Yi
0
10,08
0,00
0,00
0,00
0,00
0,00
0,5
12,03
0,25
0,13
0,06
6,01
3,01
1
11,38
1,00
1,00
1,00
11,38
11,38
1,5
18,81
2,25
3,38
5,06
28,21
42,31
2
20,53
4,00
8,00
16,00
41,06
82,13
2,5
28,50
6,25
15,63
39,06
71,24
178,11
3
31,38
9,00
27,00
81,00
94,14
282,41
3,5
38,40
12,25
42,88
150,06
134,39
470,36
4
48,39
16,00
64,00
256,00
193,56
774,26
4,5
60,60
20,25
91,13
410,06
272,68
1227,08
5
66,66
25,00
125,00
625,00
333,31
1666,55
5,5
82,61
30,25
166,38
915,06
454,37
2499,02
6
91,37
36,00
216,00
1296,00
548,23
3289,38
6,5
105,44
42,25
274,63
1785,06
685,39
4455,05
7
122,53
49,00
343,00
2401,00
857,74
6004,20
7,5
137,77
56,25
421,88
3164,06
1033,24
7749,32
8
152,74
64,00
512,00
4096,00
1221,90
9775,23
8,5
172,65
72,25
614,13
5220,06
1467,54
12474,08
9
188,84
81,00
729,00
6561,00
1699,55
15295,92
9,5
207,77
90,25
857,38
8145,06
1973,80
18751,13
10
230,94
100,00
1000,00
10000,00
2309,40
23093,97
10,5
251,35
110,25
1157,63
12155,06
2639,18
27711,38
11
274,07
121,00
1331,00
14641,00
3014,81
33162,86
11,5
295,95
132,25
1520,88
17490,06
3403,37
39138,76
Total 138
266,078,166
1081
9522
89452,75
22494,51
208137,88

Reemplacemos los valores en la matriz...

Aquí tenemos la matriz, resolviendo, por Gauss Jordan


24
138
1081
2660,8
138
1081
9522
22495
1081
9522
89453
208138


1
5,75
45,04
110,86
0
287,5
3306,25
7195,4
0
3306,25
40762,95
88291,13


1
0
-21,08
-33,04
0
1
11,5
25,02
0
0
2741,08
5544,03


1
0
0
9,60
0
1
0
1,76
0
0
1
2,02

Por lo tanto: a=9.6 b=1.76 c=2.02
la parábola de mejor ajuste es entonces:

REGRESION Y CORRELACION LINEAL.

La regresión como una técnica estadística, una de ellas la regresión lineal simple y la regresión multifactorial, analiza la relación de dos o mas variables continuas, cuando analiza las dos variables a esta se el conoce como variable bivariantes que pueden corresponder a variables cualitativas, la regresión nos permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, la regresión es una técnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.
Siendo así la regresión una técnica estadística, por lo tanto para interpretar situaciones reales, pero a veces se manipula de mala manera por lo que es necesario realizar una selección adecuada de las variables que van a construir las formulas matemática, que representen a la regresión, por eso hay que tomar en cuenta variables que tiene relación, de lo contraria se estaría matematizando un galimatías.
Se pueden encontrar varios tipos de regresión, por ejemplo:
Regresión lineal simple
Regresión múltiple ( varias variables)
Regresión logística
Simple b) Múltiple, etc.
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.
La matematización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:
Regresión Lineal : y = A + Bx
Regresiòn Logarìmica : y = A + BLn(x)
Regresión Exponencial : y = Ac(bx)
Regresión Cuadrática : y = A + Bx +Cx2
Para obtener un modelo de regresión es suficiente establecer la regresión para eso se hace uso del coeficiente de correlación: R.
R = Coeficiente de correlación, este método mide el grado de relación existente entre dos variables, el valor de R varía de -1 a 1, pero en la práctica se traba con un valor absoluto de R.
El valor del coeficiente de relación se interpreta de modo que a media que R se aproxima a 1, es más grande la relación entre los datos, por lo tanto R (coeficiente de correlación) mide la aproximación entre las variables.
El coeficiente de correlación se puede clasificar de la siguiente manera:

CORRELACIÒN VALOR O RANGO
1) Perfecta 1) R = 1
2) Excelente 2) R = 0.9 < = R < 1
3) Buena 3) R = 0.8 < = R < 0.9
4) Regular 4) R = 0.5 < = R < 0.8
5) Mala 5) R < 0.5
DISTRIBUCIÒN DIVARIANTE
DEFINICIÒN :
La distribución diváriate es cuando se estudia en una población dos variables, que forman pares correspondientes a cada individuo, como por Ejm:
Las notas de 10 alumnos en biología y lenguaje
BIOLOGIA
2
4
5
5
6
6
7
7
8
9
LENGUAJE
2
2
5
5
5
7
5
8
7
10
Los pares de valores son: ( 2, 2) (4,2) (5,5)…….(8,7) (9,10) forman una distribución diváriate.
La correlación, método por el cual se relacionan dos variables se pude graficar con un diagrama de dispersión de puntos, a la cual muchos autores le llaman nubes de puntos, encuadrado dentro de un gráfico de coordenadas X Y en la cual se pude trazar una recta y cuyos puntos mas cercanos de una recta hablaran de una correlación mas fuerte, ha esta recta se le denomina recta de regresión, que puede ser positiva o negativa, la primera contundencia a aumentar y la segunda en descenso o decreciente.
También se puede describir un diagrama de dispersión en coordenadas cartesianas valores como en la distribución diváriate, en donde la nube de puntos representa los pares de valores.
GRAFICOS DE RECTA DE REGRESIÒN
Por último se pueden graficar las líneas de tendencia, herramienta muy útil para el mercadeo por que es utilizada para evaluar la resistencia que proyectan los precios. Cuando una línea de tendencia central se rompe ya sea con tendencia al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las líneas de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista cuando se unen los puntos máximos.
También existen gráficos que representan la dispersión de datos dentro de las coordenadas cartesianas, ósea las nubes de puntos y que pueden darse según la relaciòn que representa, que puede ser lineal, exponencial y sin relación, esta última cuando los puntos están dispersos en todo el cuadro sin agruparse lo cual sugiere que no hay relación.
Los gráficos siguientes nos muestran esta relación:
Matemáticamente las ecuaciones serían:
Ajuste Lineal : Y = Bx + A
Ajuste Logarìtmico : Y =BLnX + A
Ajuste Exponencial : Y = AC BX
En el modelo de regresión lineal simple se utiliza la técnica de estimación de los mínimos cuadrados, este modelo tiene solo una variable de predicción y se supone una ecuación de regresión lineal.
En el siguiente ejemplo la relación entre la calificación y salario la variable repuesta es el salario inicial y la variable predictiva o de predicción es la calificación promedia, si se desea determinar una ecuación de regresión para el salario inicial promedio como una función de la calificación promedio se podrá graficar y procesar los datos en una computadora, estos datos son:
CP = Calificación Promedio
SI = Salario Inicial
De este grupo de datos se obtiene el siguiente gráfico de dispersión
CP
SI
2.95
18.50
3.20
20.00
3.40
21.10
3.60
22.40
3.20
21.20
2.85
15.00
3.10
18.00
2.85
18.80
3.05
15.70
2.70
14.40
2.75
15.50
3.10
17.20
3.15
19.00
2.95
17.20
2.75
16.80