Datos simples y agrupados EN Estadística

Enviado por Programa Chuletas y clasificado en Diseño e Ingeniería

Escrito el en español con un tamaño de 14,75 KB

ANÁLISIS DE CONSISTENCIA DE DATOS METEOROLÓGICOS E HIDROMÉTRICOS

Definiciones

Una serie de datos es llamada consistente (que consiste o esta compuesta por varios elementos) o homogénea (que posee el mismo género o naturaleza) si es una muestra de una única población.

Si la serie no es homogénea, se le debe hacer ajustes o correcciones para volverla homogénea, de manera que las estimaciones estadísticas muéstrales sean válidas, estimaciones de los parámetros poblacionales.

El objetivo básico de la aplicación de estadística en Hidrología es el análisis de la información hidrológica en forma de muestras; a fin de inferir las carácterísticas con que debe ser esperado en el futuro el fenómeno que se estudia.

Existe en muchos la idea de que la estadística es usada sólo cuando no es posible dar una solución exacta a un problema hidrológico. En esta interpretación la solución exacta es una solución determinística del problema.

Sin embargo se puede determinar que la solución determinística constituye una solución particular de la solución estadística o probabilística.

En forma general, la mayoría de los problemas hidrológicos se pueden agrupar en tres categorías principales de acuerdo al objetivo principal del proyecto:

  1. Diseño de estructuras hidráulicas, siendo necesaria la evaluación y cuantificación de los valores extremos (máximos y mínimos) del escurrimiento superficial.
  2. Satisfacción de demandas, siendo necesario evaluar y cuantificar las descargas disponibles en el punto de interés.
  3. Diseño y operación de embalses, siendo necesario evaluar y cuantificar la variación del escurrimiento superficial en todas sus carácterísticas estadísticas, como valores medios, máximos y mínimos.

En cada una de las tres categorías mencionadas se presentan tipos de problemas, dependiendo de la simplicidad o complejidad de la solución del tipo, cantidad y calidad de la información disponible, así como de la magnitud del proyecto. Los casos mas comunes que se presentan en cada una de las tres categorías mencionadas son:

1.- Cuencas con suficiente información hidrológica. Este es el caso más optimista donde se puede aplicar todo tipo de metodologías existentes

2.-  Cuencas con escasa información hidrológica. Es este caso se pueden desarrollar modelos que relacionen las precipitaciones con las descargas, mediante el uso de la regresión simple o múltiple, lineal o no lineal.

3.- Cuencas sin información hidrológica. Este es el caso mas crítico y el mas común, el cual puede resolverse mediante un análisis regional.

MODELOS PROBABILÍSTICAS.-


Los fenómenos que se presentan en ingeniería pueden clasificarse desde el punto de vista de la certeza de ocurrencia, en determinísticos o probabilísticos.

Si la ocurrencia de las variables en un proceso es cierta, es decir si las variables siguen una ley determinada se habla de un proceso determinístico.

En cambio si se toma en cuenta la probabilidad de ocurrencia y la falta de certeza existente, entonces se habla de un proceso de naturaleza probabilística.

Es conveniente hacer notar que la gran mayoría de los procesos que interesan al ingeniero en especial en el campo de la hidrología pertenecen a la categoría de fenómenos probabilísticos.

Se denomina proceso estocástico a aquel en el que las carácterísticas de las variables aleatorias varían con el tiempo.

En un proceso probabilístico, independiente de la variable tiempo, la secuencia de las variables no interesa y se supone que ellas siguen un determinado comportamiento dado por el modelo probabilístico o distribución de frecuencias.

Dada una variable aleatoria debe describirse la probabilidad de ocurrencia de los distintos estados y se consigue gracias a un modelo matemático de su comportamiento o modelo probabilístico. Esta distribución probabilística nos permite calcular:

  1. Las probabilidades de los distintos estados o valores que puede tomar la variable aleatoria.
  2. La probabilidad de tener valores mayores o menores que un determinado límite.
  3. Los valores de probabilidad de ocurrencia asociados a cada valor de la variable aleatoria.

En conclusión puede decirse que el modelo probabilístico o distribución permite conocer y manejar fácilmente el comportamiento de la variable y sintetizar toda la información sobre probabilidades asociadas a cada estado.

Según se trate de variables discretas o continuas, se usarán modelos de distribución probabilísticas discretos o continuos.

Serán modelos discretos aquellos cuya función densidad de probabilidad y función de probabilidad acumulada se encuentran definidas para determinados valores que puede tomar la variable.

Un modelo con variable continua puede tomar un valor cualquiera dentro de un intervalo predeterminado.

Las principales distribuciones discretas son


:

1) Distribución binomial

2) Distribución de Poisson

Las principales distribuciones continuas son


:

1) Distribución uniforme

2) Distribución normal

3) Distribución logarítmica - normal

4) Distribución Gamma

5) Distribuciones de valores extremos

A) Tipo I o tipo exponencial (ley de Gumbel)

B) Tipo II o tipo Cauchy

C) Tipo III o distribuciones truncadas

6) Distribución Chi cuadrado

Una vez que el ingeniero en base a su experiencia escoge el modelo probabilístico que va a usar debe proceder a calcular los parámetros de su modelo y después revisar si este modelo es consistente con la realidad. Ambas cosas las realiza con los datos observados (registro o muestra). Para la estimación de los parámetros hay disponibles dos métodos:

  1. El método de los momentos
  2. El método de la máxima verosimilitud

Y para el estudio de la consistencia dos grupos de métodos


:

  1. Métodos gráficos

Análisis de consistencia:
Para verificar la consistencia se utiliza el análisis de doble masa, que es un método gráfico.

A través del gráfico se puede realizar dos análisis diferentes en el caso específico de embalses:

  1. Cuál es el rendimiento que puedo garantizar de ese embalse para un almacenamiento útil dado.
  2. Que almacenamiento útil requiero para producir un rendimiento, es decir para satisfacer una demanda.

ii) Métodos cuantitativos

  • Test chi cuadrado
  • Test W
  • Test Student
  • Test de Kolmogoroff

Principios

Analizar la homogeneidad de las series climáticas es equivalente a establecer consistencia estadística de los datos; sin embargo, para establecer con veracidad que tales datos son el resultado de variaciones naturales del tiempo meteorológico es necesario revisar el archivo o compararlos con otras estaciones a nivel regional.

En este sentido, se presenta como propuesta metodológica para el análisis de la consistencia de los datos que abarca desde la revisión numérica y grafica de la data, y la verificación de la independencia o aleatoriedad de los valores de la sucesión, hasta la determinación de la estabilidad de la media y la varianza.

Varianza


Que tan lejos estoy del medio o de los datos perfectos.

Media


Es el promedio de los datos.

En nuestro país, la falla en la información meteorológica está asociada a la gran cantidad de datos faltantes y englobados (en el caso de la precipitación), cambios de uso alrededor de la estación, cambios del emplazamiento original de la estación, así como errores en el proceso de la observación meteorológica que abarcan escenarios como fallas en la medición en campo, falta de mantenimiento adecuado del instrumental y del entorno de la estación y errores de la trascripción; tales situaciones son las causas artificiales más comunes en la falta de consistencia de los datos.

La importancia de considerar la consistencia de la información meteorológica es debido a que conclusiones provenientes de datos inconsistentes no son válidas para la planificación físico ambiental ni para la toma de decisiones.

Pruebas de consistencia y homogeneidad de datos meteorológicos e hidrométricos

Estadísticamente, cuando los datos pertenecen a una misma clase se concluye que la muestra proviene de una misma población, vale decir en Climatología, similares condiciones radiantes; en este sentido, las series climatológicas por definición son homogéneas (Thom, 1966).

Es necesario destacar las diferencias que existen entre los términos homogeneidad, aleatoriedad y consistencia, aunque se encuentran muy relacionados; es decir, toda serie climática por definición es homogénea, pero no necesariamente es aleatoria, sin embargo, si puede ser consistente meteorológicamente.

Igualmente, en relación con las causas de las inconsistencias meteorológicas referidas a la presencia de inconsistencias de carácter natural, que no pasan las pruebas estadísticas propuestas, pero que por su origen se han considerado homogéneas.

Sánchez Carrillo (1966) realizó una compilación sobre el uso e interpretación de los datos climáticos, en la cual menciona las tres principales condiciones que deben cumplir tales datos para ser utilizados con eficiencia:

1. Continuidad

2. Exactitud

3. Largo Período de Registro

Particularmente, la exactitud la describe como confiabilidad de la información, tal que, “los datos deben ser tomados con fidelidad”. No obstante, en la práctica dicha confiabilidad es dudosa, debido a que se encuentra afectada por causas externas no naturales de origen antrópico, incidiendo negativamente en la consistencia de los datos.

PRINCIPALES CAUSAS DE LA INCONSISTENCIA DE LAS SERIES CLIMÁTICAS

Desde el momento en que se instala una estación meteorológica hasta la entrega de la información a los usuarios existe la probabilidad de cometer errores instrumentales y/o humanos, vale decir, que la falta de control en el proceso de observación meteorológica es una de las causas de heterogeneidad meteorológica, seguida por las carácterísticas geográficas del sitio y, por causas naturales.

En cuanto a los posibles errores asociados con el proceso de observación meteorológica se tienen:

1. Fallas en la instalación del instrumental

2. Fallas en el funcionamiento del instrumental

3. Fallas en la calibración del instrumental

4. Falta de mantenimiento de la estación y su instrumental

5. Cambios de marcas y modelos de instrumental

6. Lecturas erróneas

7. Utilización de bandas o gráficas no acordes con el modelo de instrumentos registradores

8. Errores de trascripción de las mediciones a las planillas correspondientes y/o en la base de datos computarizada

Entre las posibles causas geográficas del sitio se citan


1. Mala escogencia del sitio para emplazar la estación meteorológica

2. Cambios en el entorno de la estación

3. Cambios de localización de la estación

4. Mala accesibilidad a la estación

Entradas relacionadas: