jOas wEb Sci

Aller au contenu | Aller au menu | Aller à la recherche

Présentation du problème - Modélisation des erreurs

Pour prendre en compte les incertitudes dans l'ébauche, les observations et l'analyse, il faut faire des hypothèses sur la modélisation des erreurs entre ces vecteurs et leurs équivalents "vrais". L'utilisation des fonctions de densité de probabilité, nommées pdf, est une approche adaptée pour construire des modèles d'erreur. Les fonctions de densité de probabilité sont largement et rigoureusement décrites à travers des théories mathématiques. Une description simplifiée est donnée ci-dessous.


Représentation de l'incertitude par des pdfs

En prenant l'exemple du vecteur d'ébauche, il est possible de définir un seul et unique vecteur d'erreur séparant le vecteur d'ébauche de l'état vrai discrétisé :

\[ \epsilon^b = \mathbf{x}^b - \mathbf{x}^t. \]

Si la méthode d'analyse pouvait être répétée un très grand nombre de fois, dans des conditions strictement identiques mais avec des erreurs différentes dues à des causes aléatoires, le vecteur d'erreur \[ \epsilon^b \] serait différent à chaque fois, mais il serait possible de calculer des grandeurs comme les moments (moyennes, variances...) ou de construire un histogramme des fréquences. Pour un très grand nombre d'expériences, ces estimateurs statistiques devraient converger vers des grandeurs ne dépendant que des processus physiques responsables des erreurs. A la limite, l'histogramme des fréquences peut être construit avec des classes infinitésimales et converger avec une fonction de densité de probabilité. Toutes les statistiques nécessaires sont alors dérivables de cette fonction de densité de probabilité et, entre autre, dans la plupart des problèmes physique, la moyenne et les variances. En effet, mathématiquement, une fonction de densité de probabilité n'a pas forcément ces grandeurs. Dans la suite, toutes les fonctions de densité de probabilité seront supposées avoir ces grandeurs caractéristiques. Parmi toutes les fonctions de densité de probabilité, la fonction Gaussienne est particulièrement intéressante.


Variables d'erreur

Il est possible de définir les erreurs d'ébauche, d'observation et d'analyse telle que présentées dans le Tab. 1.

Nom Définition Moyenne Covariances
Erreur d'ébauche \[ \epsilon^b = \mathbf{x}^b - \mathbf{x}^t \] \[ \overline{\epsilon}^b \] \[ \mathbf{B}=[(\epsilon^b-\overline{\epsilon}^b)(\epsilon^b-\overline{\epsilon}^b)^T] \]
Erreur d'observation \[ \epsilon^o = \mathbf{y}^o - H\mathbf{x}^t \] \[ \overline{\epsilon}^o \] \[ \mathbf{R}=E[(\epsilon^o-\overline{\epsilon}^o)(\epsilon^o-\overline{\epsilon}^o)^T] \]
Erreur d'analyse \[ \epsilon^a = \mathbf{x}^a - \mathbf{x}^t \] \[ \overline{\epsilon}^a \] \[ \mathbf{A}=E[(\epsilon^a-\overline{\epsilon}^a)(\epsilon^a-\overline{\epsilon}^a)^T] \]
Tab. 1 : Définition des variables d'erreur.

L'erreur d'ébauche est la différence entre la première estimation de l'état du modèle et l'état vrai. Cette erreur n'inclue pas l'erreur de discrétisation.

L'erreur d'observation est définie comme la différence entre les observations et l'équivalent modèle de l'état vrai. Cette erreur contient l'erreur de mesure (\[ \epsilon^m \]) due aux imprécisions de l'appareil de mesure vis-à-vis de la réalité, l'erreur due à l'opérateur d'observation H (\[ \epsilon^i \]) et l'erreur de représentativité (\[ \epsilon^r \]).

En effet, il est possible de définir le vecteur d'observation \[ \mathbf{y}^o \] comme la somme d'observations vraies \[ \mathbf{y}^t \] et de l'erreur de mesure \[ \epsilon^m\].

(002)
\[ \mathbf{y}^o = \mathbf{y}^t + \epsilon^m \]

Il est ensuite possible d'écrire ces observations vraies \[ \mathbf{y}^t \] comme construites à partir d'un opérateur d'observation continu \[ \mathbf{\mathcal{H}} \] et d'un état vrai et continu du modèle \[ \mathbf{x}^t_c \] :

(003)
\[ \mathbf{y}^o = \mathbf{\mathcal{H}} \mathbf{x}_c^t + \epsilon^m \]

L'état vrai continu du modèle peut être décomposé en portions discontinues résolues \[ \mathbf{x}^t \] et en portions discontinues non résolues. Les portions discontinues étant la projection de \[ \mathbf{x}^t_c \] dans l'espace de dimensions finies du modèle. L'équation \ref{eq003} peut alors s'écrire :

(004)
\[ \mathbf{y}^o = \mathbf{\mathcal{H}} \mathbf{x}^t + \epsilon^m + \epsilon^r \]

où \[ \epsilon^r \] représente les portions non résolues de l'état continu, c'est-à-dire l'erreur de représentativité.

L'équation (004) peut ensuite d'écrire :

(005)
\[ \mathbf{y}^o = H \mathbf{x}^t + \epsilon^m + \epsilon^r + \epsilon^i \]

H est l'opérateur discret d'observation et \[ \epsilon^i \] son erreur associée.

Enfin, l'erreur d'analyse est définie comme la différence entre l'état analysé et l'état vrai. La trace de cette matrice permet de définir une estimation de l'erreur de l'état analysé qui peut servir comme objet de minimisation. Par la suite, l'assimilation de données s'attachera à minimiser cette grandeur :

(007)
\[ \mathrm{Tr}(\mathbf{A}) = \overline{|| \epsilon^a - \overline{\epsilon}^a ||^2} \].

La moyenne de ces différentes erreurs sera appelé le biais et représente un problème systématique dans le système d'assimilation qui peut être une dérive du modèle, un biais dans les observations ou encore une erreur systématique dans la manière d'utiliser les observations. Il est important de comprendre que le biais est de même nature statistique que l'état du modèle ou le vecteur d'observation. Son interprétation est simple et les opérateurs linéaires utilisés pour le vecteur d'état du modèle ou celui d'observation peuvent lui être appliqué.


Covariances d'erreur

Les covariances d'erreur sont un petit plus compliquées que les erreurs de biais et seront illustrées par l'exemple des erreurs d'ébauche. Cependant, toutes les remarques peuvent aussi s'appliquer aux erreurs d'observation.

Dans un système scalaire, les erreurs de covariances se résument aux variances. Par contre, dans un système multidimensionnel, les covariances peuvent être décrites par une matrice carrée symétrique. Si le vecteur d'état du modèle est de dimension n, alors la matrice de covariance d'erreur est de dimension n x n. La diagonale de cette matrice est alors constituée des variances de chaque variable du modèle et les termes non-diagonaux sont les covariances entre deux des variables du vecteur d'état du modèle. En définissant, pour trois variables, les erreurs d'ébauche non-biaisées (\[ \overline{\epsilon} \]) telles que \[ (\epsilon_i,\epsilon_j,\epsilon_k) \], alors la matrice de covariance d'erreur d'ébauche \[ \mathbf{B} \] s'écrit :

(008)
\[ \mathbf{B} = \left( \begin{array}{ccccc} \ddots & \cdots & \cdots & \cdots & \cdots \\ \cdots & \mathrm{var}(\epsilon_i) & \mathrm{cov}(\epsilon_i,\epsilon_j) & \mathrm{cov}(\epsilon_i,\epsilon_k) & \cdots \\ \cdots & \mathrm{cov}(\epsilon_i,\epsilon_j) & \mathrm{var}(\epsilon_j) & \mathrm{cov}(\epsilon_j,\epsilon_k) & \cdots \\ \cdots & \mathrm{cov}(\epsilon_i,\epsilon_k) & \mathrm{cov}(\epsilon_j,\epsilon_k) & \mathrm{var}(\epsilon_k) & \cdots \\ \cdots & \cdots & \cdots & \cdots & \ddots \end{array} \right) \]

En général, les variances sont non-nulles, car il est difficile de supposer que l'ébauche puisse représenter certains aspects de la réalité de manière parfaite. Dans ce cas, la matrice est alors définie positive et il est possible de réécrire les termes non-diagonaux de la matrice de covariance d'erreur sous forme de corrélation d'erreurs :

(009)
\[ \rho(\epsilon_i,\epsilon_j) = \frac{\mathrm{cov}(\epsilon_i,\epsilon_j)} {\sqrt{\mathrm{var}(\epsilon_i)\mathrm{var}(\epsilon_j)}}. \]

A la différence des erreurs de biais, il n'est pas possible d'appliquer les opérateurs linéaires utilisés sur le vecteur d'état du modèle ou sur le vecteur d'observation afin de transformer le champ de variances d'erreur (la diagonale de la matrice de covariance d'erreur). Il faut, en fait, définir des transformations linéaires avec des matrices pleines. Par exemple, si une transformation linéaire est définie par une matrice P telle que les nouvelles coordonnées de la transformation de \[ \mathbf{x} \] soient \[ P\mathbf{x} \], alors la matrice de covariance de cette nouvelle variable est \[ P\mathbf{x} P^T \].