jOas wEb Sci

Aller au contenu | Aller au menu | Aller à la recherche

Modèle de covariance d'erreur - Description des erreurs


Variances d'erreur d'observation

Les variances d'erreur d'observation sont le plus souvent estimées à l'aide des connaissances sur les caractéristiques techniques des instruments de mesures. Ces caractéristiques peuvent être, par exemple, déterminées par des observations positionnées au même endroit. Ces variances doivent aussi inclure les variances d'erreur de représentativité qui sont loin d'être négligeables tant qu'il existe des phénomènes physiques qui ne sont pas bien représentés dans l'espace du modèle.

D'autre part, il ne faut absolument pas considérer qu'un biais puisse être considéré comme une contribution aux variances d'erreur d'observation. En effet, il occasionnerait un biais dans l'incrément d'analyse. Ainsi, à chaque fois qu'un biais est mis en évidence, il doit être retiré des observations ou de l'état d'ébauche en fonction de son origine supposée. Il est cependant souvent difficile de déterminer son origine.


Covariances d'erreur d'observation

Les covariances d'erreur d'observation sont le plus souvent considérées comme nulles. En d'autres termes, des mesures distinctes sont affectées par des erreurs physiques indépendantes. Cette hypothèse paraît raisonnable pour des observations mesurées par des instruments différents. Elle paraît moins évidente quand un jeu d'observations est obtenu par le même instrument de mesure (mesures satellite, bouées dérivant es...) ou quand une série temporelle de mesures d'une même station, par exemple par une bouée fixe, est utilisée dans un 4D-Var. Dans de tels cas, il apparaît intuitivement que des corrélations d'erreur doivent exister entre ces mesures proches les une des autres.

La présence d'un biais, par exemple, se traduit par une corrélation d'erreur permanente. De plus, le prétraitement des observations peut produire artificiellement des corrélations d'erreur entre les observations transformées. Ces transformations sont assez courantes et permettent, par exemple, de transformer des températures en températures potentielles, la distance altimétrique d'un satellite en anomalie de hauteur de mer ou des radiances obtenues par des satellites en température de surface de la mer.

Quand l'état d'ébauche est utilisé dans le prétraitement des observations, cela peut créer artificiellement des corrélations entre l'erreur d'observation et l'erreur d'ébauche qui sont très difficile à prendre en compte. Par exemple, rapprocher une observation de l'état d'ébauche donne l'impression de réduire les erreurs d'observation et d'ébauche, mais cela réduit de manière irréaliste le poids de l'information apportée par l'observation originale.

Enfin, les erreurs de représentativité sont corrélées par nature. Les d'erreurs d'interpolation sont toujours corrélées quelque soit la densité des observations vis-à-vis de la résolution du modèle. D'autre part, les erreurs dans la définition de l'opérateur d'observation, comme le modèle d'évolution pour le 4D-Var, sont corrélées aux mêmes échelles que le problème modélisé.

La présence de corrélations d'erreur d'observation positives réduit le poids moyen des observations. Ainsi, elle augmente l'importance relative des différences entre les observations, comme les gradients ou les tendances. Cependant, les corrélations d'erreur d'observation sont très difficiles à estimer et peuvent causer des problèmes numériques lors de l'analyse ou dans les algorithmes de contrôle qualité. En pratique, il est souvent plus facile de minimiser leurs impacts en utilisant des méthodes de corrections de biais, en évitant trop de prétraitement des observations, en refusant des observations dans les régions très denses et en améliorant le modèle d'évolution et les opérateurs d'observation. Ainsi, les modèles de covariances d'erreur d'observation sont, en général, diagonaux ou presque.


Variances d'erreur d'ébauche

En général, l'ébauche provient d'une prévision obtenue avec le modèle d'évolution. Les variances d'erreur d'ébauche sont donc les variances d'erreur de la prévision utilisée pour obtenir l'état d'ébauche initial \[\mathbf{x}^b\]. Avec les filtres de Kalman, ces variances d'erreur sont estimées automatiquement à travers le modèle tangent-linéaire. Il n'est donc pas nécessaire de les spécifier. Cependant, le problème n'est que déplacé puisqu'il faut alors spécifier l'erreur modèle \[\mathbf{Q}\] et, pour les filtres réduits, mettre au point les approximations nécessaires à ces algorithmes.

Une première estimation des variances d'erreur d'ébauche peut être obtenue en prenant une fraction des variances climatologiques des champs des variables du vecteur d'état.

Une autre possibilité est d'utiliser des quantités dont les statistiques d'erreur sont équivalentes à celle de l'erreur d'ébauche. Parmi ces méthodes, les plus connues sont la méthode NMC et la méthode d'ensemble décrites par la suite. Une des hypothèses de ces méthodes est que l'analyse soit de bonne qualité. C'est-à-dire, en d'autres termes, que les observations soient nombreuses.

Enfin, la méthode la meilleure est, sans conteste, celle qui utilise l'innovation pour estimer les variances d'erreurs. Cette méthode sera aussi décrite par la suite mais elle repose sur l'hypothèse que les erreurs d'observation ne sont pas corrélées.

Néanmoins, dans la plupart des problèmes, l'erreur d'ébauche est supposée dépendre largement de l'état lui-même de l'ébauche. Il est alors très bénéfique que l'erreur d'ébauche dépende de l'écoulement et prenne en compte les variations temporelles. Cette caractéristique est obtenue avec les filtres de Kalman, dans les fenêtres temporelles des 4D-Var, par l'utilisation de lois empiriques basées les connaissances physiques du système ou par des méthodes d'ensemble (ou équivalentes).

Si les variances d'erreurs d'ébauches sont mal spécifiées, l'incrément d'analyse sera ou trop grand ou trop petit. Avec les algorithmes variationnelles basées sur la méthode des moindres carrés, seul le rapport des variances d'erreur d'ébauche et d'observation est important pour l'analyse. Néanmoins, la valeur absolue peut aussi avoir son importance lors du contrôle de la qualité des observations. En effet, les observations éloignées de l'ébauche peuvent être tout à fait acceptées si l'erreur d'ébauche est importante.


Covariances d'erreur d'ébauche

Les covariances d'erreur d'ébauche sont essentielles pour faire une bonne analyse.


Propagation des informations

Dans les régions pauvres en observations, la forme de l'incrément d'analyse est complètement déterminée par les structures de covariances d'erreur d'ébauche. Ainsi, la forme de l'incrément d'analyse d'une observation esseulée est donnée directement par \[\mathbf{B}\mathbf{H}^T\]. C'est donc les corrélations de \[\mathbf{B}\] qui propagent l'information spatialement autour du point d'observation.


Lissage des informations

Dans les régions riches en observations, le lissage des informations est gouverné par les corrélations de la matrice de covariances d'erreur d'ébauche \[\mathbf{B}\]. Ceci est clairement mis en évidence au regard du gain d'analyse optimal \[\mathbf{K}\] (Eq. (015)) dont le dernier terme à être utilisé, celui le plus à gauche, est \[\mathbf{B}\]. Le lissage de l'incrément d'analyse est très important en ceci qu'il doit permettre à l'analyse d'avoir des échelles statistiquement compatibles avec les propriétés des champs physiques. La spécification des corrélations d'erreur d'ébauche est donc à la fois importante et délicate, car les échelles spatiales des champs physiques sont diverses et variables.


Propriétés d'équilibre

Le nombre de degrés de liberté d'un modèle est souvent supérieur à celui de la réalité. Par exemple, les courants marins sont supposés géostrophique hormis à l'équateur. Cette hypothèse d'équilibre entre gradient de pression et force de Coriolis dans les équations de Navier-Stokes permet d'obtenir une relation directe entre courant géostrophique et dérivée au premier ordre de la hauteur de mer. Ces propriétés d'équilibre peuvent être considérées comme des contraintes gênantes au problème d'analyse et être a posteriori appliquées brutalement. Un autre point de vue est de considérer qu'il existe des propriétés statistiques qui lient les différentes variables du modèle. S'il existe des relations d'équilibre entre les différentes variables du modèle, il doit donc y avoir aussi des relations d'équilibre linéarisés dans la matrice de covariances d'erreur d'ébauche. Ces équilibres sont très intéressants car ils permettent d'apporter des informations sur toutes les variables en équilibre avec celle observée. Ainsi, par exemple, les mesures de température en océanographie permettent de corriger la salinité. Combiné avec le lissage spatial des informations, les propriétés d'équilibre peuvent avoir un impact considérable sur la qualité de l'analyse. Une mesure de température propagée autour du point d'observation peut modifier, en plus de la température, la salinité, la hauteur de mer et les courants. C'est-à-dire toutes les variables utilisées dans un modèle océanique. L'amplitude de toutes ces modifications dépendra de l'estimation de la corrélation entre deux variables différentes et des variances d'erreur de ces variables.


Paramètres additionnels

Avec les méthodes variationnelles, il est possible d'inclure dans le vecteur de contrôle d'autres paramètres additionnels, tels que des paramètres de réglage du modèle ou des estimations du biais. Cette technique indirecte d'estimation des paramètres peut être très efficace à condition qu'il y ait une véritable relation entre ces paramètres et les observations. Cette relation passe, en général, au travers de l'opérateur d'observation ou du modèle dans le cas du 4D-Var. Il n'est généralement ni possible ni prudent de spécifier explicitement les corrélations avec les autres variables de l'état du modèle dans \[\mathbf{B}\]. De plus, les erreurs d'ébauche de tous les paramètres du vecteur de contrôle doivent être spécifiées prudemment, à moins d'être sûr que le problème est surdéterminé par les observations. Une variance d'erreur trop faible évitera, logiquement, de corriger les paramètres additionnels. Une variance d'erreur trop forte pourra, par contre, transformer les paramètres additionnels en source de bruit et créer des variations sans justification physique. D'importants problèmes peuvent alors apparaître car des couplages implicites dans l'analyse sont souvent créés par des dépendances dans l'opérateur d'observation ou dans le modèle en 4D-Var. Ainsi, la spécification des erreurs d'ébauche des paramètres additionnels peut avoir un impact sur les variables d'état du modèle analysées.


Dépendance à l'écoulement

La matrice de covariances d'erreur d'ébauche \[\mathbf{B}\] peut dépendre de l'incertitude d'une précédente analyse ou prévision à condition que la dynamique du problème soit suffisamment connue. Non seulement les variances d'erreur d'ébauche peuvent évoluer au cours du temps, mais aussi les corrélations. En atmosphère comme en océanographie, certaines ondes suivent des motifs spécifiques qui peuvent apparaître dans les erreurs d'ébauche. Par exemple, dans un secteur enclin au développement cyclonique (région de basses pressions), les erreurs d'ébauche le plus probables devraient avoir la forme des structures les plus instables, avec peut-être une inclinaison des ondes baroclines et des anti-corrélations entre les masses d'air chaud et froid. C'est dépendance à l'écoulement est assez équivalent aux propriétés d'équilibre. Ainsi, si de tels informations peuvent être incorporées dans la matrice de covariances d'erreur \[\mathbf{B}\], alors les observations pourront être mieux propagées spatialement et mieux distribuées entre les variables du modèle. Ce type d'information peut être utilisé dans le cadre des filtres de Kalman, en 4D-Var mais aussi en 3D-Var comme le mettra en évidence ce manuscrit.