Modèle mathématique
Un modèle mathématique est une adaptation de la réalité pour pouvoir lui appliquer les outils, les techniques et les théories mathématiques.
| Sommaire |
Les types de modèle
Les modèles prédictifs
Les modèles mathématiques sont utilisés pour anticiper des événements ou des situations, comme prévoir le temps avec la météo, estimer les prix potentiels des actifs financiers avec les modèles d'évaluation en finance, ou prévenir les épidémies. On parle de modèles prédictifs, dans lesquels des variables connues, dites « explicatives », vont être utilisées pour déterminer des variables inconnues, dites « à expliquer ».
Les modèles descriptifs
Mais les modèles servent aussi à représenter des données historiques. On parle de modèles descriptifs. L'objectif est de rendre compte, de manière interprétable, d'une masse d'informations. L'archétype de ces modèles est la comptabilité : elle décrit de manière simplifiée les événements économiques réels en leur affectant un compte, c'est-à-dire une « étiquette » sensée les caractériser. Ces comptes sont ensuite agrégés pour présenter de manière standard la situation économique des entreprises et des pays.
La modélisation
La modélisation a deux sens :
- d'une manière générale, c'est l'action qui consiste à définir un modèle, qui sera utilisable sur un ensemble de situations réelles.
- Ex. les modèles destinés à évaluer la valeur financière d'une entreprise ou les chances de succès aux jeux de hasard.
- concrètement, c'est l'action qui consiste à passer d'une situation réelle à un modèle. En ce sens, elle est une description simplifiée de la réalité ; cette description doit être suffisamment complète pour qu'on y reconnaisse la réalité, mais suffisamment simplifiée pour rentrer dans le moule du modèle choisi.
- Ex. Modéliser les performances de la société X pour évaluer son prix.
Les qualités d'un modèle
En préliminaire, il est important de comprendre que la complexité mathématique n'est pas un critère pour juger si un modèle est pertinent ou non : il existe des classes de modèles qui font appel à des outils mathématiques complexes, tels la recherche opérationnelle ou la théorie des jeux ; d'autres classes, la comptabilité par exemple, sont d'un abord mathématique enfantin (additions, soustractions).
Un modèle est pertinent
- s'il couvre bien le champ du problème réel
- Ex. un modèle financier qui n'intégrerait pas le phénomène du troc ne serait pas utilisable pour évaluer les entreprises de l'ex-Europe de l'Est.
- s'il permet d'obtenir le résultat escompté : description du phénomène avec le niveau de détail ou de synthèse souhaité, ou prévisions se révélant justes a posteriori.
- dans le délai souhaité
- On pense à la boutade qui promet des prévisions météo précises à une semaine mais qui demandent un mois de calcul.
- accessoirement, s'il est réutilisable
- L'investissement pour décrire un modèle est en général si important qu'il se justifie rarement sur une opération unique.
Comment créer un modèle ?
Il n'est pas question dans un article si court de présenter une méthodologie applicable à toutes les situations (s'il en existe une !), mais quelques points essentiels.
1. Le point de départ est toujours une question qu'on se pose sur une situation future et/ou si complexe qu'on n'y trouve pas la réponse de manière évidente.
- Ex. : mon entreprise est-elle viable ? Ce matériel vaut-il le prix demandé ? Ce médicament est-il efficace ? Que faut-il faire pour que la situation s'améliore ?
2. Pour trouver la réponse, il est nécessaire de limiter le champ du problème en recherchant les données qu'on imagine avoir un lien direct avec la question. Trop limiter fait courir le risque de ne pas modéliser un phénomène qui a du poids dans le contexte, mais trop ouvrir entraîne une dispersion des moyens et une accumulation de données non pertinentes qu'il faudra écarter en justifiant les choix. Cette étape est la plus délicate pour la qualité du modèle : elle est soumise aux a priori du modélisateur, à ses manques de connaissances — parfois de méthode — et aux moyens dont il dispose (temps, argent, accès aux données).
3. Il faut ensuite construire le modèle :
- filtrer les données afin d'en extraire les « bruits », ces irrégularités ou ces événements accessoires qui masquent l'essentiel ;
- éventuellement, reconstituer les manquants, c'est-à-dire les objets qui manquent pour assurer la cohérence de l'ensemble (ex. le fonctionnement d'un paramètre dont on connaît l'existence mais sur lequel on ne dispose pas de données)
C'est là qu'interviennent les outils mathématiques et informatiques, qui permettent un filtrage et une construction avec un minimum de subjectivité en un minimum de temps.
4. Le « substrat » restant constitue le modèle, ensemble de règles ou d'équations. Il faut décrire ces règles le plus complètement possible : leur importance relative, les données en entrée et en sortie, les outils mathématiques utilisés, les étapes par lesquelles il faut passer, les points de contrôle.
5. La dernière étape consiste à valider le modèle : en appliquant aux données filtrées les règles du modèle, retrouve-t-on la situation initiale ? Si l'écart est trop important, il est nécessaire de se reposer la question des limites que l'on a fixées, ou de la pertinence des outils utilisés pour la modélisation.
Les outils mathématiques les plus courants
Il s'agit essentiellement d'outils statistiques et de probabilités. Plus précisément,
- Pour les modèles prédictifs :
- la projection, qui consiste à prédire la valeur d'une grandeur numérique continue à partir des valeurs passées, par exemple en utilisant les méthodes de régression (linéaire ou non) ;
- Pour tous les modèles :
- la classification, ou catégorisation, qui permet de situer une observation (événement ou individu) dans un nombre réduit de classes prédéfinies.
- la représentation graphique, qui donne une image visuelle ;
- l'utilisation des variables centrées, où une variable est sensée représenter toutes les autres (ex. la moyenne) ;
- la corrélation, qui permet d'associer plusieurs variables quand elles ont un comportement commun ;
- la clusterisation, qui consiste à présenter les observations par paquets les plus homogènes possibles (les clusters) ;
- la réduction de dimensionalité, qui consiste à créer, à partir d'un ensemble d'observations, un ensemble réduit d'observations (c'est-à-dire moins nombreuses) qui est réputé se comporter comme la population initiale.
