Classification automatique
Nos moyens limités d'entendement nous obligent, pour tenter de comprendre quelque chose au réel, à effectuer des classifications des objets que nous devons traiter en catégories. Celles-ci ont été considérées par la philosophie :
- au départ comme préexistantes à l'observation. C'est la démarche dite platonicienne où l'on considère que les catégories en question préexistent à l'entendement humain, qui ne fait que les découvrir plus ou moins imparfaitement. Cette démarche subsista grosso modo jusqu'à la fin du Moyen Âge, où elle était curieusement désignée sous le nom de réalisme.
- par la suite estimées comme des regroupements ad hoc et ne visant qu'à la commodité d'usage : il n'existerait pas en soi de « champignons comestibles » et de « champignons vénéneux », mais l'effet observé des champignons nous aurait conduits à les classer fonctionnellement en comestibles et en vénéneux. Cette démarche opposée au réalisme du Moyen Âge fut nommée nominalisme. Bertrand Russell fait remarquer dans ses ouvrages que si l'on devait les nommer aujourd'hui, on permuterait les deux appellations.
La classification automatique vise à créer ces catégories à partir de procédés ne faisant intervenir que les données et pas la subjectivité de l'expérimentateur. Il serait d'ailleurs plus exact de dire : « ne faisant pas intervenir la subjectivité de l'expérimentateur par autre chose que le choix des représentations qu'il utilise » : Si l'on classifie des objets en considérant leur plus grande dimension, on n'obtiendra pas en général le même classement qu'en les classifiant par leurs poids.
Les méthodes de classification automatique le plus utilisées sont (dans le désordre) :
- Réseaux de neurones (MLP, RBF)
- Méthodes des nuées dynamiques
- Inférence bayésienne
- Analyse linéaire discriminante
- Séparateur à vastes marges (SVM)
