Convention de sommation d'Einstein
En mathématiques et plus spécialement dans les applications de l'algèbre linéaire en physique, la convention de sommation d'Einstein ou notation d'Einstein est un raccourci de notation utile pour la manipulation des équations concernant des coordonnées.
Selon cette convention, quand l'indice d'une variable apparaît deux fois dans un terme on sous-entend la sommation sur toutes les valeurs que peut prendre cet indice. Cet indice est dit muet. Un indice non muet est dit indice réel et ne peut apparaître qu'une seule fois dans le terme en question. Généralement, ces indices sont 1, 2 et 3 pour les calculs dans l'espace euclidien ou 0, 1, 2, et 3 ou 1, 2, 3 et 4 pour les calculs dans un espace de Minkowski, mais ils peuvent avoir d'autres valeurs ou même, dans certaines applications, représenter un ensemble infini.
En relativité générale, l'alphabet latin et l'alphabet grec et sont respectivement utilisés pour distinguer si la somme porte sur 1, 2, 3 ou 0, 1, 2, 3. Par exemple les indices i, j, ... sont utilisés pour 1, 2, 3 et μ, ν, ... 0, 1, 2, 3.
Lorsque les indices se rapportent à des tenseurs, comme en relativité générale, les indices muets doivent apparaître une fois en haut et une fois en bas; dans d'autres applications une telle distinction n'existe pas.
Définitions
Traditionnellement, on s'intéresse à un espace vectoriel V de dimension finie n et une base sur V.
On peut écrire les vecteurs de base ainsi:
.
Dans ce cas, si
est un vecteur dans V, ces coordonnées dans cette base sont
.
La règle de base est:
Qui, avec le convention de sommation d'Einstein, s'écrit
Dans cette expression on sous-entend que le terme de droite est additionné pour toute les valeurs de i allant de 1 à n, car l'indice i apparaît deux fois.
L'indice i est dit muet car le résultat ne dépend pas de lui. Par exemple, pour exprimer la même chose on pourrait aussi écrire:
Dans les contextes dans lesquels l'indice doit apparaître une fois en bas et une fois en haut, les vecteurs de base s'écrivent
mais les coordonnées s'écrivent vi. La règle de base s'écrit alors:
.
L'intérêt de la notation d'Einstein est qu'elle s'applique à d'autres espaces vectoriels construit à partir de V en utilisant le produit tensoriel et la dualité.
Par exemple,
, le produit tensoriel de V par lui-même, a une base constituées de tenseurs de la forme
.
Tout tenseur T dans
peut s'écrire:
.
V*, le duel de V, a une base
qui obéissent à la règle:
où
est le symbole de Kronecker:
vaut 1 si i = j et 0 aussi non.
Ici nous avons utilisé un indice inférieur pour la base duale, comme c'est le cas lorsque les indices doivent apparaître une fois en haut et une fois en bas. Dans ce cas, si L est un élément de V*, alors:
Si au contraire, tout les indices doivent être placés en base, alors une lettre différente doit être utilisée pour désigner la base duale. Par exemple:
L'utilité de la notation d'Einstein apparaît surtout dans les formules et les équations qui ne font pas mention de la base choisie. Par exemple, avec L et v défini comme plus haut:
- Lv = Livi.
Et ceci est vrai pour toutes les bases.
Les sections suivantes contiennent d'autres exemples de telles équations.
Algèbre vectorielle élémentaire et algèbre matricielle
Soit V un espace vectoriel dans
, alors il existe un base standard pour V dans laquelle
est (0,...,0,1,0,...,0), avec le 1 à la position i.
Dans ce cas, les matrices n × n peuvent être vues comme des éléments de
.
On peut aussi considérer les vecteurs dans V comme des vecteurs colonnes ou comme des matrices n × 1 et les éléments de V* comme des vecteurs rangées ou des matrices 1 × n.
Dans les exemples qui suivent, tous les indices apparaîtront en position haute. C'est parce que V a un produit interne et que la base base choisie est orthonormale, comme cela est expliqué dans la section suivante.
Si H est une matrice et b est un vecteur colonne, alors Hb est un autre vecteur colonne. Pour définir w = Hb, on peut écrire:
- wi = Hijvi
On notera que l'indice muet j apparaît deux fois dans le terme de gauche tandis que i apparaît une seule fois dans chaque terme.
En utilisant la distributivité,
peut s'écrire:
- Hij(uj + vj) = Hijuj + Hijvj
Cet exemple montre la preuve de la loi de distributivité, car l'équation des indices ne fait que directement références aux nombres réels Hij, uj et vj et sa validité découle directement de celle de la distributivité de ces nombres.
La transposée d'un vecteur colonne est un vecteur ligne avec les même composants et la transposée d'une matrice est une autre matrice dont les composants sont donné en inversant les indices.
Supposons que nous sommes intéressé par
, le produit de
par HT.
Alors:
- wi = viHji
Donc pour exprimer que la transposée d'un produit inverse l'ordre de la multiplication, nous pouvons écrire:
- Hjivi = viHji
À nouveau, ceci découle directement de la commutativité des nombres réels.
Le produit scalaire de deux vecteurs u et v peut s'écrire:
Si n = 3, nous pouvons aussi écrire le produit vectoriel en utilisant le symbole de Levi-Civita. Par exemple, si w est u × 'v, alors:
- wi = εijkujvk
Ici le symbole de Levi-Civita e où ε est tel que εijk est 1 si (i, j, k) est une permutation paire de (1,2,3), -1 si c'est une permutation impaire et 0 si (i, j, k) n'est pas une permutation de (1,2,3).
Cas sans produit interne
Dans les exemples ci-dessus, vous pouvez remarquez qu'ils sont toujours valides si les indices muets seraient présent une fois comme indice supérieur et une fois comme indice inférieur sauf l'exemple concernant la transposée. C'est parce que ces exemples utilise implicitement le produit interne dans un espace euclidien (produit scalaire) alors que l'exemple avec le transposée ne le fait pas.
Dans certaines applications, il n'y a pas de produit interne sur V. Dans ces cas, requérir que les indices muets doivent apparaître une fois en haut et une fois en bas peut aider à éviter des erreurs, un peu comme l'analyse dimensionnelle permet d'éviter les erreurs d'unités. plus significativement, le produit interne peut être l'objet principal de l'étude et ne devrait pas être supprimer de la notation; c'est le cas, par exemple, des équations de la relativité générale. Dans ces cas, la différence entre la position d'un indice peut-être cruciale.
Quand on se réfère explicitement au produit interne, ces composants sont souvent noté: gij (cfr. tenseur métrique). On notera que gij = gji. La formule pour le produit scalaire devient alors:
On peut aussi abaisser l'indice en définissant:
- ui = gijuj
Ce qui donne:
On notera que ici nous avons implicitement utilisé le fait que gij = gji.
De façon similaire, nous pouvons élever un indice en utilisant le produit interne correspondant sur V*.
Le produit interne est alors défini par gij, qui en tant que matrice est l'inverse de gij.
Si vous élevez un indice puis vous l'abaissez (ou le contraire) vous retrouvez ce que aviez au départ.
Si vous élevez le i dans gij, alors vous obtenez
et si vous élevez le j dans
vous obtenez gij.
Si la base choisie pour V est orthonormale, alors gij = gij et ui = ui. Dans ce cas, on retrouve la formule pour le produit scalaire de la section précédente. Mais si la base n'est pas orthonormale, cela ne sera plus vrai. Donc si vous étudiez le produit interne et que vous ne pouvez pas savoir si la base est orthonormale, vous devrez vous référez explicitement à gij. De plus, si le produit interne n'est pas définie-positive, comme c'est le cas en relativité générale, gij = dji ne sera même pas vrai même si la base est orthonormale car vous aurez parfois -1 au lieu de 1 quand i = j.
