Centrale Maths 1 PC 2022

Thème de l'épreuve Matrices de covariance et maximisation de la variance
Principaux outils utilisés algèbre linéaire, diagonalisation, probabilités
Mots clefs matrice de covariance, orthodiagonalisation, variance totale, rayon spectral, matrice symétrique, matrice orthogonale, produit scalaire
algibreespaces-prihilbertiens-et-euclidiens

Corrigé

 : 👈 gratuite pour tous les corrigés si tu crées un compte
👈 l'accès aux indications de tous les corrigés ne coûte que 5 € ⬅ clique ici
👈 gratuite pour tous les corrigés si tu crées un compte
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Énoncé complet

(télécharger le PDF)
           

Rapport du jury

(télécharger le PDF)
              

Énoncé obtenu par reconnaissance optique des caractères


Mathématiques 1
PC

4 heures Calculatrice autorisée

2022

Notations

Dans tout le problème, n désigne un entier naturel supérieur ou égal à 2.

On utilisera les notations matricielles classiques :

-- M,,,(R) désigne l'ensemble des matrices à n lignes et p colonnes à 
coefficients réels et M,,(R) l'ensemble
des matrices carrées réelles à n lignes ;

-- 0,, désigne la matrice de M,,(R) dont tous les coefficients sont nuls ;

-- S,,(R) désigne le sous-espace vectoriel de M,,(R) formé par les matrices 
symétriques ;

-- diag(a;,.....,a,) désigne la matrice diagonale dont les coefficients 
diagonaux sont a,,......,a, dans cet ordre ;

-- AT désigne la transposée de la matrice À ;

-- sp(À) désigne le spectre réel de la matrice À, c'est-à-dire l'ensemble des 
valeurs propres réelles de À.

Les éléments de M,(R) sont assimilés à des réels.

Avec ces notations, le produit scalaire canonique de M, ,(R) est donné par (U | 
V) =U'V.

On note |U]|| la norme euclidienne canonique de U EUR M, 1 (R).

Les variables aléatoires considérées sont définies sur un espace probabilisé 
(Q, B,P). On suppose que, pour
tout p EUR ]0,1[, il existe une suite (X,,),eu de variables aléatoires de 
Bernoulli de paramètre p mutuellement
indépendantes définies sur Q.
Si X et Y sont deux variables aléatoires réelles discrètes définies sur Q, on 
note E(X),V(X) et cov(X,Y)
respectivement l'espérance de X, la variance de X et la covariance de X et Y, 
lorsqu'elles sont définies.

On rappelle la formule

cov(X, Y) = E((X --E(X))(Y --E(N))) = E(XY) - EDEN).

Définition
Une matrice À de M,,(R) est dite orthodiagonalisable s'il existe une matrice 
diagonale D et une matrice ortho-
gonale P telles que À = PDP".

Orthodiagonaliser À revient à déterminer un couple de telles matrices (D, P).

I Généralités sur les matrices symétriques réelles

Q 1. Démontrer qu'une matrice À EUR M,,(R) est orthodiagonalisable si et 
seulement si elle est symétrique.
IA - Un exemple dans M;(R)
3 --2 4
On pose A,=| ---2 6 2 |.
4 2 3
Q 2. En observant la première et la dernière colonne de À,, déterminer un 
vecteur propre de À, et la valeur

propre À, associée.
Q 3. Déterminer le sous-espace propre de À; associé à la valeur propre À, et en 
déduire le spectre de À;.
Q 4. Orthodiagonaliser À.

I.B - Un exemple dans M,,(R)

1
Q 5. Montrer que l'application  : (P,Q) H @(P,Q) = | P(t)Q(®t) dt définit un 
produit scalaire sur
0

Ra_1 [X] °
Q 6. Écrire la matrice H de ce produit scalaire dans la base canonique de 
R,,_,[X], c'est-à-dire la matrice
de terme général h; ; = @(X*, X?) où les indices à et j varient entre 0 et n -- 
1.

Q 7. Soit UE M, ,(R). Exprimer le produit UTHU à l'aide de 6 et des 
coefficients de U.

Q 8. Montrer que H appartient à &,,(R) et que ses valeurs propres sont 
strictement positives.

M043/2022-02-10 09:45:01 Page 1/4 (cc) BY-NC-SA
IC --- Rayon spectral
Pour toute matrice À EUR M,,(R) de spectre non vide, le rayon spectral de À, 
noté p(A), est défini par

A) = À.
p(A)= max AI

Q 9. Montrer que, si À est nilpotente, c'est-à-dire qu'il existe p EUR N° tel 
que 4? = (,,, alors le rayon spectral
de À est nul.

Q 10. On note C_ = {UE M, 1(R) | U'U = 1}. Démontrer que C est une partie 
fermée de M,, (R).
Q 11. En déduire que l'application : U + |U'! AU| admet un maximum sur C.
Q 12. Montrer que p(A) < max|U "AU. EUR I.D -- Rayon spectral d'une matrice symétrique Soit À EUR S,,(R). Q 13.  Démontrer que p(A) -- max[U "AU, EUR On suppose de plus que les valeurs propres de À sont toutes positives. Q 14. Montrer alors que p(A) = max(U" AU). EUR Q 15.  Démontrer que l'application p définit une norme sur 6,,(R). II Matrice de covariance Dans la suite du problème, on considère n variables aléatoires discrètes Y,,...,Y, définies sur (Q, B,P) à valeurs réelles et on définit la fonction Y de Q dans M, (R) en posant {, (w) | VueQ, Y(w) = Y,, (w) Tv Un tel vecteur aléatoire est dit constant si la fonction Y est constante. Si chacune des variables aléatoires discrètes Y: admet une espérance finie, on définit le vecteur espérance de Y en posant E(Y:) E(Y) = . a) Si toutes les covariances existent, la matrice de covariance de Y est la matrice de M,,(R), notée Y,., de terme général o; ; = cov(Y;, Y;). La variance totale de Y est définie par V(Y) -- > VOY.).
i=1
Dans la suite du problème, on suppose que E(Y) et 4; sont bien définies.

II. À --
On admet que Y est une variable aléatoire discrète sur (Q, B,P) à valeurs dans 
M, ;(R).

On admet aussi que (Y -- E(Y))(Y -- E(Y)). est une variable aléatoire discrète, 
à valeurs dans M,(R), dont
l'espérance, par définition, est également calculée terme à terme.

Q 16. Vérifier que },4- est une matrice symétrique, que
-
Sy =E((Y-E(Y))( -E(Y))")
et que, si U est un vecteur constant dans M, ,(R), alors

Dyau = dy.

Q 17. Soient p EUR N° et M EUR M, (R). On définit la variable aléatoire 
discrète Z = MY, à valeurs dans
M, 1(R). Justifier que Z admet une espérance et exprimer E(Z) en fonction de 
E(Y). Montrer que Z admet une
matrice de covariance », et que

M043/2022-02-10 09:45:01 Page 2/4 (cc) BY-NC-SA
II.B -- Propriété des valeurs propres

On note P la matrice de passage de la base canonique de M, :(R) à une base 
orthonormée formée de vecteurs
propres de »,,.

À;
On définit la variable aléatoire discrète X = P'Y -- | : | |

À»
Q 18.  Démontrer que » + est une matrice diagonale.
Q 19. En déduire que les valeurs propres de X,; sont toutes positives.
Q 20.  Démontrer que la variance totale de X est égale à celle de Y.

II.C - Étude de la réciproque

Soit D = diag(ÀA,,..., À,) une matrice diagonale dont les coefficients 
diagonaux À, sont tous positifs.
Q 21.  Démontrer l'existence d'une variable aléatoire discrète Z à valeurs dans 
MW, ,(R) telle que Z, = D.
Soit À EUR 8, (R) une matrice symétrique dont les valeurs propres sont 
positives.
Q 22.  Démontrer l'existence d'une variable aléatoire discrète Y à valeurs dans 
M, 1(R) telle que X- = A.
a:
II. D -- Soit U -- | | dans M, ,(R). On définit la variable aléatoire discrète 
X -- U'Y.
Un

Q 23. Montrer que À admet une variance et que
V(X)=U'E,U.

IIE -- Image de »;

L'objectif de cette sous-partie est de montrer que
P(Y --E(Y) EUR ImEy) = 1.

On note r le rang de la matrice de covariance de Y.

Q 24. Traiter le cas où r = n.

On suppose maintenant r < n. Q 25.  Démontrer que le noyau et l'image de X,- sont supplémentaires orthogonaux dans M, : (R). On note d = dimkerY, et on considère une base orthonormée (V,,..., V,) de ker »,.. Q 26.  Démontrer que Vie [14]. VE; (Y E(Y))) = 0, Q 27. En déduire que P(V/(Y --E(Y)) =0) =1. Q 28. Conclure. III Maximisation de la variance Les notations sont celles de la partie II. On cherche un vecteur U unitaire tel que la variance de U!Y soit maximale. Comme en I.C, on note C={UEeM,; (R |U'U=1}. On note qy l'application de C dans R définie par qÿ(U) = V(U'Y). IIT.A -- Un exemple dans M3 1(R) On pose À, = diag(9, 5,4). Q 29. Justifier l'existence d'un vecteur aléatoire dont À, est la matrice de covariance. Q 30. Dans cette question uniquement, on suppose que Y une variable aléatoire à valeurs dans M3 : (R) telle que > = À,. Déterminer le maximum de q$ sur C.

ITI.B --- Cas général

Q 31. Dans le cas général, démontrer que la fonction qg$ admet un maximum sur 
C. Préciser la valeur de ce
maximum ainsi qu'un vecteur U, EUR C tel que

V(UTY) = V(UTY).
max VU Y) = VU, Y)

M043/2022-02-10 09:45:01 Page 3/4 (cc) BY-NC-SA
III.C --- Étude d'un exemple

On suppose, dans cette sous-partie IIL.C uniquement, que },- vérifie

Vieli,n], o,,= 0° et VGi,j)e[Lnf, #5 = 0,,=0°)

où © et y sont deux réels strictement positifs.
On note J EUR M,,(R) la matrice dont tous les coefficients sont égaux à 1.
Q 32.  Démontrer que 7 < 1 et exprimer >, en fonction de J.

Q 33. Déterminer les valeurs propres de J et la dimension de chaque sous-espace 
propre associé. Déterminer
également un vecteur propre associé à sa valeur propre de module maximal.

Q 34. Préciser un vecteur U, unitaire tel que la variance de Z -- U, Y soit 
maximale.

/ / Le V(Z
Q 35. Calculer le pourcentage de la variance totale représenté par Z, 
c'est-à-dire le rapport y a
T
III. D -- On suppose, dans cette dernière sous-partie, que > présente n valeurs 
propres distinctes qu'on

classe par ordre strictement décroissant À, > + > À,,.

On se munit d'un vecteur U, tel que V(U, Y) -- max V(U'Y).
EUR

On note
C'={UEM, AR) | U'U =1et U,U = 0}.

Q 36.  Justifier que q, admet un maximum sur C".
Q 37. Déterminer la valeur de ce maximum et préciser un vecteur U, EUR C" tel 
que

VU!Y)=V(UIY).
max V(U Y) = V(U, Y)

Q 38. Calculer la covariance des variables aléatoires discrètes U, Y et U, Y 
(pour simplifier l'écriture, on
pourra supposer Y centrée, c'est-à-dire E(Y) = 0).

Ces questions de maximisation de la variance sont à la base de la méthode 
statistique d'analyse en composantes
principales. Îl s'agit de déterminer, à partir d'un certain nombre de variables 
aléatoires, des combinaisons
linéaires (composantes principales) concentrant le maximum d'information et 
décorrélées entre elles.

eeoeFrINeee

M043/2022-02-10 09:45:01 Page 4/4 (cc) BY-NC-SA