Capitolo 1 – Lapalissiano

📘 Appendice — Dagli insiemi agli spazi

A.1 Matrice di Frobenius associata ad un polinomio monico

\([...]\) But is not the position of an ordinary applied mathematician in some ways a little pathetic? If he wants to be useful, he must work in a humdrum way, and he cannot give full play to his fancy even when he wishes to rise to the heights. ‘Imaginary’ universes are so much more beautiful than this stupidly constructed ‘real’ one; and most of the finest products of an applied mathematician’s fancy must be rejected, as soon as they have been created, for the brutal but sufficient reason that they do not fit the facts. \([...]\)

— G.H. Hardy, A Mathematician's Apology

La presente unità del corso si compone di alcuni argomenti aggiuntivi, i quali, sebbene possano essere congiuntamente appresi con le nozioni fin qui esposte, non appartengono per consuetudine al novero delle materie trattate nei corsi ordinarii di Algebra Lineare. Pertanto, il loro studio è lasciato alla libera elezione dello studente, qualora questi voglia approfondire più oltre le speculazioni del presente libretto.

A.1.1 Polinomio monico e polinomio caratteristico

Prima di tuffarci nella definizione, fermiamoci un attimo a riflettere: un polinomio non è altro che un’espressione algebrica in una variabile, giusto? Ma se invece della variabile \(t\) ci mettessimo dentro una matrice o un operatore lineare, che cosa succederebbe? Ecco l’idea che sta dietro la cosiddetta matrice di Frobenius.

Forse vi sorprenderà sapere che queste matrici nascono come un “trucco” per tradurre le proprietà di un polinomio in proprietà di matrici. Un po’ come quando traduciamo una frase in un’altra lingua: il senso rimane lo stesso, ma la forma cambia radicalmente.

Un polinomio monico di grado \(n\) in \(\mathbb{K}[t]\) è un polinomio della forma \[p(t) = t^n + a_{n-1} t^{n-1} + \dots + a_1 t + a_0,\] dove il coefficiente del termine di grado massimo, cioè il coefficiente di \(t^n\), è uguale a 1.

È detto monico perché il coefficiente del termine di grado massimo è \(1\); questa scelta non è banale dato che avere il coefficiente principale pari a \(1\) semplifica enormemente le formule.

Ora arriva il passo cruciale: dato \(p(t)\), costruiamo una matrice speciale, la matrice compagna o matrice di Frobenius, che “incarna” il polinomio.

Sia \(p(t)\) un polinomio monico di grado \(n\) \[p(t) = t^n + a_1 t^{n-1} + \dots + a_n.\] Si definisce la matrice di Frobenius – o matrice compagna – \(A_p \in M_n(\mathbb{K})\) la seguente: \[A_p = \begin{pmatrix} 0 & 0 & \cdots & 0 & -a_n \\ 1 & 0 & \cdots & 0 & -a_{n-1} \\ 0 & 1 & \cdots & 0 & -a_{n-2} \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & -a_1 \end{pmatrix}.\]

Il suo polinomio caratteristico, ottenuto tramite Laplace lungo l’ultima colonna, è \[P_{A_P}(t)=\det (A_p-tI_n)=(-1)^np(t)\]

Osservazione. Il polinomio caratteristico di \(A_p\) non è un intruso qualunque: è proprio il polinomio di partenza, a meno di un segno. Infatti si ottiene \[P_{A_p}(t) = (-1)^n p(t).\]

Esercizio. Scrivere la matrice di Frobenius associata al polinomio \(p(t) = t^3 - 2t + 5\). Qual è il suo polinomio caratteristico?

Esercizio. Scrivere la matrice di Frobenius associata al polinomio \(p(t) = t^3 - 2t + 5\). Qual è il suo polinomio caratteristico?
Soluzione. Per \(p(t) = t^3 - 2t + 5\) si ha \(n=3\), \(a_1=-2\), \(a_2=0\), \(a_3=5\). \[A_p = \begin{pmatrix} 0 & 0 & -5 \\ 1 & 0 & 0 \\ 0 & 1 & 2 \end{pmatrix}, \quad P_{A_p}(t) = -(t^3 - 2t + 5).\]

Questa costruzione è utile perché \(A_p\) permette di rappresentare un endomorfismo \(f\) in una base molto speciale, detta ciclica.

Un vettore \(e_1\) è ciclico per \(f\) se ripetendo l’applicazione di \(f\) su \(e_1\) si genera un’intera base dello spazio: \(\{e_1, f(e_1), f^2(e_1), \dots, f^{n-1}(e_1)\}\).

Ed è proprio quello che succede con la matrice di Frobenius: le potenze successive di \(f\) applicate a \(e_1\) ricostruiscono una base canonica. In altre parole, l’intero spazio \(\mathbb{K}^n\) nasce da un solo vettore e dalle sue trasformazioni.

Si consideri l’endomorfismo associato alla matrice di Frobenius, definito come \[f \equiv \ell_{A_p} : \mathbb{K}^n \to \mathbb{K}^n.\] Il vettore \(e_1\) è un vettore ciclico per \(f\), cioè l’insieme \(\{e_1, f(e_1), f^2(e_1), \dots, f^{n-1}(e_1)\}\) costituisce una base di \(\mathbb{K}^n\).

In particolare, le immagini iterate di \(e_1\) tramite \(f\) generano la base canonica: \[e_1 = f^0(e_1) \mapsto f(e_1) = e_2 \mapsto (f\circ f)(e_1)=f^2(e_1) = e_3 \mapsto \dots \mapsto f^{i}(e_1) = e_{i+1} \mapsto \dots \mapsto f^{n-1}(e_1) = e_n.\] Inoltre, si ha che \[f^n(e_1) = f(e_n) = -a_n e_1 - a_{n-1} e_2 - \dots - a_1 e_1.\] Questo può essere scritto come \[f^n(e_1) = -a_n f^{n-1}(e_1) - a_{n-1} f^{n-2}(e_1) - \dots - a_1 f^0(e_1).\] Di conseguenza, si può esprimere l’uguaglianza come: \[(f^n - a_n f^{n-1} - a_{n-1} f^{n-2} - \dots - a_1f^0)(e_1) = 0.\] Considerando \(p(f)=f^n - a_n f^{n-1} - a_{n-1} f^{n-2} - \dots - a_1f^0\) come endomorfismo di \(\mathbb{K}^n\), si ha che \(p(f)(e_1)=0\), ossia \(e_1 \in \ker p(f)\).

Inoltre, per ogni \(1 \leq i \leq n\) si ha che \(p(f)(e_i)=0\) dato che \(p(f)(f^{i-1}(e_1))=(p(f) \circ f^{i-1})(e_1)=0=( f^{i-1} \circ p(f))(e_1)\).

Si ha dunque che \[p(f) \equiv 0\] come endomorfismo in \(\mathbb{K}^n\).

Nota. \(f\) commuta con tutte le sue potenze \[f \circ f^k=f \circ (f \circ \dots \circ f)=(f \circ \dots \circ f)\circ f=f^k \circ f.\]

A.1.2 Valutazione del polinomio

Ora che abbiamo visto come un polinomio si traduce in una matrice, facciamo un passo oltre: proviamo a valutare un polinomio in un operatore. In pratica: invece di sostituire \(t\) con un numero, sostituiamolo con l’endomorfismo \(f\) associato ad \(A_p\).

Cosa significa? Significa che \[p(t) = t^n + a_1 t^{n-1} + \dots + a_n \ \] diventa \[p(f) = f^n + a_1 f^{n-1} + \dots + a_n I.\]

Si vuole analizzare il nucleo, ossia i polinomi che si annullano su \(f\).

Si torna alla costruzione precedente: sia \(p(f)\) un polinomio monico di grado \(n\), con \(A_p\) matrice di Frobenius associata all’endomorfismo \(f \equiv \ell_{A_p} \in \operatorname{End}(\mathbb{K}^n)\). Allora, si ha che \(p(f) \equiv 0\) in \(\operatorname{End}(\mathbb{K}^n)\), e il polinomio minimo \(P_f(t)\) soddisfa la relazione \[P_f(t) = (-1)^n p(t).\]

In questo caso, se \(q(t) \in \mathbb{K}[t]\) è un polinomio diverso da zero di grado strettamente inferiore a \(n\), allora \(q(f) \neq 0\) in \(\operatorname{End}(\mathbb{K}^n)\).

Infatti, sia \(q(t) = b_0 f^m + b_1 f^{m-1} + \dots + b_m f^0\) con \(m < n\), allora \[q(f)(e_1) = b_0 e_{m+1} + b_1 e_m + \dots + b_m e_1.\] Se \(q(f)(e_1) = 0\), allora \(b_0 = b_1 = \dots = b_m = 0\), e quindi \(q(t) = 0\) come polinomio.

Esercizio. Verificare direttamente, applicando \(f\) al vettore \(e_1\), che \(p(f)(e_1) = 0\).
Suggerimento: calcolare \(f(e_1), f^2(e_1), \dots, f^n(e_1)\) e osservare come tornano in combinazione lineare. //

Per \(n=3\) e \(p(t) = t^3 - 2t + 5\), abbiamo visto che \(f^3(e_1) = 2 f(e_1) - 5 e_1\). Quindi \[(f^3 - 2f + 5I)(e_1) = 0.\] Poiché \(\{e_1, f(e_1), f^2(e_1)\}\) è una base, si conclude che \(p(f) = 0\) su tutto lo spazio.

Se \(f \in \operatorname{End}(V)\) e \(V\) è uno spazio vettoriale di dimensione finita \(n\) su \(\mathbb{K}\), allora la mappa \[\mathbb{K}[t] \to \operatorname{End}(V), \quad p(t) \mapsto p(f),\] è un omomorfismo di anelli, e l’immagine è un anello commutativo.

Nota. Se \(v\) è un autovettore di \(f\) con autovalore \(\lambda \in \mathbb{K}\), allora \(v\) è anche un autovettore di \(p(f)\) con autovalore \(p(\lambda) \in \mathbb{K}\), dove \(\lambda\) è l’autovalore corrispondente di \(v\) rispetto a \(f\). In particolare, si ha \[p(f)(v) = a_0 f^m(v) + a_1 f^{m-1}(v) + \dots + a_m f^0(v) = a_0 \lambda^m v + \dots + a_m \lambda^0 v = p(\lambda) v.\]

Domanda. Quali sono i polinomi \(q(t) \in \mathbb{K}[t]\) tali che \(q(f) = 0\)?

Risposta. Esistono polinomi diversi da zero che soddisfano questa condizione. Infatti, se si prende un vettore \(v \in V\) non nullo, qualsiasi vettore \(v = f^0(v)\) e le sue immagini iterate \(f^0(v), f^1(v), \dots\) diventano linearmente dipendenti per un qualche \(k \leq n\). In particolare, si ha \[f^k(v) = a_1 f^{k-1}(v) + a_2 f^{k-2}(v) + \dots + a_k f^0(v),\] da cui si può ricavare un polinomio \[q(t) = t^k - a_1 t^{k-1} - \dots - a_k.\] Questo polinomio è diverso da zero, essendo monico, e soddisfa \[q(f)(v) = 0.\]

Si prenda una base \((v_1, \dots, v_n)\) di \(V\) e si ripeta questa costruzione per ogni vettore della base.

Siano \(q_1(t), \dots, q_n(t)\) polinomi monici di grado minore o uguale a \(n\) tali che \(q_1(t)(v_1) = 0, \dots, q_n(t)(v_n) = 0\). Allora il prodotto \[q_1(t) \cdot q_2(t) \cdot \dots \cdot q_n(t)\] è un polinomio monico di grado minore o uguale a \(n^2\), tale che \[(q_1(t) \cdot q_2(t) \cdot \dots \cdot q_n(t))(f) = 0 \quad \text{come} \quad \operatorname{End}(V),\] e \[(q_1(f) \circ q_2(f) \circ \dots \circ q_n(f))(v_i) = 0 \quad \text{per ogni} \quad i.\]

Quindi, esistono polinomi diversi da zero che soddisfano la condizione \(q(f) = 0\).

A.2 Valutazione dei polinomi in un endomorfismo

Dopo aver visto come costruire la matrice di Frobenius e come valutare un polinomio in un operatore, siamo pronti a introdurre due protagonisti fondamentali della teoria: il polinomio minimo e il teorema di Cayley–Hamilton.

A.2.1 Polinomio minimo

Sia \(V\) uno spazio vettoriale su \(\mathbb{K}\) di dimensione finita \(n\) e sia \(f\) un endomorfismo di \(V\). Il polinomio minimo di \(f\) è un polinomio \(Q_f(t) \in \mathbb{K}[t]\) monico di grado minimo tale che \(Q_f(f) = 0\) come endomorfismo di \(V\).

Osservazione. Tale polinomio è unico e un polinomio \(p(t) \in \mathbb{K}[t]\) è tale che \[p(f)=0 \iff Q_f(t) \mid p(t).\]

Esercizio. Calcolare il polinomio minimo della matrice \[A = \begin{pmatrix} 2 & -1 & 1 \\ -1 & 2 & -1 \\ -2 & 2 & -1 \end{pmatrix}.\] Suggerimento: trovare prima il polinomio caratteristico, poi verificare qual è la potenza minima che annulla \(A\).

Il polinomio caratteristico è \((1-t)^3\). Si trova che \((I - A)^2 = 0\) ma \((I - A) \neq 0\). Quindi il polinomio minimo è \(Q_A(t) = (1-t)^2\).

Se \(p(t)\) è un polinomio monico dello stesso grado di \(Q_f(t)\) tale che \(p(f) = 0\), allora \(Q_f(t) - p(t)\) valutato in \(f\) è nullo e presenta grado strettamente inferiore o nullo.

Dimostrazione. Rivedere (seconda affermazione) Se \(\deg p(t) \geq \deg Q_f(t)\), allora si divide (con resto) \[p(t) = q(t)Q_f(t) + r(t)\] con \(\deg r(t) < \deg Q_f(t)\).

Ma se \(p(f) = 0\), allora anche \(r(f) = 0\), e quindi \(r(t) = 0\), e di conseguenza \(p(t) = q(t)Q_f(t)\). Poiché \(p(t)\) è monico e \(Q_f(t)\) è monico, anche \(q(t)\) deve essere monico. Ma, dato che \(\deg r(t) < \deg Q_f(t)\), il grado di \(p(t) - Q_f(t)\) è strettamente inferiore a quello di \(Q_f(t)\), il che implica che \(p(t) = Q_f(t)\). 0◻

Il polinomio minimo della restrizione di \(f\) a un sottospazio \(f\)–invariante divide il polinomio minimo di \(f\).

Dimostrazione. Il polinomio minimo di \(f\) valutato nella restrizione di \(f\) è l’endomorfismo nullo del sottospazio invariante. 0◻

Gli autovalori di \(f\) sono radici del polinomio minimo.

Dimostrazione. Sia \(\lambda\) un autovalore di \(f\): \[Q_{f_{\mid E(\lambda)}}(t)=t-\lambda \mid Q_f(t).\] 0◻
Nota. Vale anche il viceversa, ogni radice del polinomio minimo è un autovalore.

Se un polinomio \(p\) di grado strettamente positivo e strettamente inferiore al grado del polinomio minimo divide il polinomio minimo, allora \(p(f)\) non è iniettivo (\(\iff\) non è invertibile).

Dimostrazione. Se \(p(f)\) fosse invertibile, si avrebbe \[Q_f(t) = p(t) q(t),\] da cui, valutando in \(f\), si ottiene \[q(f) = (p(f))^{-1} Q_f(f) = 0.\] Questo contraddice il fatto che \(Q_f(f) = 0\) è il polinomio minimo di \(f\), il quale è di grado minimo. Quindi, \(p(f)\) non può essere invertibile.

0◻

Se \(t - \lambda \mid Q_f(t)\), allora \(\lambda\) è autovalore di \(f\). Si ha dunque \[\operatorname{Spec}(f) = \{ \text{radici di } P_f(t) \} = \{ \text{radici di } Q_f(t) \}.\]

Se \(f\) è diagonalizzabile, il polinomio minimo \(Q_f(t)\) è il prodotto dei fattori \(t - \lambda\), con \(\lambda\) autovalore di \(f\) e molteplicità \(\alpha\). Si ha dunque \[Q_f(t) = \prod_{\lambda \in \operatorname{Spec}(f)} (t - \lambda).\]

Esempio. Si consideri la matrice \(A=\begin{pmatrix} 2 & -1 & 1\\ -1&2 & -1 \\ -2 & 2 & -1 \end{pmatrix} \in M_3(\mathbb{R})\) e l’endomorfismo associato \(f=\ell_A\).
Si calcola il polinomio caratteristico \(P_A(t)=(1-t)^3\).
Quindi si ha che \((I_3-A)^3\equiv0\).
Si ha che \((I_3-A) \ne 0\) e che \((I_3-A)^2=0\).

Quindi il polinomio minimo che divide il polinomio caratteristico è \(Q_A(t)=(1-t)^2 \implies Q_A(t) \mid P_A(t)\).

Esercizio. Calcolare i polinomi minimi delle seguenti matrici a coefficienti reali:

\[A_1 = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}, \quad A_2 = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}, \quad A_3 = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}, \quad A_4 = \begin{pmatrix} 1 & 2 \\ 0 & 1 \end{pmatrix}, \quad A_5 = \begin{pmatrix} 0 & 1 \\ 2 & 3 \end{pmatrix}.\]

Verificare inoltre che i polinomi minimi di queste matrici abbiano tutti grado 2 e calcolarne le radici complesse.

A.2.2 Teorema di Cayley-Hamilton

Siamo pronti per uno dei risultati più eleganti dell’algebra lineare: ogni operatore annulla il proprio polinomio caratteristico.

Sia \(V\) un \(\mathbb{K}\)–spazio vettoriale a dimensione finita \(n\) e sia \(f\) un endomorfismo di \(V\). Allora, \[P_f(f)=0\] cioè \[Q_f(t) \mid P_f(t).\]

Dimostrazione. Sia \(v \neq 0\), bisogna mostrare che \(P_f(f)(v)=0\). \[v=f^0(v), f(v), \dots, f^{k-1}(v)\] con \[f^k(v)=a_1f^{k-1}(v)+ \dots + a_kf^0(v)\] linearmente indipendenti. Si nomina \(v_1=v=f^0(v), v_2=f^1(v), \dots, v_k=f^{k-1}(v)\). Si completa \(v_1, \dots, v_k\) a una base \(\mathcal{B} \equiv (v_1, \dots, v_k, w_{k+1}, \dots, w_n)\) di \(V\).

\[P_f(t)=\det (M^\mathcal{B}_\mathcal{B}(f)-tI_n)=\det \left( \begin{array}{ccc|c|ccc} -t & 0 & 0 & -a_k & \ast &\ast & \ast \\ 1&\ddots &\vdots & \vdots & \ast & \ast & \ast\\ 0& \ddots & -t &-a_2 & \ast& \ast & \ast \\ \vdots& 0& 1 & -a_1-t & \ast & \ast & \ast \\ \hline 0 & 0 & 0 & 0 & & & \\ 0& 0 & 0 & 0 & &B-tI_{n-k} & \\ 0& 0 & 0 & 0 & & & \end{array} \right)=\]

\[=\det (A_q-tI_k) \det (B-tI_{n-k})=(-1)^kq(t) \det(B-I_{n-k})\]

Ove \(q(t)=t^k-a_1t^{k-1}- \dots - a_k\), ma \(q(f)(v)=0\), quindi \[P_f(f)(v)=0\] 0◻

Questo teorema non è solo una “pietra miliare” teorica: è anche uno strumento pratico. Permette infatti di esprimere potenze alte di matrici come combinazioni lineari delle potenze più basse, semplificando calcoli complessi.

Esercizio. Verificate il teorema di Cayley–Hamilton per la matrice \[B = \begin{pmatrix} 0 & 1 \\ -1 & 0 \end{pmatrix}.\] Calcolare \(P_B(t)\) e verificare che \(P_B(B) = 0\).
Soluzione. Per \(B\), il polinomio caratteristico è \(t^2+1\). Allora \[P_B(B) = B^2 + I = -I + I = 0.\] Quindi Cayley–Hamilton è verificato.

Il corso di Algebra Lineare può dirsi concluso.