Capitolo 1 – Lapalissiano

📘 Capitolo 1 — Dagli insiemi agli spazi

1.1 Insiemi e applicazioni

Fino ai tempi di Demetrio Falereo gli Ateniesi conservavano la nave su cui Teseo partì insieme coi giovani ostaggi e poi ritornò salvo, una trireme. Toglievano le parti vecchie del legname e le sostituivano con altre robuste, saldamente connettendole fra loro, in modo che essa serviva di esempio anche ai filosofi quando discutevano il problema della crescenza, sostenendo alcuni che era la stessa nave, altri che non era più la stessa.
— Plutarco, Vite

Intuitivamente, un insieme può esser considerato come uno scatolone, il quale può contenere oggetti, detti elementi dell'insieme, o essere vuoto. In notazione, un insieme è rappresentato dalla definizione $ X:= \{ a,b,... \} $, ove $ X $ indica il nome dell'insieme e $ a,b,... $ indicano gli elementi in esso contenuti. L'insieme vuoto viene indicato convenzionalmente con $ X \equiv \emptyset $.

Problema: Rappresentare, in notazione, l'insieme $ \Phi $ costituito dagli anagrammi di SIA.
Soluzione: $ \Phi = \{ SIA, AIS, ASI, ISA, IAS, SAI \} $

Una verità autoevidente considerata come assioma nella Teoria degli Insiemi, è il principio di estensione.

Principio di estensione: Un insieme è caratterizzato dagli elementi che gli appartengono. Se $ X, Y $ sono definiti come insiemi, allora $ X \equiv Y $ se e solo se $ X $ possiede gli stessi elementi di $ Y $.

Il principio di estensione si chiama così perché stabilisce che un insieme è definito dalla sua estensione, cioè dai suoi elementi. Il termine "estensione" fa riferimento proprio all'insieme degli oggetti che compongono l'insieme stesso. Ad esempio, l'insieme $ A=\{Fichte, Hegel , Schelling\} $, ha come estensione$ \{Fichte, Hegel , Schelling\} $.

Il termine "estensione" proviene dal latino extensio, derivato dal verbo extendere, il quale significa "estendere", esso indica l'atto di "allungare" o "espandere" in una determinata direzione.
• Redigere una breve argomentazione che giustifichi l'utilizzo della terminologia adottata nel contesto del principio di estensione.
• Individuare in rete alcuni utilizzi del termine estensione in Matematica.

Esistono notazioni standard per alcuni di questi insiemi, se ne elencano le principali ai fini del corso:

Insiemi numerici:
$ \mathbb{N}:=\{1,2,3,4,...\} $ è l'insieme dei numeri naturali .
$ \mathbb{Z}:=\{...,-2,-1,0,1,2,...\} $ è l'insieme dei numeri interi, detti anche relativi.
$ \mathbb{Q} $ è l'insieme dei numeri razionali, un numero razionale è determinato da una coppia di interi $ p $ e $ q $, con $ q \neq 0 $. Il numero razionale $ \frac{p}{q} $ è equivalente a $ \frac{p_1}{q_1} $ se e solo se $ p q_1 = p_1 q $, con $ q_1 \neq 0 $.
$ \mathbb{R} $ è l'insieme dei numeri reali, la costruzione dei numeri reali non è elementare, per il corso viene data per acquisita. Un numero reale è individuato da un decimale infinito, per esempio $ 1, 01001000100001\ldots $, $ 2, 39999\ldots $ o $ 3, 121314151\ldots $ (Attenzione ai numeri periodci: $ 2, 3\dot{9}$ è uguale a $ 2, 4 $).

Nota. Con $ \mathbb{N}_0 $ si indicherà l'insieme dei numeri naturali con $ 0 $ incluso.

Problema. Dato $ a \in \mathbb{Z} $, definire l'insieme dei multipli di $ a $.
Soluzione. $ \langle a \rangle := \{ x \in \mathbb{Z} \mid x = n a, n \in \mathbb{Z} \} $
Si tenga a mente la notazione $ \langle \ \ \rangle $, verrà utilizzata di frequente durante il corso.

Per maggiori informazioni sulla costruzione degli insiemi numerici, fare riferimento alla dispensa Numeri.

Nel contesto del continuum reale, ovvero sull'insieme $ \mathbb{R} $, è possibile definire dei sottoinsiemi detti intervalli, che rappresentano insiemi di numeri compresi tra due estremi (eventualmente infiniti).

Intervalli limitati: (con estremi $ a, b \in \mathbb{R} $ e $ a \leq b $):

intervallo chiuso: $[a,b] := \{ x \in \mathbb{R} \mid a \le x \le b \} $

intervallo aperto: $(a,b) := \{ x \in \mathbb{R} \mid a < x < b \} $

intervallo chiuso a sinistra, aperto a destra: $[a,b) := \{ x \in \mathbb{R} \mid a \le x < b \} $

intervallo aperto a sinistra, chiuso a destra: $(a,b] := \{ x \in \mathbb{R} \mid a < x \le b \} $

Intervalli illimitati: (con uno degli estremi infinito):

\[ [a,+\infty) := \{ x \in \mathbb{R} \mid a \leq x \}, \quad (a,+\infty) := \{ x \in \mathbb{R} \mid a < x \} \]

\[ (-\infty,a] := \{ x \in \mathbb{R} \mid x \leq a \}, \quad (-\infty,a) := \{ x \in \mathbb{R} \mid x < a \} \]

IMMAGINE

Questi insiemi sono fondamentali in analisi matematica, teoria della misura, topologia e in molte altre branche della matematica.

Si enunciano alcune definizioni dedotte dagli elementi di Logica già visti.

Un insieme $ X $ è contenuto nell'insieme $ Y $ (equivalentemente, $ X $ è un sottoinsieme di $ Y $) se ogni elemento di $ X $ è anche elemento di $ Y $, cioè per ogni $ x \in X $ vale $ x \in Y $; in simboli, $ X \subseteq Y $ (o anche $ Y \supseteq X $). La notazione $ X \subset Y $ (o $ Y \supset X $) significa che $ X $ non è contenuto in $ Y $, cioè che esiste $ x \in X $ tale che $ x \notin Y $.

IMMAGINE

Esempio: Siccome un multiplo di 6 è anche un multiplo di 3, abbiamo $ \langle 6 \rangle \subset \langle 3 \rangle $. D’altra parte, $ 3 \in \langle 3 \rangle $ ma $ 3 \notin \langle 6 \rangle $, e quindi $ \langle 3 \rangle \subsetneq \langle 6 \rangle $..

Osservazione. Siano $ X, Y $ insiemi. Per il principio di estensione, $ X = Y $ se e solo se $ X \subseteq Y $ e $ Y \subseteq X $. L’osservazione fatta è banale, ma è utile tenerne conto quando si vuole decidere se due insiemi sono uguali: grazie all’osservazione data, si tratta di decidere se $ X \subseteq Y $ e $ Y \subseteq X $.
Dati gli insiemi $ X, Y $, si possono produrre altri insiemi a partire da $ X $ e $ Y $.

L’ unione di $X$ e $Y$ è l’insieme i cui elementi sono gli $x$ tali che $x \in X$ o $x \in Y$. (Attenzione: $x$ può appartenere sia a $X$ che a $Y$.) L’unione di $X$ e $Y$ si denota $X \cup Y$.

IMMAGINE

L’unione e l’intersezione hanno senso anche per una famiglia arbitraria di insiemi $X_i$ dove $i$ è un elemento arbitrario in un insieme di indici $I$.

L’unione $\bigcup_{i \in I} X_i$ è l’insieme i cui elementi sono gli $x$ tali che $x \in X_i$ per qualche $i \in I$, l’intersezione $\bigcap_{i \in I} X_i$ è l’insieme i cui elementi sono gli $x$ tali che $x \in X_i$ per tutti gli $i \in I$.

Esempio: $\bigcup_{i \in \mathbb{N}} \langle i \rangle = \mathbb{Z}, \quad \bigcap_{i \in \mathbb{N}} \langle i \rangle = \{ 0 \}.$

Siano $X, Y$ insiemi. L’ insieme differenza $X \setminus Y$ è \[X \setminus Y := \{ x \in X \mid x \notin Y \}.\]

IMMAGINE

Ad esempio, si ha che: \[\mathbb{Z} \setminus \langle 2 \rangle = \{ x \in \mathbb{Z} \mid x \text{ è dispari} \}, \quad X \setminus \emptyset = X, \quad \emptyset \setminus X = \emptyset.\]

Problema:
Dati gli insiemi $A=\{x | \text{x è una vocale della parola "unione"} \}$ e $B=\{x | \text{x è una vocale della parola "ragione"} \}$ rappresenta, per elencazione, gli insiemi $A \cap B$, $A \cup B$, $A \setminus B$.

Soluzione:
Si noti che $A\equiv \{ u, i, o, e\}$ e $B \equiv \{ a, i, o, e\}$. L’intersezione $A \cap B$ coincide con l’insieme delle vocali presenti in entrambi gli insiemi $A \cap B \equiv \{i,o,e\}$. L’unione $A \cup B$ coincide con l’insieme di tutte le vocali presenti in A e B, $A \cup B \equiv \{a,e,i,o,u\}$. La differenza $A \setminus B$ coincide con l’insieme di tutte le vocali presenti in A ma non in B, $A \setminus B \equiv \{u\}$.

Siano $X_1, \dots, X_n$ insiemi. Il prodotto cartesiano $X_1 \times \dots \times X_n$ è l’insieme i cui elementi sono le $n$-ple ordinate $(x_1, x_2, \dots, x_n)$ dove $x_i \in X_i$ per $i = 1, 2, \dots, n$. Se $X_1 = X_2 = \dots = X_n$, si denota $X_1 \times \dots \times X_n$ con $X^n$.

Un esempio $\mathbb{R}^n$ può essere l’insieme delle $n$-ple ordinate di numeri reali.

1.1.2 I diagrammi di Venn

Il diagramma di Venn costituisce una rappresentazione grafica delle relazioni logiche tra insiemi, la cui diffusione è attribuita a John Venn (1834–1923) negli anni Ottanta del XIX secolo. Esso rappresenta uno strumento fondamentale per l’insegnamento della teoria degli insiemi e trova applicazioni in ambiti quali probabilità, logica, statistica, linguistica e informatica.

Un diagramma di Venn è ottenuto tramite curve chiuse semplici (tipicamente cerchi o ellissi) tracciate su un piano. Ogni curva delimita una regione che rappresenta un insieme, mentre i punti interni alla curva corrispondono agli elementi dell’insieme stesso.

Ad esempio, l’intersezione di due insiemi $S$ e $T$, indicata con $S \cap T$, è rappresentata dalla zona di sovrapposizione delle rispettive curve.

IMMAGINE

Concetti simili erano stati introdotti già da Christian Weise (1712) e da Leonhard Euler (1768). Tuttavia, la formalizzazione e la diffusione sistematica di questi diagrammi si devono a Venn, che nella sua opera Symbolic Logic (1881) li presentò come strumento pedagogico in grado di descrivere graficamente tutte le relazioni logiche possibili tra un numero finito di insiemi.

La differenza rispetto ai diagrammi di Euler consiste nel fatto che questi ultimi raffigurano unicamente le relazioni effettivamente esistenti tra gli insiemi, mentre i diagrammi di Venn rappresentano tutte le possibili combinazioni, comprese quelle corrispondenti a insiemi vuoti.

Nella sua descrizione originaria, Venn definì tali rappresentazioni come cerchi euleriani, sviluppandole con l’intento di adattare i diagrammi di Euler alla logica booleana. Le origini concettuali di tali rappresentazioni possono essere ricondotte a Ramon Llull (XIII secolo) e Gottfried Wilhelm Leibniz (XVII secolo), ma la sistematizzazione di Venn resta la più influente. Il termine “diagramma di Venn” fu introdotto nel 1918 da Clarence Irving Lewis.

Nel corso del XX secolo furono sviluppati ulteriori risultati teorici, tra cui la costruzione di diagrammi con simmetria rotazionale per insiemi in numero primo, dimostrata da David Wilson Henderson e successivamente estesa da altri studiosi. L’impiego didattico dei diagrammi si intensificò con il movimento della new math degli anni Sessanta e si è consolidato fino a oggi, includendo applicazioni in discipline diverse dalla matematica, come la letteratura e la psicologia, grazie alla loro capacità di visualizzare in modo intuitivo relazioni complesse.

Dal punto di vista costruttivo, un diagramma di Venn è formato da curve che suddividono il piano in regioni distinte, ciascuna corrispondente a una combinazione di appartenenza o esclusione rispetto agli insiemi considerati. Questa caratteristica garantisce la rappresentazione di tutte le possibilità logiche, a differenza dei diagrammi di Euler. Tale proprietà conferisce ai diagrammi di Venn un ruolo di rilievo nella comprensione di operazioni insiemistiche quali unione, intersezione e complemento, oltre che nell’analisi logica e combinatoria.

IMMAGINE

Si noti che nei diagrammi appena illustrati che con $U$ si intende l’insieme universo, un insieme che contiene tutti gli insiemi, e che con $X'$ si intende il complementare di $X$, ossia $X'=X^C=\overline{X}$.

Sia $U$ un insieme universo e $A \subseteq U$. L’insieme complementare di $A$ rispetto a $U$ è definito come \[A^{C} = \{ x \in U \mid x \notin A \}.\]

Problema:
Per l’insieme $A$, determinare il complementare rispetto ad $U$.

$U=\{ x \in \mathbb{Z} : |x| \text{ è pari}\}$

$A=\{x : x=2n , n \in \mathbb{N}\}$
Soluzione:
Il complementare di un insieme è costituito da tutti gli elementi non contenuti nell’insieme. Intuitivamente, si può immaginare una cassa di mele: il complementare dell’insieme mele è rappresentato dalla cassa.
Nel caso in questione, il concetto di complementare è relativo ad un insieme di riferimento. Si osserva che l’insieme $A$ è contenuto in $U$, in simboli $A \subseteq U$, il complementare di $A$ è dunque descritto da $\overline{A}=U \setminus A$, ove il simbolo $\setminus$ può esser inteso come analogo all’operatore di sottrazione. Per tornare all’esempio, si consideri l’analogia con il termine "Non-mele", il quale può essere scritto come "Cassa-piena" meno "Mele", ovvero $\text{Non mele} = \text{Cassa piena} - \text{Mele}$. In tal modo, il complemento dell’insieme delle mele è rappresentato da tutto ciò di rimanente nella cassa dopo aver sottratto le mele stesse.

Fissati i concetti, è ora possibile affrontare il quesito.
L’insieme $A$ contiene sequenze di numeri pari, dacchè qualsiasi numero naturale raddoppiato è pari per definizione.
L’insieme $U$ rappresenta tutti i numeri relativi $\mathbb{Z}$) il cui modulo è pari.
L’insieme $\overline{A}$ è dunque costituito dai soli numeri pari con segno negativo $(...,-8,-6,...,-2)$ visto che l’insieme $A$ contiene solamente i pari positivi $(1,2,3,...)$ per naturalità di $n$.
$\overline{A}= \text{numeri relativi pari} \ - \text{numeri positivi pari} =\{x: x=-2n, n \in \mathbb{N}\}$.

La differenza tra i diagrammi di Venn e di Euler può essere visualizzata come segue.

IMMAGINE

Il movimento della New Math (o "nuova matematica") diede inizio a un’importante riforma dell’insegnamento della matematica, nata negli Stati Uniti alla fine degli anni ’50 e diffusasi in molti altri paesi, inclusa l’Italia, durante gli anni ’60 e ’70. Fu una risposta culturale e scientifica al bisogno di rinnovare la didattica della matematica in un’epoca di rapida evoluzione tecnologica, in particolare dopo il lancio dello Sputnik da parte dell’Unione Sovietica nel 1957.

$\cdot$ Svolgere una breve ricerca sull’argomento.

1.1.3 Le applicazioni

Diagramma insiemistico

Piano cartesiano

Un’ applicazione (o funzione) da $X$ a $Y$ è una legge $f$ che associa a ogni $x \in X$ uno e un solo $y \in Y$ che si denota con $f(x)$, in simboli, $f : X \to Y$ o $X \xrightarrow{f} Y$.

L’insieme $X$ è il dominio dell’applicazione $f$ e l’insieme $Y$ è il suo codominio.

Esempio di applicazione: $f: \mathbb{N} \to \mathbb{N}$ con $n \mapsto n+1$, ossia $f(n)=n+1$.

Due applicazioni $f_1 : X_1 \to Y_1$ e $f_2 : X_2 \to Y_2$ sono uguali se e solo se

$X_1 = X_2$,
$Y_1 = Y_2$,
per ogni $x \in X_1 = X_2$ si ha che $f_1(x) = f_2(x)$.

Esempio: Siano $f: \mathbb{N} \to \mathbb{N}$ con $n \mapsto n+1$ e $g: \mathbb{Z} \to \mathbb{Z}$ con $n \mapsto n+1$. Allora $f \neq g$ per la proposizione precedente.

Esercizio: Perchè $f(n)=n-1$ con $f: \mathbb{N}_0 \to \mathbb{N}_0$ è mal definita? Come può essere corretta?
Esercizio: Correggere la Figura 3.

Sia $X$ un insieme. L’applicazione identità da $X$ a $X$ è l’applicazione $Id_x: X \to X$ tale che $x \mapsto x$, ossia $Id_X(x)=x \ \ \ \forall x \in X$ . Alcune volte è indicata con $1_X$ o $I_X$.

Una applicazione $f: X \to X$ si dice costante se $f(x_1)=f(x_2) \ \ \forall x_1, x_2 \in X$.

Si supponga che $f : X \to Y$ e $g : Y \to Z$ siano applicazioni, si noti che il codominio di $f$ è il dominio di $g$. Allora è possibile definire un’applicazione da $X$ a $Z$ associando a $x \in X$ l’elemento $g(f(x))$ di $Z$: questa è la composizione di $f$ e $g$, che si denota $g \circ f$. Si deve porre molta attenzione all’ordine dato che in generale $f \circ g$ non avrà senso perché $X$ non sarà uguale a $Z$). In notazione si può scrivere $(g \circ f )(x) := g(f(x))$. Tramite diagramma a frecce può essere rappresentata come segue:

IMMAGINE

Si noti che se $f : X \to Y$ si ha: \[f \circ 1_X = 1_Y \circ f = f.\] Ciò giustifica la notazione $1_X$ per l’applicazione identità: se si pensa alla composizione di applicazioni come analogo della moltiplicazione tra numeri, si nota che l’applicazione identità ha proprietà analoghe a quelle del numero 1.

Si supponga che $f : X \to Y$, $g : Y \to W$ e $h : W \to Z$ siano applicazioni: hanno senso sia $(h \circ g) \circ f$ che $h \circ (g \circ f)$, e sono entrambe applicazioni da $X$ a $Z$. Si ha che: \[(h \circ g) \circ f(x) = h(g(f(x))) = (h \circ (g \circ f))(x),\] e quindi la composizione di applicazioni gode della proprietà di associatività: \[(h \circ g) \circ f = h \circ (g \circ f).\]

IMMAGINE

Sia $f : X \to Y$ un’applicazione. Siano $A \subseteq X$ e $B \subseteq Y$. Si definiscono i sottoinsiemi $f(A) \subseteq Y$ (l’immagine di $A$) e $f^{-1}(B) \subseteq X$ (la controimmagine di $B$) come segue: \[f(A) := \{ y_0 \in Y \mid \exists x_0 \in X \text{ tale che } f(x_0) = y_0 \},\] \[f^{-1}(B) := \{ x_0 \in X \mid f(x_0) \in B \}. \ \] La controimmagine è anche detta preimmagine.

Se $ B = \{ y_0 \} $, cioè è un insieme con un solo elemento, singleton o singoletto, si denota $ f^{-1}(\{ y_0 \}) $ con $ f^{-1}(y_0) $.

Esempio: se $f : \mathbb{R} \to \mathbb{R}$ è l’applicazione quadrato, cioè $f(x) = x^2$, allora \[f([1, 2]) = [1, 4], \quad f^{-1}([1, 4]) = [-2, -1] \cup [1, 2],\] e l’immagine di $f$ è l’insieme dei reali non negativi.

Un’applicazione $f:X \to Y$ si dice:
iniettiva se $\forall x_1, x_2 \in X \ \ f(x_1)=f(x_2) \implies x_1=x_2$;
suriettiva se $Im(f)=f$, ossia se $\forall y \in Y \ \exists x \in X : f(x)=y$;
biettiva (biunivoca, bijettiva) se è sia iniettiva che suriettiva.

Una applicazione biunivoca è invertibile dato che ad ogni elemento del dominio corrisponde un elemento del codominio e viceversa.

Se $f: X \to Y$ è biunivoca, $\exists ! f^{-1}: Y \to X$ tale che $f^{-1} \circ f= Id=f\circ f^{-1}$ \[\begin{tikzcd}[column sep=large] X \arrow[r, shift left=1.2ex, "f"] & Y \arrow[l, shift left=1.2ex, "f^{-1}"] \end{tikzcd}\]

Esempio (1): Sia $f: \mathbb{N}_0 \to \mathbb{N}_0$ con $x \mapsto x+1$, allora $f$ è iniettiva ma non suriettiva dato che $0$ non ha controimmagine. Se invece si avesse con la medesima legge $f: \mathbb{N}_0 \to \mathbb{N}$, sarebbe anche suriettiva e la sua inversa sarebbe $f^{-1}: \mathbb{N} \to \mathbb{N}_0$ con $y \mapsto y-1$.
Esempio (2): Sia $g: \mathbb{R} \to \mathbb{R}$ con $x \mapsto x+1$, allora $f$ non è nè iniettiva nè suriettiva. Se $g: \mathbb{R}_0^+ \to \mathbb{R}$, allora $g$ è iniettiva. Se $g: \mathbb{R} \to \mathbb{R}_0^+$, allora $g$ è suriettiva. Se $g: \mathbb{R}_0^+ \to \mathbb{R}_0^+$, allora è biettiva ed esiste l’inversa $g^{-1}: \mathbb{R}_0^+ \to \mathbb{R}_0^+$ con $y \mapsto \sqrt{y}$.

Teorema di Schröder-Bernstein. Siano $X$ e $Y$ insiemi tali che esistano applicazioni iniettive $f : X \to Y$ e $g : Y \to X$, ovvero $X \preceq Y$ e $Y \preceq X$. Allora $X \sim Y$, cioè esiste una biiezione tra $X$ e $Y$.

Dati due insiemi $X$ e $Y$, si denota con $Y^X$ l’insieme delle applicazioni $f : X \to Y$, si noti l’inversione nella notazione esponenziale:

\[Y^X := \{ f : X \to Y \}.\]

Data un’applicazione $f : X \to Y$, il grafico di $f$ è il sottoinsieme $\Gamma_f \subseteq X \times Y$ i cui elementi sono le coppie $(x, f(x))$, per ogni $x \in X$.
Si osservi che se $X = Y = \mathbb{R}$ e si associa a ciascuna coppia $(x, y) \in \mathbb{R}^2$ il punto del piano cartesiano con coordinate $(x, y)$, allora il grafico così definito coincide con il grafico sul solito piano cartesiano.
In generale, il grafico $\Gamma_f \subseteq X \times Y$ di una funzione $f : X \to Y$ gode della seguente proprietà: per ogni $x \in X$, esiste un unico elemento in $\Gamma_f$ la cui prima componente è $x$, ovvero esiste un’unica coppia della forma $(x, \_)$ in $\Gamma_f$.
Osservazione. È possibile fornire una definizione formalmente precisa di applicazione $f : X \to Y$ evitando il riferimento alla nozione intuitiva di "legge che associa...": si definisce un’applicazione come un sottoinsieme $\Gamma \subseteq X \times Y$ che soddisfa la proprietà sopra descritta.
Esempio visivo: Grafico della funzione $f(x) = x^2$ con dominio e codominio in $\mathbb{R}$.

IMMAGINE

Ogni punto del grafico rappresenta una coppia $(x, f(x)) \in \Gamma_f \subseteq \mathbb{R} \times \mathbb{R}$. Ad esempio, il punto $(1,1)$ appartiene al grafico perché $f(1) = 1$, così come $(-2,4)$ perché $f(-2) = 4$.

1.1.4 Le relazioni

Intuitivamente, una relazione è un modo per collegare elementi di due insiemi diversi: si immagini di avere due gruppi di oggetti e una regola che indica quali oggetti di un gruppo vengono associati a quali oggetti dell’altro. Ad esempio, essa può riferire quali numeri sono più grandi di altri, oppure quali numeri si abbinano con i loro doppi. Queste relazioni aiutano a comprendere come gli oggetti sono connessi tra loro.

Una relazione $\mathcal{R}$ tra gli elementi di un insieme $X$ è un sottoinsieme $\mathcal{R} \subset X \times X$.
Dati $x,y \in X$, essi si dicono in relazione $x\mathcal{R}y$, se $(x,y) \in \mathcal{R}$, ove $(x,y)$ è una coppia ordinata.

Esempio. Sia $X$ un insieme finito e si definisca $\mathcal{P}(X):=\{A: A \subset X\}$ insieme delle parti di $X$. Si hanno le seguenti relazioni binarie:
$\cdot$ relazione di inclusione: per ogni $A,B \in \mathcal{P}(X)$, $A \mathcal{R} B$ se $A \subseteq B$;
$\cdot$ relazione di equipotenza: per ogni $A,B \in \mathcal{P}(X)$, $A \sim B$ se $\# (A)=\#(B)$.
$\cdot$relazione di divisione (in $\mathbb{N}$): $n | m$, si legge n divide m, se per definizione $n$ è un divisore di $m$.
Esistono due tipologie di relazione particolarmente importanti, quelle di ordine e di equivalenza.

Una relazione tra gli elementi di un insieme $X$ si dice relazione d’ordine (parziale) se valgono le seguenti proprietà:
riflessiva: $\forall x \in X \ \ x \mathcal{R}x$;
antisimmetrica: $\forall x, y \in X \ \ x \mathcal{R}y \ \ \wedge \ \ y\mathcal{R}x \implies x=y$;
transitiva: $\forall x,y, z \in X \ \ x \mathcal{R} y \ \ \wedge \ \ y \mathcal{R}z \implies x \mathcal{R}z$.

Esempio. Sia $X$ un insieme e sia $\mathcal{P}(X)$ l’insieme delle parti di $X$, cioè l’insieme dei suoi sottoinsiemi. Sia $R \subseteq \mathcal{P}(X) \times \mathcal{P}(X)$ il sottoinsieme delle coppie $(A, B)$ tali che $A \subseteq B$. La relazione $\mathcal{R}$ è detta relazione d’inclusione, e invece di scrivere $A \, \mathcal{R} \, B$, si usa direttamente $A \subseteq B$.
Una relazione d’ordine si dice totale se, oltre le precedenti proprietà, per ogni $x,y \in X \ \ x \mathcal{R} y \ \ \vee \ \ y \mathcal{R} x$.
Esempio. Sia $R \subseteq \mathbb{R} \times \mathbb{R}$ il sottoinsieme delle coppie $(x, y)$ tali che $x - y \geq 0$. La relazione $R$ rappresenta la relazione “essere non più piccolo” e, invece di scrivere $x \, R \, y$, si preferisce la notazione usuale $x \geq y$.
Quindi una relazione d’ordine totale implica che ogni coppia di elementi in un insieme possa essere confrontata, mentre una relazione d’ordine parziale consente che alcuni elementi non siano confrontabili tra loro. In altre parole, in un ordine totale, per ogni due elementi $a$ e $b$ nell’insieme, o $a$ è correlato a $b$, o $b$ è correlato ad $a$ (o entrambi). In un ordine parziale, invece, potrebbero esserci coppie di elementi per le quali nessuna delle due relazioni vale.

Ordine totale: Si immagini di avere dei numeri, come 3, 5 e 7. È sempre possibile comprendere quale numero è più piccolo o più grande rispetto a un altro (ad esempio $3 < 5$, $5 < 7$, ecc.). Qui, ogni coppia di numeri è confrontabile, quindi si tratta di un ordine totale.

Ordine parziale: Si immagini di avere delle forme: un cerchio, un quadrato e un triangolo. Si può affermare che un cerchio è più “rotondo” di un quadrato, ma non è possibile, con questo criterio, confrontare adeguatamente un quadrato con un triangolo. Qui, alcune coppie non si possono confrontare, quindi si tratta di un ordine parziale.

IMMAGINE

Una relazione $\mathcal{R}$ tra gli elementi di un insieme $X$ si dice di equivalenza se valgono le seguenti proprietà:
riflessiva: $\forall x \in X \ \ x \mathcal{R}x$;
simmetria: $\forall x,y \in X \ \ x \mathcal{R}y \implies y \mathcal{R}x$;
transitiva: $\forall x,y, z \in X \ \ x \mathcal{R} y \ \ \wedge \ \ y \mathcal{R}z \implies x \mathcal{R}z$.

Spesso una relazione di equivalenza su un insieme $X$ si denota con il simbolo “$\sim$”, ovvero si scrive $x_1 \sim x_2$ invece di $x_1 \, R \, x_2$. A partire da una relazione di equivalenza $\sim$ è possibile costruire un nuovo insieme i cui elementi sono sottoinsiemi di $X$, detti classi di equivalenza.

Dato un elemento $x_0 \in X$, la classe di equivalenza di $x_0$ rispetto alla relazione $\sim$ è definita come: \[[x_0] := \{ x \in X \mid x \sim x_0 \}.\]

Quando non ci sono possibilità di ambiguità, si parla semplicemente della classe di equivalenza di $x_0$, omettendo il riferimento esplicito alla relazione $\sim$. In alternativa, la classe può essere indicata anche con lo stesso simbolo $x_0$, se il contesto lo consente. L’elemento $x_0$ è detto un rappresentante della classe $[x_0]$.

Intuitivamente, è possibile pensare alle classi di equivalenza come a dei divisori all’interno di una scatola, i quali separano gli oggetti in base a una determinata caratteristica. Ciascuna sezione della scatola rappresenta quindi una classe distinta di oggetti e viene considerata come un unico insieme. Ad esempio, se i divisori vengono costruiti in base al colore degli oggetti, non importa la tipologia di oggetto pescata, ma solamente il colore: un triangolo rosso è dunque uguale a un cerchio rosso secondo questa divisione.

IMMAGINE

Esempio. Si considera l’insieme $\mathbb{Z}$ e la relazione di congruenza modulo 2. In questo caso, due interi $x$ e $y$ sono equivalenti se $x \equiv y \pmod{2}$, ovvero se hanno lo stesso resto nella divisione per 2. Esistono esattamente due classi di equivalenza:

la classe degli interi pari: $[0] = \{ x \in \mathbb{Z} \mid x \equiv 0 \pmod{2} \}$,
la classe degli interi dispari: $[1] = \{ x \in \mathbb{Z} \mid x \equiv 1 \pmod{2} \}$.

Alcuni esempi significativi sono i seguenti:

Uguaglianza. La relazione di uguaglianza $=$ è una relazione di equivalenza definita su qualsiasi insieme $X$, poiché ogni elemento è uguale a se stesso (riflessività), se $x = y$ allora $y = x$ (simmetria), e se $x = y$ e $y = z$, allora $x = z$ (transitività).
Equipotenza. Sia $\mathcal{P}(X)$ l’insieme delle parti di un insieme $X$. Si dice che due sottoinsiemi $A, B \in \mathcal{P}(X)$ sono equipotenti se esiste una biiezione $f: A \to B$. La relazione di equipotenza $A \sim B$ è una relazione di equivalenza su $\mathcal{P}(X)$, poiché:
- ogni insieme è biiettivo con se stesso (identità);
- se $A \sim B$, allora $B \sim A$ (inversa della biiezione);
- la composizione di due biiezioni è una biiezione (transitività).

Osservazione. Le classi di equivalenza formano una partizione dell’insieme.

Sia $X$ un insieme. Una partizione di $X$ è una famiglia $\{X_i\}_{i \in I}$ di sottoinsiemi di $X$ tale che:

$\bigcup_{i \in I} X_i = X$,
se $i_1 \neq i_2 \in I$, allora $X_{i_1} \cap X_{i_2} = \emptyset$.

Problema: Dato $n \in \mathbb{Z}$, sia $\mathcal{R}\subset \mathbb{Z} \times \mathbb{Z}$ il sottoinsieme delle coppie ordinate $(x,y)$ tali che $x-y \in \left\langle n \right\rangle$, ossia $(x-y)$ è multiplo di $n$. Quale proprietà NON vale? \[\text{A. riflessiva} \quad \text{B. antisimmetrica} \quad \text{C. transitiva}\] Soluzione: B. La relazione definita da: \[(x, y) \in \mathcal{R} \iff x \equiv y \pmod{n}\] è la ben nota congruenza modulo $n$.

Riflessiva: per ogni $x \in \mathbb{Z}$, si ha $x - x = 0 \in \langle n \rangle$, dunque $x \mathcal{R} x$.
La proprietà riflessiva vale.
Transitiva: se $x \mathcal{R} y$ e $y \mathcal{R} z$, cioè $x \equiv y \pmod{n}$ e $y \equiv z \pmod{n}$, allora $x \equiv z \pmod{n}$.
La proprietà transitiva vale.
Antisimmetrica: la relazione $\mathcal{R}$ non è antisimmetrica.
Infatti, ad esempio: \[2 \equiv 5 \pmod{3} \quad \text{e} \quad 5 \equiv 2 \pmod{3}, \quad \text{ma} \quad 2 \ne 5.\] Quindi $2 \mathcal{R} 5$ e $5 \mathcal{R} 2$, ma $2 \ne 5$.
La proprietà antisimmetrica non vale.

Un fatto importante sulle relazioni è che tramite esse è possibile costruire rappresentazioni concrete di certi ambienti; ad esempio il grafico sottostante rappresenta nel piano cartesiano la relazione $R \subseteq \mathbb{R}^2$ definita come $R = \{ (x,y) \in \mathbb{R}^2 \mid x^{2} + 2x y^{3} = 3 \}.$

IMMAGINE

Questa relazione rappresenta l’insieme dei punti $(x,y)$ che soddisfano l’equazione implicita data.
Si lasciano le riflessioni al lettore, ma anche ciò è la rappresentazione di una certa relazione:

1.1.5 Passaggio al quoziente

Il passaggio al quoziente è come un processo di astrazione, ove si prendono gli elementi originali di un certo insieme e li si raggruppano in delle classi di equivalenza. Successivamente, si considera ogni classe di equivalenza come un singolo elemento di un insieme detto quoziente.

Data $\mathcal{R}$ una relazione di equivalenza per gli elementi di un insieme $X$. Per ogni $x \in X$, si dice classe di equivalenza l’oggetto $[x]_\mathcal{R}:=\{y \in X: y \mathcal{R}x \} \subset X$.
L’insieme quoziente di $X$ rispetto a $\mathcal{R}$ è definito come \[X / \mathcal{R} := \{ [x]_{\mathcal{R}} : x \in X \} \subseteq \mathcal{P}(X),\] dove la classe di equivalenza di un elemento $x \in X$ è \[[x]_{\mathcal{R}} := \{ y \in X : x \mathcal{R} y \},\] e vale la seguente proprietà di uguaglianza delle classi: \[[x]_{\mathcal{R}} = [y]_{\mathcal{R}} \iff x \mathcal{R} y.\]

Partizione di un insieme

Le classi di equivalenza rispetto a $\mathcal{R}$ formano una partizione di $X$, ovvero valgono le seguenti proprietà: \[\bigcup_{x \in X} [x]_{\mathcal{R}} = X,\] e per ogni $x,y \in X$, \[[x]_{\mathcal{R}} \cap [y]_{\mathcal{R}} = \emptyset \quad \text{oppure} \quad [x]_{\mathcal{R}} = [y]_{\mathcal{R}}.\]

In particolare, \[[x]_{\mathcal{R}} \cap [y]_{\mathcal{R}} \neq \emptyset \implies [x]_{\mathcal{R}} = [y]_{\mathcal{R}}.\]

Data un’applicazione tra insiemi \[f : X \longrightarrow Y,\] è possibile definire su $X$ una relazione di equivalenza $\sim$, ponendo: \[x \sim y \quad \Leftrightarrow \quad f(x) = f(y).\] Questa relazione permette di raggruppare gli elementi di $X$ che vengono mandati nello stesso elemento di $Y$ tramite $f$.

Per ogni $x \in X$, la classe di equivalenza associata è data da: \[[x]_\sim = \{ x' \in X \mid f(x') = f(x) \} = f^{-1}(f(x)),\] ossia l’intera fibra di $f$ sopra $f(x)$.

IMMAGINE

In simboli, questo si esprime tramite il seguente diagramma:

IMMAGINE

Inoltre, l’applicazione $f$ può essere fattorizzata nel seguente modo: \[f: X \xrightarrow{f_0} X / \sim \xrightarrow{f_1} \operatorname{Im}(f) \xrightarrow{\iota} Y,\] dove:

$f_0 : x \mapsto [x]_\sim$ è l’applicazione quoziente (suriettiva),
$f_1 : [x]_\sim \mapsto f(x)$ è biunivoca (ben definita, poiché $f$ è costante su ogni classe),
$\iota : \operatorname{Im}(f) \hookrightarrow Y$ è l’inclusione canonica (iniettiva).

Siano $X$ un insieme e $A \subseteq X$ un sottoinsieme. L’inclusione $\iota: A \hookrightarrow X$ è l’applicazione \[\iota : A \longrightarrow X, \quad a \mapsto a.\]

Esempio: Sia $f : X \to Y$ un’applicazione. Si può scrivere $f$ come composizione di un’applicazione suriettiva e di una iniettiva come segue. Sia $Z := f(X)$, e sia $h : X \to Z$ definita da \[h : X \longrightarrow Z, \quad x \mapsto f(x).\] Quindi, $h$ è sostanzialmente la funzione $f$, ma il codominio è stato ristretto. Sia $\iota : Z \hookrightarrow Y$ l’inclusione. L’applicazione $h$ è suriettiva, mentre $\iota$ è iniettiva, e si ha: \[f = \iota \circ h.\]

Questa decomposizione mostra chiaramente come ogni funzione possa essere vista come la composizione di:

un passaggio a classi di equivalenza (raggruppamento degli elementi con stessa immagine),
una corrispondenza biunivoca tra classi e immagini,
un’immersione nell’insieme codominio.

In questo modo, l’applicazione $f$ induce una struttura naturale di partizione su $X$, rendendo esplicita la corrispondenza tra elementi indistinguibili da $f$.

Esempio: Sia $n \in \mathbb{Z} \setminus \{0\}$. Si consideri su $\mathbb{Z}$ la seguente relazione: $\forall k,l \in \mathbb{Z} \ \ k \equiv l \ \ \mod n$ se per definizione $n | k-1$
Problema: Verificare che la relazione proposta è ddi equivalenza.
Soluzione: Per verificare che la relazione $\equiv \pmod{n}$ sia una relazione di equivalenza, bisogna dimostrare che essa soddisfa le tre proprietà fondamentali di una relazione di equivalenza: riflessività , simmetria e transitività .

1. Riflessività: Per ogni $k \in \mathbb{Z}$, si deve verificare che $k \equiv k \pmod{n}$. Infatti, $k - k = 0$, e poiché $n$ divide $0$, si ha $n \mid (k - k)$. Quindi $k \equiv k \pmod{n}$, e la relazione è riflessiva.

2. Simmetria: Per ogni $k, l \in \mathbb{Z}$, se $k \equiv l \pmod{n}$, allora si deve verificare che $l \equiv k \pmod{n}$. Si suppone che $n \mid (k - l)$. Questo significa che esiste un intero $m$ tale che $k - l = n \cdot m$. Allora, $l - k = -n \cdot m$, e poiché $n$ divide $-n \cdot m$, si ha $n \mid (l - k)$. Quindi $l \equiv k \pmod{n}$, e la relazione è simmetrica.

3. Transitività: Per ogni $k, l, m \in \mathbb{Z}$, se $k \equiv l \pmod{n}$ e $l \equiv m \pmod{n}$, si deve verificare che $k \equiv m \pmod{n}$. Si suppone che $n \mid (k - l)$ e $n \mid (l - m)$. Allora esistono interi $p$ e $q$ tali che $k - l = n \cdot p$ e $l - m = n \cdot q$. Si sommano le due equazioni: \[(k - l) + (l - m) = n \cdot p + n \cdot q \quad \Rightarrow \quad k - m = n \cdot (p + q).\] Poiché $n$ divide $k - m$, si ha $k \equiv m \pmod{n}$. Quindi la relazione è transitiva.

Poiché la relazione soddisfa le proprietà di riflessività, simmetria e transitività, possiamo concludere che $\equiv \pmod{n}$ è una relazione di equivalenza su $\mathbb{Z}$.

Si supponga $m > 0$. Allora, per ogni $k \in \mathbb{Z}$, la classe di equivalenza di $k$ modulo $m$ è data da \[[k]_m = \{ k + qm \mid q \in \mathbb{Z} \}.\]

Questo è l’insieme di tutti gli interi che sono congruenti a $k$ modulo $m$.

Esempio. Sia $m = 4$, $k = 1$.

Allora: \[[1]_4 = \{ 1 + 4q \mid q \in \mathbb{Z} \} = \{ \ldots, -7, -3, 1, 5, 9, \ldots \}\]

Tutti questi numeri sono congruenti tra loro modulo 4: se li dividi per 4, il resto è sempre 1.

Inoltre, il quoziente $\mathbb{Z}/m$ è l’insieme delle classi di equivalenza modulo $m$, cioè: \[\mathbb{Z}/m = \{ [k]_m \mid k \in \{0,1,...,m-1\} \}.\] Ogni elemento di $\mathbb{Z}/m$ rappresenta una classe di equivalenza di numeri interi congruenti tra loro modulo $m$.

Sia $f: X \to Y$ un’applicazione e $\mathcal{R}$ una relazione di equivalenza in $X$. Si dice che l’applicazione $f$ passa al quoziente se esiste una applicazione $\tilde{f}: X / \mathcal{R} \to Y$ tale che il diagramma seguente commuta:

IMMAGINE

dove $\pi: X \to X / \mathcal{R}$ è la proiezione canonica, definita da $\pi(x) = [x]_\mathcal{R}$ per ogni $x \in X$. In altre parole, $\tilde{f}$ è ben definita se e solo se, per ogni $x, y \in X$, $x \mathcal{R} y$ implica $f(x) = f(y)$, cioè $f$ è costante sulle classi di equivalenza definite dalla relazione $\mathcal{R}$.

In termini più semplici, l’applicazione $f$ "passa al quoziente" se la funzione $f$ induce un’applicazione ben definita tra il quoziente $X / \mathcal{R}$ e $Y$, preservando le classi di equivalenza.

Le operazioni somma e prodotto in $\mathbb{Z}, \mathbb{Q}, \mathbb{R}$ passano al quoziente. (da sistemare)

Dimostrazione. Sia $\mathcal{R}$ una relazione di equivalenza su un insieme $X$. Per dimostrare che le operazioni di somma e prodotto passano al quoziente in $\mathbb{Z}, \mathbb{Q}, \mathbb{R}$, dobbiamo verificare che esistano applicazioni ben definite tra le classi di equivalenza per ciascuna operazione. In altre parole, dobbiamo mostrare che se due elementi sono equivalenti rispetto alla relazione $\mathcal{R}$, allora le loro immagini sotto l’operazione (somma o prodotto) sono anch’esse equivalenti.

1. Caso della somma.

Si considera l’insieme $\mathbb{Z}$ (lo stesso ragionamento vale per $\mathbb{Q}$ e $\mathbb{R}$) e si suppone che $\mathcal{R}$ sia una relazione di equivalenza su $\mathbb{Z}$, ad esempio la congruenza modulo $n$, ovvero $x \sim y \iff x - y \in n\mathbb{Z}$.

Si vuole dimostrare che l’operazione di somma $+$ passa al quoziente. Cioè, se $x \sim x'$ e $y \sim y'$, allora $x + y \sim x' + y'$.

Si suppone che $x \sim x'$ e $y \sim y'$. Per definizione della relazione $\sim$, questo significa che: \[x - x' \in n\mathbb{Z} \quad \text{e} \quad y - y' \in n\mathbb{Z}.\] Su sommano le due equazioni: \[(x + y) - (x' + y') = (x - x') + (y - y') \in n\mathbb{Z}.\] Poiché la somma di due numeri divisibili per $n$ è anch’essa divisibile per $n$, si ha che $(x + y) - (x' + y') \in n\mathbb{Z}$. Pertanto, $x + y \sim x' + y'$, e l’operazione di somma passa al quoziente.

2. Caso del prodotto.

Si suppone che $\mathcal{R}$ sia sempre la congruenza modulo $n$ in $\mathbb{Z}$. Si vuole dimostrare che se $x \sim x'$ e $y \sim y'$, allora anche $x \cdot y \sim x' \cdot y'$.

Si suppone che $x \sim x'$ e $y \sim y'$, cioè: \[x - x' \in n\mathbb{Z} \quad \text{e} \quad y - y' \in n\mathbb{Z}.\] Si moltiplicano le due equazioni: \[x \cdot y - x' \cdot y' = (x - x') \cdot y + x' \cdot (y - y') \in n\mathbb{Z}.\] Poiché $(x - x') \cdot y \in n\mathbb{Z}$ e $x' \cdot (y - y') \in n\mathbb{Z}$ (perché $x'$ e $y - y'$ sono divisibili per $n$), la somma di questi due termini è anch’essa divisibile per $n$. Quindi, $x \cdot y - x' \cdot y' \in n\mathbb{Z}$, e quindi $x \cdot y \sim x' \cdot y'$. 0◻
Conclusa questa carrellata teorica su nozioni di algebra astratta, non richiesta per intero ai fini del corso, è possibile evidenziare i fatti più concreti dei quali si farà spesso uso: gli orologi. I seguenti esercizi illustrano alcune tecniche per risolvere gli esercizi assegnati.

Problema: Si consideri un orologio a $5$ indici numerati da $0$ a $4$ come in figura.

IMMAGINE

Che ore indicherà la lancetta $17:00$?
Soluzione: La relazione tra le ore in un orologio con 5 indici numerati da $0$ a $4$ può essere vista come una relazione di equivalenza sul gruppo delle ore. Ogni ora è equivalente a un indice modulo 5, perché il ciclo dell’orologio si ripete ogni 5 ore. In altre parole, è possibile usare la classe di equivalenza modulo 5 per rappresentare l’orario.

La relazione di equivalenza $\sim$ tra due ore $h_1$ e $h_2$ si definisce come segue: \[h_1 \sim h_2 \quad \text{se e solo se} \quad h_1 \equiv h_2 \mod 5.\] Questo significa che due ore sono equivalenti se la loro differenza è un multiplo di 5; oppure se è divisibile per 5 con resto 0.

Per determinare che ora sarà alle $17:00$, si deve calcolare: \[17 \mod 5.\] Dividendo $17$ per $5$, si ottiene: \[17 \div 5 = 3 \quad \text{con resto} \quad 17 - 3 \times 5 = 2.\] Quindi, $17 \equiv 2 \mod 5$.

Questo significa che alle $17:00$, la lancetta indicherà l’indice corrispondente a $2$, ossia il numero $2$ sull’orologio.

Nella vita quotidiana, quando si legge l’orologio analogico, la conversione avviene naturalmente: si sa che le ore 15:00 corrispondono alle ore 3:00 del pomeriggio.

Problema:
Risolvere la seguente equazione in $\frac{\mathbb{Z}}{27\mathbb{Z}}$

$x²+x+[2]_{27}=[0]_{27}$

Suggerimento: studiare prima l’equazione corrispondente in $\frac{\mathbb{Z}}{3\mathbb{Z}}$
Soluzione:
Prima di iniziare è utile ricordare che $\frac{\mathbb{Z}}{27\mathbb{Z}}:=\{0,1,2,...,26\}$, bisogna dunque immaginare un orologio che va da 1 a 27, ove $27\equiv 0$. Inoltre, in generale valgono le seguenti proprietà dell’aritmetica modulare: $[a][b]=[ab], [a]+[b]=[a+b]$.

Utilizzando il suggerimento offerto, si ha che: $x²+x+[2]_{3}=[0]_{3}$ .

Dato che $\frac{\mathbb{Z}}{3\mathbb{Z}}:=\{0,1,2\}$ , è possibile verificare manualmente quale elemento dell’insieme soddisfa l’equazione.

$[0]_{3}^2+[0]_3+[2]_{3}=[0]_{3} \implies [2]_3=[0]_3$ , ciò è falso, dunque 0 non è soluzione.

$[1]_{3}^2+[1]_3+[2]_{3}=[0]_{3} \implies [4]_3\equiv[1]_3=[0]_3$, ciò è falso, dunque 1 non è soluzione.

$[2]_{3}^2+[2]_3+[2]_{3}=[0]_{3} \implies [8]_3\equiv [2]_3=[0]_3$, ciò è falso, dunque 2 non è soluzione.

Ma d’altronde $27=3*3*3$, quindi non vi è soluzione neanche in $\frac{\mathbb{Z}}{27\mathbb{Z}}$ (Teorema di Hensel, non è parte del corso)

Problema:
In $\mathbb{Z}_7$ si calcoli per ogni elemento non nullo l’inverso rispetto al prodotto.
Soluzione:
Si vuole trovare, per ogni elemento non nullo $a \in \mathbb{Z}_7^* = \{1, 2, 3, 4, 5, 6\}$, l’inverso moltiplicativo $a^{-1}$, tale che:

\[a \cdot a^{-1} \equiv 1 \pmod{7}\]

$1 \cdot 1 = 1 \Rightarrow 1^{-1} \equiv 1 \mod 7$ $2 \cdot 4 = 8 \equiv 1 \mod 7 \Rightarrow 2^{-1} \equiv 4 \mod 7$ $3 \cdot 5 = 15 \equiv 1 \mod 7 \Rightarrow 3^{-1} \equiv 5 \mod 7$ $4 \cdot 2 = 8 \equiv 1 \mod 7 \Rightarrow 4^{-1} \equiv 2 \mod 7$ $5 \cdot 3 = 15 \equiv 1 \mod 7 \Rightarrow 5^{-1} \equiv 3 \mod 7$ $6 \cdot 6 = 36 \equiv 1 \mod 7 \Rightarrow 6^{-1} \equiv 6 \mod 7$

(Si ricordi che $^{-1}$ significa semplicemente inverso).

Dunque, l’inverso di 1 è 1, l’inverso di 2 è 4, l’inverso di 3 è 5, l’inverso di 4 è 2, l’inverso di 5 è 3 e l’inverso di 6 è 6.

Esercizio guidato. Si calcolino i seguenti valori \[33 \equiv ? \mod 16\] Il multiplo di $16$ più vicino a $33$ è $32$, dunque $?=33-32=1$

\[48 \equiv ? \mod 12\] Il multiplo di $...$ più vicino a $...$ è $...$, dunque $?=...-...=...$ \[123 \equiv ? \mod 11\] Il multiplo di $...$ più vicino a $...$ è $...$, dunque $?=...-...=...$ \[138780 \equiv ? \mod 10\] Il multiplo di $...$ più vicino a $...$ è $...$, dunque $?=...-...=...$ .

1.2 Lo spazio e i sistemi lineari

Roads? Where we’re going we don’t need roads!
— Dr. Emmett Brown, Back to the Future

Con questo capitolo si varcano le soglie dell’Algebra Lineare; prima di disquisire circa questa oscura branca della Matematica, è ancora necessaria qualche nozione preliminare: quella di spazio delle soluzioni di un sistema lineare.

1.2.1 Lo spazio vettoriale

Generalmente, in Matematica, con spazio si intende un insieme con qualche caratteristica particolare che lo dota di struttura, al momento, senza entrare nei dettagli, si offre una prima definizione intuitiva di spazio vettoriale reale.

Prima di dare una definizione di spazio vettoriale, è necessario comprendere cosa sia un vettore.

In matematica, qualsiasi ente può essere considerato tramite un vettore: un polinomio, una matrice, un aeroplano...

Per comprendere il motivo di ciò, è utile indagare l’origine etimologica del termine vettore: la parola vettore deriva dal latino vector, vectoris, che significa “colui che trasporta” o “trasportatore”. A sua volta, proviene dal verbo vehere, che significa “portare”, “trasportare”.

Un vettore è dunque un qualsiasi ente in grado di trasportare informazioni: in un vettore è possibile inserire le informazioni numeriche relative a una qualunque situazione, al fine di manipolarle matematicamente. Lo spazio vettoriale è il luogo in cui vivono questi vettori.

Un esempio di questa astrazione numerica di alcune caratteristiche tratte da un oggetto empirico avviene continuamente nei devices di tutti i giorni; si pensi, ad esempio, a quando si desidera modificare un’immagine ruotandola: l’immagine viene automaticamente suddivisa in piccoli puntini colorati, detti pixel. Il colore di ciascun pixel viene rappresentato numericamente all’interno delle celle di un tensore — che, per il momento, verrà considerato come una generalizzazione del concetto di vettore.

Questo tensore viene poi trasformato da un’applicazione, in questo caso la rotazione di $n$ gradi, operante in uno spazio tensoriale. Il nuovo tensore ottenuto tramite tale trasformazione viene infine riconvertito in un’immagine visibile.

Quindi, intuitivamente – per il corso – un vettore può essere considerato come una sequenza di scalari – numeri – ordinati.
Esempio. $(1,0,0)$ è un vettore di uno spazio vettoriale tridimensionale.
Esempio. $(a,b,c,d)$ è un vettore di uno spazio vettoriale quadridimensionale.
Esercizio. Rappresentare in un vettore, seguendo l’ordine indicato nell’immagine, la disposizione dei colori della seguente opera.

Piet Mondrian, Composizione II in Rosso, Blu e Giallo (1930).

(a) Si indichi il bianco con il numero 0, il rosso con il numero 1, il blu con il numero 2, il nero con il numero 3, il giallo con il numero 4.
(b) Si indichi il bianco con $\star$, il rosso con $\ast$, il blu con $\bowtie$, il nero con $\propto$, il giallo con "Van Gogh".
Compreso il concetto di questo potente strumento, é possibile dare un’occhiata al mondo, con le proprie leggi fisiche, in cui essi vivono e interagiscono tra loro: lo spazio vettoriale.

Uno spazio vettoriale reale (o $\mathbb{R}$-spazio vettoriale) è un insieme $V$ dotato di due operazioni:

un’operazione di somma tra vettori: $+: V \times V \to V$, tale che $(u, v) \mapsto u + v$;
un’operazione di moltiplicazione per scalare: $\cdot : \mathbb{R} \times V \to V$, tale che $(\lambda, v) \mapsto \lambda \cdot v$,

soddisfacendo le seguenti proprietà per ogni $u, v, w \in V$ e per ogni $\lambda, \mu \in \mathbb{R}$:

(Associatività della somma) $(u + v) + w = u + (v + w)$;
(Esistenza dell’elemento neutro) Esiste $0 \in V$ tale che $v + 0 = v$ per ogni $v \in V$;
(Esistenza dell’inverso) Per ogni $v \in V$ esiste $-v \in V$ tale che $v + (-v) = 0$;
(Commutatività della somma) $u + v = v + u$;
(Compatibilità tra prodotto di scalari e vettori) $(\lambda \mu) \cdot v = \lambda \cdot (\mu \cdot v)$;
(Elemento neutro della moltiplicazione) $1 \cdot v = v$;
(Distributività rispetto alla somma di vettori) $\lambda \cdot (u + v) = \lambda \cdot u + \lambda \cdot v$;
(Distributività rispetto alla somma di scalari) $(\lambda + \mu) \cdot v = \lambda \cdot v + \mu \cdot v$.

Intuitivamente, uno spazio vettoriale può essere immaginato come un insieme di vettori – indicati con delle frecce – dispiegati da un punto detto origine $O$, generalmente essa coincide con $O\equiv (0,...,0)$.

IMMAGINE

In generale, conviene immaginare i vettori come dei punti, ossia il punto corrispondente alla punta della freccia; non per nulla la posizione dei punti e dei vettori è espressa tramite la medesima notazione $(...,...,...)$.

IMMAGINE

Altri dettagli sugli spazi vettoriali verranno trattati in seguito grazie concetto di campo; al momento si danno delle nozioni sul funzionamento delle operazioni in uno spazio vettoriale.

Siano $\vec{u}, \vec{v} \in \mathbb{R}^n$. La loro somma è definita come:

\[\vec{u} + \vec{v} = \begin{pmatrix} u_1 \\ u_2 \\ \vdots \\ u_n \end{pmatrix} + \begin{pmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{pmatrix} = \begin{pmatrix} u_1 + v_1 \\ u_2 + v_2 \\ \vdots \\ u_n + v_n \end{pmatrix}\]

La somma di due vettori può essere rappresentata graficamente mediante la regola del parallelogramma oppure la regola punta-coda: si posiziona la coda di $\vec{v}$ sulla punta di $\vec{u}$ e il vettore risultante $\vec{u} + \vec{v}$ va dall’origine alla punta di $\vec{v}$ così traslato.

IMMAGINE

Esempio. $(1,2,3)+(-3, 3, 5)=(-2,5,8)$.
Esercizio. Rappresentare, sul piano cartesiano, mediante frecce e punti, l’esempio appena dato.

Sia $\alpha \in \mathbb{R}$ uno scalare e $\vec{v} \in \mathbb{R}^n$. La moltiplicazione per scalare è definita come:

\[\alpha \vec{v} = \alpha \begin{pmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{pmatrix} = \begin{pmatrix} \alpha v_1 \\ \alpha v_2 \\ \vdots \\ \alpha v_n \end{pmatrix}\]

Moltiplicare un vettore per uno scalare ne cambia il modulo –lunghezza – e, se $\alpha < 0$, anche il verso. Se $\alpha = 1$, il vettore resta invariato; se $\alpha = 0$, il vettore diventa il vettore nullo.

IMMAGINE

Esempio. $-2(1,2,-3)=(-2,-4,6), \ \ \ \frac{1}{2}(1,2,-3)=(\frac{1}{2}, 1,\frac{-3}{2})\ \ $.
Esercizio. Rappresentare, sul piano cartesiano, mediante frecce e punti, l’esempio appena dato.

1.2.2 Insieme delle soluzioni di sistemi lineari

I sistemi lineari nascono naturalmente quando si devono determinare valori incogniti soggetti a più vincoli lineari.

Problema: Si supponga che in un negozio si vendano due tipi di frutta:

mele a 2 euro l’una;
banane a 1 euro l’una.

Un cliente acquista un totale di 5 frutti spendendo 7 euro. Quante mele e quante banane ha comprato?
Soluzione:
Per operare è necessario, mediante l’astrazione, tradurre il problema in linguaggio matematico.
Siano:

$x$ = numero di mele acquistate;
$y$ = numero di banane acquistate.

Si ottiene il seguente sistema:

\[\begin{cases} x + y = 5 \quad &\text{(numero totale di frutti)} \\ 2x + 1y = 7 \quad &\text{(costo totale)} \end{cases}\]

L’obiettivo è trovare una coppia $(x, y)$ che soddisfi entrambe le equazioni. Questo è un sistema lineare in due incognite. Si lascia il conto al lettore, il quale dovrebbe operare con la sola conoscenza delle equazioni.

Questo tipo di situazione si presenta ovunque: in economia, ingegneria, informatica, ecc. La teoria dei sistemi lineari fornisce strumenti sistematici per risolvere questi problemi anche quando ci sono molte più equazioni e incognite. L’algebra lineare permette, tramite i suoi strumenti, la semplificazione di questi sistemi.

Un sistema lineare è un insieme di $m$ equazioni lineari in $n$ incognite della forma:

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \quad \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \end{cases}\]

ove:

$x_1, x_2, \dots, x_n$ sono le incognite;
$a_{ij} \in \mathbb{R}$ (o in un campo qualsiasi) sono i coefficienti;
$b_1, b_2, \dots, b_m \in \mathbb{R}$ sono i termini noti.

Il sistema è detto:

omogeneo se tutti i termini noti sono nulli, cioè $b_1 = b_2 = \dots = b_m = 0$;
non omogeneo altrimenti.

Una soluzione del sistema è un $n$-upla $(x_1, x_2, \dots, x_n)$ che soddisfa tutte le equazioni contemporaneamente.

Come al solito, si cerca di semplificare il più possibile l’oggetto a disposizione mantenendo solamente le informazioni essenziali; nei sistemi queste informazioni sono i coefficienti $(a_{ij})$, le incognite $(x_i)$ e i termini noti $(b_i)$. Le incognite e i termini noti possono essere rappresentati tramite dei vettori $x=(x_1,...,x_n)$ e $b=(b_1,...,b_m)$, mentre per i coefficienti $(a_{ij})$, dato che hanno due indici, è necessario introdurre un nuovo oggetto, una estensione del vettore: una matrice.

Una matrice, l’argomento verrà ripreso in seguito, altro non è che una tabella di scalari, ha righe e colonne, a differenza del vettore che è una linea di scalari.

Una matrice è un insieme di numeri disposti in righe e colonne. Più precisamente, una matrice $A$ di dimensione $m \times n$ (cioè con $m$ righe e $n$ colonne) è scritta come:

\[A = \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{pmatrix}\]

Ogni elemento $a_{ij}$ è il numero situato nella $i$-esima riga e $j$-esima colonna.

Anche la matrice può essere ulteriormente estesa divenendo una sorta di parallelepipedo a celle, per semplicità queste estensioni vengono chiamate tensori: uno scalare è uno 0–tensore, un vettore è un 1–tensore, una matrice è un 2–tensore, e così via.

Esercizio. Pensare a come inserire in un $n-tensore$ l’informazione circa il colore di ogni quadratino del cubo di Rubik. Qual è il valore assunto da $n$?

Tornando ai sistemi lineari, un sistema lineare può essere riscritto in forma compatta tramite le matrici.

Esempio: Si considera il sistema:

\[\begin{cases} 2x + y = 5 \\ 3x - 2y = 4 \end{cases}\]

Lo si può rappresentare come:

\[\underbrace{ \begin{pmatrix} 2 & 1 \\ 3 & -2 \end{pmatrix} }_{\text{matrice dei coefficienti } A} \cdot \underbrace{ \begin{pmatrix} x \\ y \end{pmatrix} }_{\text{vettore incognite } \vec{x}} = \underbrace{ \begin{pmatrix} 5 \\ 4 \end{pmatrix} }_{\text{vettore termini noti } \vec{b}}\]

In generale, un sistema lineare si scrive come:

\[A \vec{x} = \vec{b}\]

ove:

$A$ è la matrice dei coefficienti $(m \times n)$;
$\vec{x}$ è il vettore colonna delle incognite $(n \times 1)$;
$\vec{b}$ è il vettore colonna dei termini noti $(m \times 1)$.

Questa forma è estremamente utile per risolvere i sistemi con metodi algebrici, numerici e computazionali.

Esercizio. Si provi ad intuire il prodotto riga-colonna tra matrice e vettore e tra matrice e matrice; in sostanza, come si ottiene da un prodotto una delle equazioni del sistema?
In generale, un sistema lineare con $m$ equazioni e $n$ incognite può essere scritto nella forma:

\[\begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \\ \quad \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \dots + a_{mn}x_n = b_m \end{cases}\]

Questo sistema può essere espresso come:

\[A \vec{x} = \vec{b}\]

ove:

$A \in \mathbb{R}^{m \times n}$ è la matrice dei coefficienti: \[A = \begin{pmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{pmatrix}\]
$\vec{x} \in \mathbb{R}^n$ è il vettore colonna delle incognite: \[\vec{x} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}\]
$\vec{b} \in \mathbb{R}^m$ è il vettore dei termini noti: \[\vec{b} = \begin{pmatrix} b_1 \\ b_2 \\ \vdots \\ b_m \end{pmatrix}\]

Per facilitare le operazioni di risoluzione algebrica, si costruisce la matrice aumentata (completa) associata al sistema, indicata con $(A \, | \, \vec{b})$:

\[\left( \begin{array}{cccc|c} a_{11} & a_{12} & \dots & a_{1n} & b_1 \\ a_{21} & a_{22} & \dots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2} & \dots & a_{mn} & b_m \end{array} \right)\]

Questa matrice rappresenta in modo compatto sia i coefficienti delle incognite che i termini noti, ed è la base per i metodi risolutivi come l’eliminazione di Gauss o l’algoritmo di Gauss-Jordan.

Geometricamente, un sistema lineare è formato da equazioni che rappresentano rette (in $\mathbb{R}^2$), piani (in $\mathbb{R}^3$), o iperpiani (in $\mathbb{R}^n$). La sua soluzione corrisponde all’intersezione di questi enti geometrici.

IMMAGINE

Si ricorda che un sistema lineare omogeneo ha la forma:

\[A\vec{x} = \vec{0}\]

ove: $\vec{0} \in \mathbb{R}^m$ è il vettore nullo.

L’insieme delle soluzioni del sistema è dato da:

\[\mathcal{S} = \left\{ \vec{x} \in \mathbb{R}^n \,\middle|\, A\vec{x} = \vec{0} \right\}\]

Questo insieme è chiamato nucleo (o kernel) della matrice $A$, e si denota con: $\mathcal{S} = \ker A$

L’insieme delle soluzioni di un sistema omogeneo ha sempre le seguenti proprietà:

Contiene sempre almeno la soluzione banale $\vec{x} = \vec{0}$.
È un sottospazio vettoriale di $\mathbb{R}^n$.
La sua dimensione è detta nullità della matrice $A$: \[\dim(\ker A) = n - \operatorname{rg}(A)\]

Geometricamente, le soluzioni formano:

una retta passante per l’origine, se la dimensione del nucleo è 1;
un piano passante per l’origine, se la dimensione è 2;
più in generale, uno spazio lineare passante per l’origine in $\mathbb{R}^n$.

IMMAGINE

Le informazioni non comprese alla prima lettura verranno chiarite successivamente, sono state riportate per comodità di ri–lettura.

Esempio. Si considera il seguente sistema lineare omogeneo:

\[\begin{cases} x + y + z = 0 \\ 2x + y + 3z = 0 \end{cases}\]

Si riscrive il sistema come $A\vec{x} = \vec{0}$, dove:

\[A = \begin{pmatrix} 1 & 1 & 1 \\ 2 & 1 & 3 \end{pmatrix}, \quad \vec{x} = \begin{pmatrix} x \\ y \\ z \end{pmatrix}\]

Applicando l’eliminazione di Gauss alla matrice aumentata, si ottiene

\[\begin{cases} x + y + z = 0 \\ - y + z = 0 \end{cases}\]

Risolvendo:
- Dalla seconda equazione: $y = z$
- Sostituendo nella prima: $x + y + z = x + z + z = x + 2z = 0 \Rightarrow x = -2z$

Le soluzioni dipendono dal parametro libero $z \in \mathbb{R}$. Si scrive il vettore delle soluzioni:

\[\vec{x} = \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} -2z \\ z \\ z \end{pmatrix} = z \begin{pmatrix} -2 \\ 1 \\ 1 \end{pmatrix}, \quad z \in \mathbb{R}\]

L’insieme delle soluzioni è un sottospazio vettoriale unidimensionale (una retta) di $\mathbb{R}^3$, generato dal vettore:

\[\vec{v} = \begin{pmatrix} -2 \\ 1 \\ 1 \end{pmatrix} \quad \Rightarrow \quad \mathcal{S} = \operatorname{Span} \left\{ \begin{pmatrix} -2 \\ 1 \\ 1 \end{pmatrix} \right\}\]

Esercizio. Provare a comprendere cosa sia lo Span dall’esempio.
Suggerimento: Si pensi alla lunghezza dei vettori.
Esercizio. Rappresentare il sistema su un calcolatore 3d. Si consigliando Desmos e Geogebra.
Un sistema lineare non omogeneo ha la forma:

\[A\vec{x} = \vec{b}, \quad \text{con } \vec{b} \neq \vec{0}\]

Se il sistema è compatibile o consistente (cioè ammette almeno una soluzione, se non ammette soluzioni si dice incompatibile o inconsistente), allora l’insieme delle soluzioni si può scrivere come:

\[\mathcal{S} = \vec{x}_p + \ker A\]

ove:

$\vec{x}_p$ è una soluzione particolare del sistema $A\vec{x} = \vec{b}$;
$\ker A$ è l’insieme delle soluzioni del sistema omogeneo associato $A\vec{x} = \vec{0}$.

Geometricamente, l’insieme delle soluzioni è una traslazione del nucleo della matrice. Non è più un sottospazio vettoriale, ma un sottospazio affine, cioè:

un punto, una retta, un piano, ecc., che non passa per l’origine;
ha la stessa direzione di $\ker A$, ma è “spostato” tramite $\vec{x}_p$.

IMMAGINE

Il sistema $A\vec{x} = \vec{b}$ ammette soluzioni se e solo se il vettore $\vec{b}$ appartiene allo spazio colonna (o immagine) della matrice $A$, cioè:

\[\vec{b} \in \operatorname{Im}(A)\]

Esempio. Si considera il sistema:

\[\begin{cases} x + y + z = 2 \\ 2x + y + 3z = 5 \end{cases}\]

Lo si riscrive nella forma $A\vec{x} = \vec{b}$:

\[A = \begin{pmatrix} 1 & 1 & 1 \\ 2 & 1 & 3 \end{pmatrix}, \quad \vec{x} = \begin{pmatrix} x \\ y \\ z \end{pmatrix}, \quad \vec{b} = \begin{pmatrix} 2 \\ 5 \end{pmatrix}\]

Si individua la matrice aumentata:

\[\left[ \begin{array}{ccc|c} 1 & 1 & 1 & 2 \\ 2 & 1 & 3 & 5 \end{array} \right] \longrightarrow \left[ \begin{array}{ccc|c} 1 & 1 & 1 & 2 \\ 0 & -1 & 1 & 1 \end{array} \right]\]

e tramite l’eliminazione di Gauss si ottiene il sistema equivalente:

\[\begin{cases} x + y + z = 2 \\ - y + z = 1 \end{cases} \Rightarrow \begin{cases} y = z - 1 \\ x = 2 - y - z = 2 - (z - 1) - z = 3 - 2z \end{cases}\]

Le soluzioni dipendono dal parametro libero $z \in \mathbb{R}$. Si scrive:

\[\vec{x} = \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} 3 - 2z \\ z - 1 \\ z \end{pmatrix} = \begin{pmatrix} 3 \\ -1 \\ 0 \end{pmatrix} + z \begin{pmatrix} -2 \\ 1 \\ 1 \end{pmatrix}, \quad z \in \mathbb{R}\]

L’insieme delle soluzioni è:

\[\mathcal{S} = \vec{x}_p + \ker A = \operatorname{span} \left\{ \begin{pmatrix} -2 \\ 1 \\ 1 \end{pmatrix} \right\} + \begin{pmatrix} 3 \\ -1 \\ 0 \end{pmatrix}\]

Si tratta di una retta affine in $\mathbb{R}^3$ che:

Ha direzione $\begin{pmatrix} -2 \\ 1 \\ 1 \end{pmatrix}$, cioè quella del $\ker A$
Passa per il punto $\vec{x}_p = \begin{pmatrix} 3 \\ -1 \\ 0 \end{pmatrix}$

1.2.3 Eliminazione di Gauss

Non è necessario fornire lunghe spiegazioni per comprendere che, se in un sistema lineare si scambia l’ordine delle equazioni, l’insieme delle soluzioni rimane invariato. Infatti, l’ordine in cui le equazioni vengono scritte non influisce sulla loro validità né sulla loro intersezione comune, che è ciò che determina la soluzione del sistema. Lo stesso vale nel caso in cui si elimini o si aggiunga un’equazione che è combinazione lineare delle altre: tale equazione non apporta nuova informazione al sistema, in quanto è già implicita nelle equazioni preesistenti.

Queste semplici, ma fondamentali osservazioni conducono naturalmente a un metodo sistematico per la risoluzione dei sistemi lineari. Si tratta di un procedimento noto fin dall’antichità in Cina con il nome di Fāngchéng, documentato in testi risalenti a oltre duemila anni fa. Questo metodo fu poi riscoperto, in modo indipendente, dal matematico Carl Friedrich Gauss all’inizio del XIX secolo, e oggi è comunemente noto come eliminazione di Gauss.

Alla base di questo procedimento vi è un teorema fondamentale dell’algebra lineare, che giustifica l’applicazione di particolari operazioni alle righe di un sistema — ovvero alle sue equazioni — senza alterarne l’insieme delle soluzioni. Tali operazioni, dette operazioni elementari sulle righe, includono:

Scambio di due equazioni (righe);
Moltiplicazione di un’equazione per un numero reale non nullo;
Somma di un multiplo di un’equazione a un’altra equazione.

Applicando iterativamente queste operazioni, si può trasformare il sistema originario in una forma più semplice, spesso triangolare, dalla quale le soluzioni si possono ottenere per sostituzione all’indietro. Il procedimento non solo è algoritmico, ma è anche alla base dei moderni metodi computazionali per la risoluzione di sistemi lineari.

Prima di illustrare con un buon esempio in cosa consiste questo metodo, si danno alcune definizioni utili per comprendere la terminologia di quanto detto sopra.

Esempio. La seguente matrice è triangolare superiore perché tutti gli elementi al di sotto della diagonale principale sono nulli:

\[A = \begin{bmatrix} 3 & -1 & 5 \\ 0 & 2 & 4 \\ 0 & 0 & 7 \end{bmatrix}\]

Matrice triangolare superiore. Una matrice quadrata $A = (a_{ij}) \in \mathbb{R}^{n \times n}$ si dice triangolare superiore se tutti gli elementi al di sotto della diagonale principale sono nulli, ovvero: \[a_{ij} = 0 \quad \text{per ogni } i > j.\] Ha quindi la forma: \[A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ 0 & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & a_{nn} \end{pmatrix}\]

Esempio. La seguente matrice è triangolare inferiore perché tutti gli elementi al di sopra della diagonale principale sono nulli:

\[B = \begin{bmatrix} 6 & 0 & 0 \\ -2 & 5 & 0 \\ 1 & 3 & 4 \end{bmatrix}\]

Matrice triangolare inferiore. Una matrice quadrata $A = (a_{ij}) \in \mathbb{R}^{n \times n}$ si dice triangolare inferiore se tutti gli elementi al di sopra della diagonale principale sono nulli, ovvero: \[a_{ij} = 0 \quad \text{per ogni } i < j.\] Ha quindi la forma: \[A = \begin{pmatrix} a_{11} & 0 & \cdots & 0 \\ a_{21} & a_{22} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix}\]

La definizione di combinazione lineare verrà enunciata nella prossima unità, al momento ci si concentri al comprendere intuitivamente quanto avviene e provare a definirla da sè.

Problema:
Risolvere il seguente sistema tramite il metodo di riduzione di Gauss:

\[\left\{ \begin{aligned} \frac{3(x - y + \frac{1}{2})}{2} + 2 &= \frac{4(x - y + \frac{1}{2})}{3} + \frac{7}{3} \\ \frac{3(x - y + \frac{1}{2})}{2} - 2 &= \frac{8(x + \frac{1}{4}) + 4(y - \frac{1}{4})}{7} \end{aligned} \right.\]

Soluzione:
Il sistema scritto in forma semplificata è:

\[\left\{ \begin{aligned} x - y &= \frac{3}{2} \\ 10x - 58y &= 39 \end{aligned} \right.\]

Per ridurre un sistema tramite Gauss è necessario riscriverlo sottoforma di matrice:

\[\left( \begin{array}{cc|c} 1 & -1 & \frac{3}{2} \\ 10 & -58 & 39 \end{array} \right)\]

Si applicano le seguenti operazioni elementari per ridurre il sistema alla forma triangolare superiore:

(i) Scambio di righe: permette di scambiare due righe del sistema. \[R_i \leftrightarrow R_j\]

(ii) Moltiplicazione di una riga per un numero non nullo: ogni riga può essere moltiplicata per una costante non nulla. \[R_i \rightarrow k \cdot R_i \quad \text{(con $k \neq 0$)}\]

(iii) Sostituzione tra righe: una riga può essere modificata aggiungendo o sottraendo un multiplo di un’altra riga. \[R_i \rightarrow R_i - m \cdot R_j \quad \text{(ove $m$ è un numero)}\]

L’obiettivo è trasformare il sistema in una matrice triangolare superiore, risolvendo le incognite per sostituzione all’indietro.

Nota: Generalmente è comodo ricondursi ad una matrice diagonale (Gauss-Jordan), ossia qualcosa del tipo:

\[\begin{pmatrix} d_1 & 0 & 0 & 0 \\ 0 & d_2 & 0 & 0 \\ 0 & 0 & ... & 0 \\ 0 & 0 & 0 & d_n \end{pmatrix}\] come viene mostrato nell’esercizio proposto.

Per eliminare $x$ dalla seconda riga, si esegue l’operazione: $R_2 - 10R_1 \to R_2$

\[\left( \begin{array}{cc|c} 1 & -1 & \frac{3}{2} \\ 0 & -48 & 24 \end{array} \right)\]

Per semplificare ulteriormente, si divide la seconda riga per $-48$: $\frac{1}{-48} R_2 \to R_2$

\[\left( \begin{array}{cc|c} 1 & -1 & \frac{3}{2} \\ 0 & 1 & -\frac{1}{2} \end{array} \right)\]

Per eliminare $y$ dalla prima riga, si esegue: $R_1 + R_2 \to R_1$

\[\left( \begin{array}{cc|c} 1 & 0 & 1 \\ 0 & 1 & -\frac{1}{2} \end{array} \right)\]

La soluzione del sistema è quindi:

\[\begin{cases} x = 1 \\ y = -\frac{1}{2} \end{cases}\]

Esercizio. La classica eliminazione di Gauss, nell’esempio proposto, si sarebbe fermata alla triangolare superiore $\left( \begin{array}{cc|c} 1 & -1 & \frac{3}{2} \\ 0 & 1 & -\frac{1}{2} \end{array} \right)$ . Continuare la risoluzione da questo punto tramite il metodo di sostituzione dopo esser passati dalla forma matriciale a quella estesa.

Matrice a gradini. Una matrice $A \in \mathbb{R}^{m \times n}$ si dice a gradini (o in forma a scalini di riga) se soddisfa le seguenti proprietà:

Se una riga è composta interamente da zeri, essa si trova in fondo alla matrice;
Il primo elemento non nullo (detto pivot) di ogni riga si trova a destra del pivot della riga precedente;
Tutti gli elementi al di sotto di un pivot sono nulli.

Osservazione. In ogni riga non nulla della matrice a gradini, il primo numero diverso da zero da sinistra prende il nome di pivot (o elemento guida). L’insieme dei pivot individua una struttura "a scalini" o "a gradini", utile per l’analisi del sistema lineare associato.

Il numero di pivot presenti in una matrice a gradini corrisponde al rango della matrice, ovvero al numero massimo di righe linearmente indipendenti.

Ad esempio, nella matrice:

\[\begin{pmatrix} 1 & 2 & 3 & 1 \\ 0 & 1 & -1 & 2 \\ 0 & 0 & 4 & -3 \\ 0 & 0 & 0 & 0 \end{pmatrix}\]

i pivot si trovano nelle posizioni $a_{11} = 1$, $a_{22} = 1$, $a_{33} = 4$. La riga finale è nulla, quindi il rango della matrice è 3. Dal rango è possibile capire quanti parametri liberi sono presenti nell’insieme della soluzione di un sistema, in questo caso ci sarebbero $4-3=1$ parametri liberi. In generale $\#parametri\ \ liberi = \#righe \ -\ rango$ .

La forma a gradini è particolarmente utile nella risoluzione di sistemi lineari tramite il metodo di eliminazione di Gauss, perché consente di applicare la sostituzione all’indietro partendo dall’ultima riga contenente un pivot.

Si consiglia la visione del video realizzato da MathMan, il quale mostra un’ottima visualizzazione di ciò che accade applicando l’algoritmo di Gauss-Jordan portando la matrice omogenea all’identità: https://youtu.be/wHh2nxSVqqw?si=RUzoXGnCRcMPQy5L

Due matrici $A \in \mathbb{R}^{m \times n}$ e $B \in \mathbb{R}^{m \times n}$ si dicono equivalenti per righe se si può ottenere l’una dall’altra mediante un numero finito di operazioni elementari di riga, ovvero:

scambio di due righe,
moltiplicazione di una riga per un numero reale non nullo,
somma di un multiplo di una riga a un’altra.

Due sistemi lineari si dicono equivalenti se hanno lo stesso insieme di soluzioni. In particolare, due sistemi sono equivalenti se le rispettive matrici complete possono essere trasformate l’una nell’altra tramite operazioni elementari di riga.

Le operazioni elementari sulle righe di una matrice aumentata (cioè la matrice dei coefficienti affiancata al vettore dei termini noti) non alterano l’insieme delle soluzioni del sistema lineare. Questo implica che:

Sistemi le cui matrici aumentate sono equivalenti per righe hanno la stessa soluzione.

In particolare, il metodo di eliminazione di Gauss sfrutta proprio questa proprietà: si applicano operazioni di riga per trasformare il sistema in una forma più semplice (di solito una matrice a gradini), senza cambiare l’insieme delle soluzioni.

La nozione di matrici equivalenti è più generale: riguarda solo le trasformazioni sulla parte dei coefficienti. Due matrici equivalenti non rappresentano necessariamente sistemi con le stesse soluzioni (a meno che si consideri anche il vettore dei termini noti). Perciò, è più corretto parlare di equivalenza tra sistemi quando si lavora con matrici complete.

1.2.4 Enunciato del teorema di Rouché-Capelli

Una volta consolidate le nozioni relative alle combinazioni lineari, si consiglia la visione del video realizzato da ClearMath, dal quale sono state tratte le immagini che seguono: https://youtu.be/GGjqfrWsPRE?si=rOFd0a16JKNuMEWg

Uno degli obiettivi fondamentali nello studio dei sistemi lineari è determinare se un sistema è compatibile (cioè ammette almeno una soluzione) oppure incompatibile (nessuna soluzione). Il teorema di Rouché-Capelli fornisce un criterio semplice ed efficace per rispondere a questa domanda, basato sul concetto di rango di una matrice.

Ogni sistema lineare può essere associato a due matrici:

la matrice dei coefficienti $A$, contenente solo i coefficienti delle incognite;
la matrice aumentata $(A|b)$, ottenuta aggiungendo a $A$ una colonna contenente i termini noti $b$.

L’idea centrale è confrontare il rango di $A$ con quello di $(A|b)$:

Se i due ranghi coincidono, il sistema è compatibile (ammette soluzioni).
Se i ranghi sono diversi, il sistema è incompatibile (nessuna soluzione possibile).

Inoltre, se il sistema è compatibile:

ha un’unica soluzione se il rango coincide con il numero delle incognite;
ha infinite soluzioni se il rango è minore del numero delle incognite.

La dimostrazione e l’enunciazione rigorosa del teorema verranno offerte successivamente.

1.2.5 La struttura dei campi

In algebra lineare, uno degli elementi fondamentali per la costruzione di spazi vettoriali è il campo. Un campo, intuitivamente, è l’insieme degli scalari dotato di una certa struttura.

Il termine campo utilizzato in algebra lineare e in particolare in algebra, deriva dalla traduzione italiana del termine tedesco Körper, che letteralmente significa corpo.

La nozione di Körper fu introdotta nel XIX secolo da matematici tedeschi, tra cui Richard Dedekind, per indicare una struttura algebrica dotata di due operazioni binarie — somma e moltiplicazione — che soddisfano specifiche proprietà algebriche. Il termine tedesco Körper allude all’idea di un’entità solida e completa, capace di contenere tutti gli elementi necessari per definire le operazioni algebriche fondamentali in modo coerente e sistematico.

Nella traduzione e diffusione internazionale di tali concetti, il termine Körper fu reso in italiano con la parola campo e in inglese con field. Quest’ultimo richiama metaforicamente l’idea di un campo aperto, uno spazio o un insieme “ben strutturato” in cui è possibile operare senza limitazioni, proprio come un campo aperto in natura in cui ci si può muovere liberamente. Così come un campo è uno spazio in cui si può coltivare e far crescere qualcosa, in matematica il campo è una “terra fertile” su cui far crescere solide teorie.

IMMAGINE

Un campo è una struttura algebrica costituita da un insieme $\mathbb{K}$ dotato di due operazioni binarie, chiamate somma e prodotto, che soddisfano determinate proprietà. In particolare, il campo deve soddisfare le seguenti condizioni:

Chiusura: per ogni $a,b \in K$, sia $a+b$ che $a \cdot b$ appartengono a $\mathbb{K}$.
Associatività: per ogni $a,b,c \in \mathbb{K}$, \[(a+b)+c = a+(b+c) \quad \text{e} \quad (a \cdot b) \cdot c = a \cdot (b \cdot c).\]
Elemento neutro: esistono due elementi distinti $0,1 \in \mathbb{K}$ tali che per ogni $a \in \mathbb{K}$, \[a + 0 = a \quad \text{e} \quad a \cdot 1 = a.\]
Inversi: per ogni $a \in \mathbb{K}$, esiste un elemento $-a \in \mathbb{K}$ tale che \[a + (-a) = 0,\] e per ogni $a \neq 0$, esiste un elemento $a^{-1} \in \mathbb{K}$ tale che \[a \cdot a^{-1} = 1.\]
Commutatività: per ogni $a,b \in \mathbb{K}$, \[a + b = b + a \quad \text{e} \quad a \cdot b = b \cdot a.\]
Distributività: per ogni $a,b,c \in \mathbb{K}$, \[a \cdot (b + c) = a \cdot b + a \cdot c.\]

I campi più utilizzati nell’algebra lineare sono il campo dei numeri reali $\mathbb{R}$, il campo dei numeri complessi $\mathbb{C}$ e il campo dei numeri razionali $\mathbb{Q}$.
Nota. Alcune volte si indica un generico campo con $\mathbb{F}$, dall’inglese field.
Esercizio. Verificare che $\mathbb{R}$ e $\mathbb{Q}$ siano campi.
Esercizio. Dimostrare che $\mathbb{N}$ e $\mathbb{Z}$ non sono campi.

Un campo che ricorre spesso in algebra è il campo delle classi di congruenza modulo un primo $p$.

Per ogni numero intero $p > 1$, si indica con $\mathbb{Z}/p\mathbb{Z}$ l’insieme \[\mathbb{Z}/p\mathbb{Z} = \{ \overline{0}, \overline{1}, \ldots, \overline{p-1} \}\] ove $\overline{a}$ denota la classe di resto di $a$ modulo $p$.

La prima unità del corso è conclusa. Alcuni degli esercizi che seguono sono tratti da Algebra Lineare e Geometria di Kieran G. O’Grady, Algebra lineare, per matematici di Marco Manetti e dal Foglio 1 del corso di Algebra Lineare 2024–2025 tenuto dai professori Paolo Bravi e Simone Diverio.

Esercizi

Siano

\[X_1 = \{0, 2, 4, 6, 8\}, \quad X_2 = \{1, 2, 4, 5, 6\}, \quad X_3 = \{0, 4, 8\}.\]

Determinare $X_i \cup X_j$ e $X_i \cap X_j$ per ogni $1 \leq i < j \leq 3$ e rappresentarli tramite diagrammi di Venn.

Sia $\mathbb{N}^+ \subseteq \mathbb{N}_0$ il sottoinsieme dei naturali strettamente positivi. Dimostrare che

\[ \bigcup_{n \in \mathbb{N}^+} \left( -\frac{n-1}{n}, \frac{n-1}{ n} \right) = (-1,1) \quad \text{e} \quad \bigcap_{n \in \mathbb{N}^+} \left( -\frac{n+1}{n}, \frac{n+1}{ n}\right) = [-1,1]. \]

Siano $X$ e $Y$ insiemi. Dimostrare che

$X \cup Y = Y$ se e solo se $X \subseteq Y$,
$X \cap Y = Y$ se e solo se $X \supseteq Y$.

Siano $X$, $Y$, $Z$ insiemi. Dimostrare che

\[X \cap (Y \cup Z) = (X \cap Y) \cup (X \cap Z).\]

Se $X, Y$ sono insiemi, $X \setminus Y$ è l’insieme i cui elementi sono gli $x \in X$ che non sono elementi di $Y$. Dimostrare che

\[X \setminus (Y \cup Z) = (X \setminus Y) \cap (X \setminus Z), \quad X \setminus (Y \cap Z) = (X \setminus Y) \cup (X \setminus Z).\]

(Formule di de Morgan.)

Se $X$ è un insieme finito, si denota con $|X|=\#X$ il numero degli elementi di $X$.
Giustificare la notazione dimostrando che, se $X$ e $Y$ sono finiti, allora

\[|Y ^X| = |Y| ^{|X|}.\]

Sia $X$ un insieme. Si denota $\mathcal{P}(X)$ l’insieme dei sottoinsiemi di $X$, per esempio $\mathcal{P}(\{1, 2\}) = \{\emptyset, \{1\}, \{2\}, \{1, 2\}\}$. Sia $A \subseteq X$ un sottoinsieme. La funzione caratteristica di $A$ è la $\chi_A : X \to \{0, 1\}$ definita da

\[\chi_A(x) = \begin{cases} 1 & \text{se } x \in A, \\ 0 & \text{se } x \notin A. \end{cases}\]. Dimostrare che la funzione

\[P(X) \to \{0, 1\}^X, \quad A \mapsto \chi_A\]

è biunivoca. Dimostrare inoltre che, se $X$ è finito, allora

\[|\mathcal{P}(X)| = 2^{|X|}.\]

Di ciascuna delle seguenti funzioni, dire se è iniettiva, suriettiva o biunivoca.

$f : \mathbb{Z} \to \mathbb{Z}$, con $f(x) = |x|$,
$g : \mathbb{Z} \to \mathbb{N}$, con $g(x) = |x|$,
$h : \{0, 1\}^N \times \{0, 1\}^N \to \{0, 1\}^N$, con $h((a_n), (b_n)) = a_0, b_0, a_1, b_1, a_2, b_2, \dots$.

Sia $f : \mathbb{R} \to \mathbb{R}$ definita da $f(x) = x^2 + x + 3$. Determinare l’immagine di $f$ e rappresentare il grafico della funzione sul piano cartesiano.

Siano $X$, $Y$ insiemi e $f : X \to Y$ un’applicazione. Siano $A \subseteq X$ e $B \subseteq Y$. Verificare che

\[A \subseteq f^{-1}(f(A)) \quad \text{e} \quad f(f^{-1}(B)) \subseteq B.\]

Dare esempi in cui le inclusioni di sopra sono strette, cioè $A \neq f^{-1}(f(A))$ e $f(f^{-1}(B)) \neq B$.

Dimostrare che $\mathbb{N}$, $\mathbb{Z}$ e $\mathbb{Q}$ hanno la stessa cardinalità.

Sia $X$ un insieme e $f : X \to \mathcal{P}(X)$ un’applicazione. Dimostrare che $f$ non è suriettiva.
Suggerimento: dimostrare che $A = \{x \in X \mid x \notin f(x)\}$ non è un elemento dell’immagine di $f$.

Dimostrare che \[(A \cup B) \cap C = (A \cap C) \cup (B \cap C)\]

Dimostrare che \[(A \cap B) \cup C = (A \cup C) \cap (B \cup C)\]

Dimostrare che \[(A \cap B)^c = A^c \cup B^c\]

Dire se la seguente affermazione è vera o falsa \[(A \cup B) \setminus C = A \cup (B \setminus C)\]

Dire se la seguente affermazione è vera o falsa \[(A \cup B) \setminus A = B\]

Dire se la seguente affermazione è vera o falsa \[(A \cup B) \setminus A = B \setminus A\]

Dire se la seguente affermazione è vera o falsa \[(A \cup B)^c \cap C = (A^c \cap C) \cup (B^c \cap C)\]

Dire se la seguente affermazione è vera o falsa \[(A \cup B)^c \cap C = A^c \cap B^c \cap C\]

Dire se la seguente affermazione è vera o falsa \[(A \cup B)^c \cap C = C \setminus [C \cap (A \cup B)]\]

Dire se la seguente affermazione è vera o falsa. Se $H_1 \cap H_2 = \emptyset$ e $A_i \subseteq H_i$, per $i = 1, 2$, allora $A_1 \cap A_2 = \emptyset$.

Per l’insieme A, determinare il complementare rispetto ad U.

$U=\{ x \in \mathbb{Z} : |x| \text{ è pari}\}$

$A=\{x : x=2n , n \in \mathbb{N}\}$.

Risolvere la seguente equazione in $\frac{\mathbb{Z}}{27 \mathbb{Z}}$: $[5]_{27}x+[2]_{27}=[0]_{27}$.

Risolvere la seguente equazione in $\frac{\mathbb{Z}}{27 \mathbb{Z}}$: $[6]_{27}x+[7]_{27}=[0]_{27}$.

Risolvere la seguente equazione in $\frac{\mathbb{Z}}{27 \mathbb{Z}}$: $[6]_{27}x+[3]_{27}=[0]_{27}$.

Calcolare i seguenti numeri del campo $\mathbb{F}_5$:

\[\begin{align*} 1. \quad & 3 \cdot 4^{-1} \mod 5 \\ 2. \quad & (3^5) \cdot 2^{-2} \mod 5 \\ 3. \quad & (1 + 2 + \dots + 9) \cdot 3^{-10} \mod 5 \end{align*}\]

Sia $p$ un numero primo, e sia $x \in \mathbb{F}_p$ un elemento diverso da $0$. Dimostrare che \[\begin{equation} x^{p-1} = 1 \tag{1} \end{equation}\] seguendo i seguenti passi.

(Si ricorda che (1) significa che se $a \in \mathbb{Z}$ non è multiplo di $p$, allora $a^{p-1} - 1$ è un multiplo di $p$.)

Dimostrare che esiste $1 \leq m \leq p - 1$ tale che \[\begin{equation} x^m = 1 \tag{2} \end{equation}\] considerando gli elementi $x, x^2, \dots, x^{p-1}$.
(Se non esiste tale $m$, “contando” si vede che esistono $1 \leq i < j \leq p - 1$ tali che $x^i = x^j$...)
Sia $m$ il minimo intero con $1 \leq m \leq p - 1$ tale che valga (2): dimostrare che $m \mid (p - 1)$.
Dal punto (b), dedurre che vale (1).

Determinare l’insieme delle soluzioni dei seguenti sistemi lineari:

\[\begin{cases} x_1 + x_2 + x_4 = -1 \\ x_1 + x_3 + 2x_4 = -3 \\ x_2 - x_3 - x_4 = 2 \\ x_1 + 2x_2 - x_3 = 1 \end{cases} \quad \begin{cases} x_1 + x_2 + x_3 - x_4 = -1 \\ x_1 - 2x_2 - x_3 + x_4 = 2 \\ 3x_2 + 2x_3 - 2x_4 = -3 \\ 2x_1 - x_2 = 1 \end{cases}\]

Soluzione.

S₁: $(-3,2,0,0) + \text{Span}\{(-1,1,1,0), (-2,1,0,1)\}$

S₂: $(0,1,0,0) + \text{Span}\left\{\left(\frac{1}{3}, -\frac{2}{3}, 1, 0\right), \left(\frac{1}{3}, \frac{2}{3}, 0, 1\right)\right\}$

Calcolare la dimensione dello spazio delle soluzioni dei seguenti sistemi lineari omogenei:

\[\begin{cases} x_1 + x_2 + x_3 - x_4 - x_6 = 0 \\ x_1 - x_2 + x_3 - 2x_4 - 2x_5 = 0 \\ x_2 + 2x_3 + 2x_5 + 2x_6 = 0 \\ x_2 - 2x_4 - 2x_5 - 2x_6 = 0 \end{cases} \quad \begin{cases} 2x_1 - x_2 = 0 \\ x_1 - 2x_2 + x_3 = 0 \\ x_2 - 2x_3 + x_4 = 0 \\ x_3 - 2x_4 + x_5 = 0 \\ x_4 - 2x_5 = 0 \end{cases}\]

Soluzione.

\[ \dim S_1=2; \ \dim S_2=0 \]

Studiare i seguenti sistemi lineari (nelle incognite $x,y,z$) al variare del parametro $\alpha \in \mathbb{R}$:

\[\begin{cases} x + z = 1 \\ y + \alpha z = -1 \\ x - \alpha y = 0 \end{cases} \quad \begin{cases} (\alpha - 2)x + y - z = 1 \\ (3 - \alpha)y - z = 1 \\ (\alpha - 2)x + 2y = 1 \end{cases}\]

Calcolare il rango del tastierino del telefono, del tabellone della tombola e della tavola pitagorica.

Tastierino del telefono: \[\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix}\]

Tabellone della tombola: \[\begin{pmatrix} 1 & 2 & \ldots & 9 & 10 \\ 11 & 12 & \ldots & 19 & 20 \\ \vdots & \vdots & & \vdots & \vdots \\ 71 & 72 & \ldots & 79 & 80 \\ 81 & 82 & \ldots & 89 & 90 \end{pmatrix}\]

Tavola pitagorica: \[\begin{pmatrix} 1 & 2 & \ldots & 9 & 10 \\ 2 & 4 & \ldots & 18 & 20 \\ 3 & 6 & \ldots & 27 & 30 \\ \vdots & \vdots & & \vdots & \vdots \\ 9 & 18 & \ldots & 81 & 90 \\ 10 & 20 & \ldots & 90 & 100 \end{pmatrix}\]

Un contadino alleva mucche e galline. Se possiede 60 capi che hanno complessivamente 172 zampe, quante sono rispettivamente le mucche e le galline?

Un contadino, avendo incontrato dei politici, voleva tirare 5 pomodori a ciascuno, ma per fare questo gli mancavano 2 pomodori. Allora egli tirò 4 pomodori a ciascuno e così gli rimasero 5 pomodori. Quanti erano i politici?

Determinare quattro numeri sapendo che le loro somme a tre a tre sono 9, 10, 11 e 12.

Sempronio volendo distribuire certi denari a certi poveri osserva, che se ne dà tre a ciascuno, ne mancano otto, se ne d‘a due, ne avanzano tre. Si vuol sapere il numero de’ poveri, e de’ denari.

Determinare la consistenza dei seguenti sistemi lineari senza risolverli: \[\begin{cases} x_1 - 2x_2 + x_3 + 3x_4 = 1 \\ 2x_1 - x_3 = 0 \\ 2x_1 - 4x_2 + 2x_3 + 6x_4 = 3 \\ x_1 + x_2 + x_3 + x_4 = 318 \end{cases} \quad \begin{cases} x_1 - x_2 + x_3 + x_4 = 0 \\ 2x_1 - x_2 - x_3 = 0 \\ x_1 - 4x_2 + 2x_3 + 3x_4 = 0 \\ x_1 + x_2 - x_3 + x_4 = 0 \end{cases}\]

Il problema dei polli e conigli nel cortile ‘e tratto da una poesia di Elio Pagliarani, intitolata “La merce esclusa”. E divertente leggere la soluzione proposta nel medesimo testo ‘ e qui di seguito riportata con alcune (lievi) variazioni rispetto all’originale.

Si consideri una specie di animale a sei zampe e due teste: il conigliopollo.

Ci sono nel cortile $56$ zampe diviso $6$ zampe $=$ $9$ coniglipolli, nove coniglipolli che necessitano di $9 \times 2 = 18$ teste. Restano dunque $18 − 18 = 0$ teste nel cortile. Ma questi animali hanno $9 \times 6 = 54$ zampe allora $56 − 54 = 2$.

Restano due zampe nel cortile. Si consideri quindi un’altra specie di animale, che potrebbe essere il coniglio spollato, che ha $1$ testa $−1$ testa $=$ 0 teste, 4 zampe $−2$ zampe $=$ 2 zampe: le due zampe che stanno nel cortile. C’è dunque nel cortile 9 coniglipolli $+ 1$ coniglio spollato. Detto in altri termini 9 conigli $+9$ polli $+1$ coniglio $−1$ pollo. Ed ora i conigli coi conigli e i polli coi polli, si avrà $9 + 1 = 10$ conigli, $9 − 1 = 8$ polli.

Provate a riscrivere la stessa soluzione in linguaggio più algebrico. Cosa intende dire l’autore con “i conigli coi conigli e i polli coi polli”?

Nella tradizione occidentale, uno dei primi sistemi lineari di cui si ha notizia storica e l’epantema di Timarida, oggi piu simile ad un gioco enigmistico che ad un problema matematico: Paperino, Qui, Quo e Qua pesano assieme 150 kg. Paperino e Qui pesano assieme 91 kg, Paperino e Quo pesano assieme 90 kg, Paperino e Qua pesano assieme 89 kg. Quanto pesa ciascun papero?