20 de maig de 2024

Introducció destinada (sobretot) a professors

Els darrers anys els qui ens dediquem a la docència en el camp de l’àlgebra lineal hem anat modificant-ne els continguts i els punts de vista, en part per l’evolució del format dels estudis universitaris, però també (i molt més) per l’impacte dels canvis tecnològics, especialment els informàtics, quant a la nostra capacitat real d’aplicar les matemàtiques a problemes de grans dimensions (sense fer servir recursos de grans dimensions). Amb això no vull dir que l’objectiu d’un primer curs d’àlgebra lineal siga el de tractar aquest tipus de problemes; més que d’abordar els problemes numèrics, es tracta de conéixer l’àlgebra lineal d’una manera adequada per a després estar en disposició d’entendre les estratègies numèriques (potser en un curs d’àlgebra lineal numèrica o potser en diverses matèries que la fan servir). L’àlgebra lineal no és el mateix que l’àlgebra lineal numèrica, però una comprensió correcta de la segona depén molt de com enfoquem la primera.

Parlant de matemàtiques (i passeu-me les exageracions), hi ha dos tipus de llibres de text: uns de molt grossos, amb moltes pàgines i grans dimensions que diuen molt poques coses, però que les expliquen molt bé, amb tots els detalls i força exemples; els altres, petits, amb poques pàgines, dimensions reduïdes i una tipografia menuda, que diuen moltes coses, perfectament justificades i que als estudiants els costa molt d’entendre. En el límit, ens trobaríem amb un llibre molt petit, que ho diu tot, ho defineix tot amb precisió i ho demostra tot, o amb un patracol grandíssim que no diu res, no defineix res i no demostra res. Així que he intentat fer un llibre de dimensions mitjanes, que diga algunes coses, que les justifique d’una manera adequada per al públic al qual va dirigit, que cobrisca els aspectes bàsics de la matèria, els que a la pràctica s’inclouen habitualment en un primer curs en el nostre entorn universitari.

He escrit aquest llibre pensant en un públic potencial molt ampli: qualsevol estudiant que haja de fer un curs d’àlgebra lineal, ço és, qualsevol estudiant de ciències o enginyeria, la qual cosa implica que haurà de satisfer unes necessitats ben diverses. Així que la qüestió és aquesta: com hem d’escriure, si escrivim matemàtiques per a estudiants (no necessàriament per a estudiants de matemàtiques, però també)? Què hi hem de dir i com ho hem de dir? La citació de Halmos que obre aquesta introducció amaga l’essència de la qüestió: Esteu autoritzat a dir alguna petita mentida, però el que no podeu fer mai és enganyar. No és necessari (ni una bona idea) que justifiquem absolutament i perfectament tot el que diem; però el conjunt ha de ser rigorós i, bàsicament, ben justificat. En aquest llibre es justifica tot (o quasi tot) el que es diu,Unes vegades, l’enunciat d’una propietat va seguit d’una demostració explícita; altres vegades, però, hi ha un raonament previ a l’enunciat que el fa evident. I, en algun cas, les demostracions es troben en un annex al final de la lliçó, per tal de fer-les opcionals sense interferir el discurs principal. I també hi ha coses que no es demostren, especialment algunes propietats més o menys immediates o quan la prova consisteix en una comprovació tediosa. però s’hi posa més èmfasi en el significat dels conceptes, en la utilitat d’aquests conceptes i en els mètodes de resolució dels problemes que no en les propietats i les demostracions. També és Halmos qui diu que

El problema bàsic a l’hora d’escriure matemàtiques és el mateix que el d’escriure biologia, el d’escriure una noveŀla o el d’escriure les instruccions per muntar un clavicèmbal: el problema és comunicar una idea. Per fer-ho i fer-ho clarament, heu de tenir alguna cosa a dir i haureu de tenir algú a qui dir-ho, heu d’organitzar el que voleu dir i organitzar-ho en l’ordre en què voleu que es diga, ho heu d’escriure, reescriure i tornar-ho a escriure diverses vegades, i heu d’estar disposat a pensar i treballar molt en detalls mecànics com la dicció, la notació i la puntuació. Això és tot el que hi ha…

He intentat seguir el consell: pensar què és el que vull dir (si se suposa que parlem d’àlgebra lineal) i en qui vull que ho llegisca. I escriure-ho i reescriure-ho tant com calga, mirant també de no destrossar massa l’idioma.

Abans de començar a escriure’l, vaig llegir molts llibres de text d’àlgebra lineal, que han influït poderosament (si més no quant als punts de la matèria que crec que convé marcar com a bàsics, o —equivalentment— sobre quins són els continguts que convé destacar) en aquest llibre.

Continguts

Parlem dels continguts. En realitat, més que els continguts, el que pot ser discutible és l’ordre en què els presentem, aquests continguts (i la importància que els atribuïm). Perquè aquesta ordenació condiciona, i molt, la manera en què els presentarem. Si trieu a l’atzar un llibre de text d’àlgebra lineal, és possible que trobeu un índex com aquest: Teoria de conjunts; grups, anells i cossos; espais vectorials; aplicacions lineals; matrius i determinants; sistemes d’equacions lineals; espai vectorial euclidià; diagonalització. Un índex com aquest respon a una visió diguem-ne tradicional de la matèria (o, més que de la matèria, de l’enfocament amb què cal presentar-la). Els dos primers ítems d’aquest índex no són propis de l’àlgebra lineal. Jo no ho he fet, però no posaré cap objecció a una introducció lleugera a la teoria intuïtiva de conjunts, que assegure que l’estudiant sap què signifiquen els símbols \(\in\), \(\subset\), \(\cup\), \(\cap\) i \(\emptyset\), què és una aplicació i poca cosa més, simplement perquè els gargots que dibuixa el professor no li semblen escriptura jeroglífica o sànscrita. La notació matemàtica —que bàsicament és la notació de la teoria de conjunts— és ben útil per assegurar precisió (i concisió) en allò que s’escriu, però quan la fem servir extensivament per comunicar-nos amb algú que no la coneix bé, el que hauria de ser clarificador es converteix en un entrebanc. En algun moment cal transmetre a l’estudiant les idees bàsiques sobre conjunts i aplicacions i, com que en la majoria d’estudis de ciències o enginyeria, al nostre país, no hi ha una matèria de matemàtica bàsica, un primer curs d’àlgebra lineal és un lloc tan bo com qualsevol altre per a incloure-les. Però parlar d’estructures algèbriques, simplement perquè un espai vectorial és un grup abelià amb una operació externa sobre un cos, és absolutament innecessari, sobretot, perquè l’àlgebra lineal és alguna cosa diferent d’una part de l’àlgebra. La resta del llibre inclouria, més o menys, els continguts raonables en un curs d’àlgebra lineal, però els presenta en un ordre que implica un nivell d’abstracció contrari al que des d’un punt de vista pedagògic sembla recomanable, perquè la manera en què s’organitzen els continguts no és precisament la més amigable: desenvolupar una teoria d’espais vectorials i aplicacions lineals per a, després, resoldre un sistema d’equacions lineals és perfectament coherent, però dubtosament pedagògic. És per això que, en un text modern, és més probable que els continguts siguen, aproximadament, sistemes d’equacions lineals i matrius; determinants; espais vectorials i aplicacions lineals; diagonalització; productes escalars i espais euclidians. Amb algunes matisacions, aquesta és l’estructura d’aquest llibre.

He retardat la presentació dels determinants fins al moment que estudiarem la diagonalització; i he situat aquí els determinants per dos motius: perquè no té massa sentit fer-los servir per atacar problemes que amb l’ús de les operacions elementals es resolen d’una manera molt més eficient i perquè quan de veritat els farem servir és quan calcularem els valors propis. És cert que podem prescidir-ne per complet (dels determinants), Vegeu, per exemple, l’article Down With Determinants, de Sheldon Axler, o el llibre del mateix autor Linear Algebra Done Right. però em sembla que tampoc no cal bandejar per complet una eina que l’estudiant (segurament) ja coneix, que li resultarà útil en altres matèries i que ens proporciona una justificació directa del fet que els valors propis són les arrels de l’equació característica. En canvi, el producte escalar (en \(\mathbb K^n\)) l’introduesc des del primer moment, com una operació entre vectors, perquè d’aquesta manera les qüestions geomètriques van sempre de la mà de les algèbriques. I una altra decisió important que he pres ha estat de treballar sempre amb nombres reals o complexos; perquè, excepte en allò que fa referència a la diagonalització, no hi ha cap diferència significativa entre el cas real i el complex, així que un plantejament del tipus treballem amb nombres reals fins que arribem cap al final del curs i llavors diem que tot el que hem fet fins ara també és vàlid amb nombres complexos no aporta res a la facilitat de comprensió per part de l’estudiant. Tot i això, a quasi tots els exemples i exercicis treballem amb nombres reals (enters o racionals, de fet).

L’he dividit en quatre llibres (parts), nou capítols i trenta-dues lliçons, tot i que, realment, la unitat didàctica important és la lliçó. D’aquestes lliçons, la primera (la lliçó zero) més que una lliçó és el recull d’uns quants problemes on s’apliquen les tècniques que exposarem al llarg del curs; i les lliçons 1, 2, 25 i 29 són opcionals (les dues primeres contenen alguns prerequisits; la 25 tracta les aplicacions clàssiques dels determinats i, la 29, la forma reduïda de Jordan, que pot no ser inclosa al curs). També es pot evitar la lliçó 21 (espais vectorials euclidians), però em sembla interessant incloure-la pel fet que realment aquests espais (més que no pas els espais vectorials) són la generalització dels espais \(\mathbb K^n\) i perquè en molts problemes d’optimització els valors òptims estan lligats a l’ortogonalitat.

Els tres primers llibres es corresponen amb tres punts de vista possibles a prop del que és l’àlgebra lineal (l’estudi dels sistemes d’equacions lineals; el dels espais vectorials i les aplicacions lineals; l’art de factoritzar matrius de diverses maneres):

El llibre primer, \(\mathbf{A\vec x=\vec b}\), tracta els sistemes d’equacions lineals i les matrius: en el capítol primer posem tot l’èmfasi en l’algorisme de Gauss-Jordan que presentem inicialment com una manera simple però estructurada de reduir un sistema lineal a una forma en la qual la discussió i la resolució siguen trivials, però que immediatament interpretem com una aplicació sistemàtica de les operacions elementals i els productes per matrius elementals; en el segon capítol, estudiem especialment les matrius inverses i les matrius relacionades amb la geometria, és a dir, les matrius hermítiques i les unitàries. Els meus objectius, en aquesta primera part, són de convéncer l’estudiant que discutir (i resoldre) un sistema lineal és justificar que un vector és combinació lineal d’uns altres vectors donats (i trobar els pesos d’aquesta combinació lineal); que l’operació important és el producte matriu-vector (perquè una matriu és una llista de vectors i aquest producte és una combinació lineal); que les operacions elementals, que són l’eina bàsica dels algorismes d’esglaonament, són multiplicacions de matrius (així que els algorismes del tipus Gauss són en realitat multiplicacions de matrius); i que les matrius diagonals i les triangulars són útils perquè ens faciliten la resolució dels problemes, però les matrius unitàries (o ortogonals, si pensem en termes reals) són les més importants perquè els conjunts de vectors ortonormals són els més adequats en termes geomètrics. A més, hi he inclòs un capítol zero, amb dues lliçons opcionals on presentem els dos prerequisits únics de l’assignatura: els nombres complexos i els polinomis. És possible que molts alumnes no coneguen (o no tinguen gaire seguretat amb) els nombres complexos; els polinomis sí que els han estudiats, però aquest curs requereix que l’estudiant tinga perfectament clar què és el que diu el teorema fonamental de l’àlgebra i quin és el seu significat en termes de factorització de polinomis.

El llibre segon, \(\mathbf{f(\vec x)=A\vec x}\), estudia els espais vectorials i les aplicacions lineals; en el cas dels espais vectorials, comencem, al capítol tercer, amb els espais \(\mathbb K^n\) i els seus subespais i mostrem els quatre subespais que es dedueixen de manera natural d’una matriu; dediquem un altre capítol a les qüestions relatives a l’ortogonalitat (complements ortogonals i projeccions, mínims quadrats i la factorització QR); finalment, al capítol cinquè, definim els espais vectorials generals (sempre sobre els nombres reals o complexos), els espais euclidians i les aplicacions lineals. El capítol cinquè és el més abstracte del curs, però l’estudiant no hi deuria trobar gaire problema en estudiar-lo, atesos els coneixements que ja ha adquirit. Quins objectius hauríem d’assolir al llibre segon? primer de tot, mostrar que \(\mathbb K^n\) és un espai de dimensió \(n\) i que això vol dir que totes les bases tenen \(n\) vectors; que un espai és un conjunt de vectors en el qual es poden fer combinacions lineals; quins subconjunts de \(\mathbb K^n\) són subespais i quines dimensions tenen; que una matriu qualsevol defineix quatre subespais, les dimensions dels quals venen determinades per les dimensions i el rang de la matriu; i quines relacions d’ortogonalitat hi ha, entre aquests subespais; això ens porta a un segon bloc d’objectius: la relació entre l’ortogonalitat (i l’aproximació òptima) amb el problema de mínims quadrats, entés com la cerca de la millor solució d’un sistema incompatible. Finalment, presentar les aplicacions lineals i els problemes de canvi de base.

El llibre tercer l’he titulat \(\mathbf{A= U\Sigma V^*}\). Aquest títol és, diguem-ho així, una declaració de principis: d’una manera o una altra, en qualsevol curs d’àlgebra lineal s’estudia la diagonalització (i, de vegades, la forma reduïda de Jordan); però la descomposició en valors singulars sol associar-se a l’àlgebra lineal numèrica i gairebé mai no forma part del currículum de l’assignatura diguem-ne bàsica. Des del meu punt de vista, la millor manera de culminar el curs és explicant que (si més no, en els espais euclidians de dimensió finita) una aplicació lineal sempre és un isomorfisme entre dos subespais (els espais fila i columna d’una matriu o, si voleu, l’ortogonal del nucli i la imatge de l’aplicació) i que, si escollim les bases de manera adequada, aquest isomorfisme transforma una base ortonormal (de l’espai fila) en una base ortogonal (de l’espai columna). I, com que les millors bases són les ortonormals i les millors matrius les diagonals, la factorització en valors singulars és un final perfecte. L’objectiu principal d’aquest bloc darrer és d’entendre la diagonalització i la factorització en valors singulars d’aquesta manera, és a dir, que les bases de vectors propis i les de vectors singulars són les que descriuen més bé les aplicacions lineals. El llibre conté tres capítols on estudiem els determinants, la diagonalització (i les seues aplicacions) i la factorització en valors singulars (i la pseudoinversa).

Al cos del text principal s’inclouen força exemples que justifiquen les idees i les propietats, però que també són models de resolució dels exercicis. Molts dels exercicis que hi ha a cada lliçó són semblant als exemples que hi hem mostrat, però la millor manera que té l’estudiant d’assegurar-se que coneix la matèria és resolent aquest tipus d’exercicis.

El llibre quart conté les solucions detallades de tots els exercicis.

Qüestió de noms (i de notacions)

Malauradament (o no), tots tenim les nostres manies i, en allò que fa als noms i als símbols, no hi ha un consens totalment generalitzat. Jo intente fer servir la nomenclatura més general i, alhora, la que em sembla més amigable per a l’estudiant. Com que les dues coses són incompatibles, segurament he pres algunes decisions discutibles.

Aquestes en són algunes:

  • Un vector de \(\mathbb K^n\) és una llista de nombres, una columna, \(\vec u=\begin{bmatrix} u_1 \\ u_2\\ \cdots \\ u_n \end{bmatrix}\). Però, per comoditat i estètica, el podem escriure com \(\vec u=(u_1,u_2,\dots,u_n)\).
  • Els vectors els represente amb una lletra amb una fletxa a sobre: \(\vec u\). Perquè la negreta minúscula és irreproduïble quan escrivim a mà (algú fa servir la negreta de pissarra —com ara, 𝕦— però no és un ús generalitzat) i, sobretot, perquè la intuïció que els vectors són segments orientats és ben adequada.
  • Per representar les matrius faig servir majúscules de pal sec, com ara, \(\mathsf A\) (però la matriu identitat és \(I\)).
  • Una matriu és d’un arranjament rectangular de nombres, però és millor veure-la com una llista de vectors. Així que estenc a les columnes (que són vectors) el costum de representar les entrades de la matriu \(\mathsf A\) amb la minúscula corresponent al nom de la matriu (\(\vec a_1,\vec a_2,\dots\)). Les files no són vectors, així que les represente amb la majúscula (\( A_1, A_2,\dots\)): \[ A=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \cdots\\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}=\begin{bmatrix} \vec a_{1} & \vec a_{2} & \cdots &\vec a_{n} \end{bmatrix}=\begin{bmatrix} A_{1} \\ A_{2} \\ \cdots \\ A_{m} \end{bmatrix}\]
  • Com que les matrius elementals es fan servir força en aquest llibre, és molt convenient fixar-hi una notació: \(E_{i,j}\), \(E_i(\alpha)\) i \(E_{i,j}(\alpha)\) representen la permutació de dues files, l’escalat d’una fila i la suma d’un múltiple d’una fila a una altra fila en la matriu identitat. Aquesta notació és una mica defectiva, perquè no s’hi té en compte l’ordre de la matriu, però escriure coses com \(E_{n,i,j}(\alpha)\) em sembla excessiu.
  • Els conjunts, en general, els escric amb majúscules itàliques (\(S\), per exemple), però per a les bases gaste les caligràfiques (\(\mathcal B\)).
  • El teorema de Rouché és de Rouché (això de Rouché-Frobenius s’ho inventà Rey Pastor, i només es diu als països hispànics).
  • Entre matrius regulars, no singulars i invertibles, invertible em sembla el millor nom (perquè defineix perfectament la cosa).
  • La matriu adjunta no és la matriu dels cofactors, sinó la transposada conjugada, \(A^*\), perquè això és coherent amb els operadors adjunts. Aquesta matriu (o més ben dit, la matriu \(A^*A\)) té un paper central al llibre (en canvi, la matriu dels cofactors només hi apareix tangencialment).
  • Hi ha factoritzacions LU estrictes i no estrictes, segons que la matriu \(L\) siga o no triangular inferior. Perquè, normalment, en la teoria s’exigeix aquesta condició, però el programari tipus Scilab no ho fa i a efectes numèrics no aporta res.
  • Una matriu no té nucli i imatge, sinó espai nul i espai columna. Són les aplicacions lineals, les que tenen nucli i imatge.
  • Les matrius importants són les unitàries, perquè les bases més útils són les ortonormals. Per això, les factoritzacions de matrius més interessants són la factorització en valors singulars i la diagonalització de matrius normals.

Bona part dels mèrits que puga tenir aquest llibre són deguts a molts amics, amb els quals m’he divertit molt parlant de matemàtiques, especialment a Carmen Alegre, Rafa Bru, Cristina Corral, Ramon Esteban i Vicent del Olmo, que han tingut l’amabilitat de llegir-lo, de fer-me suggeriments i de descobrir errades, a més de fer-ne alguns comentaris elogiosos. Ja sé que, aquests elogis, són deguts en gran part a l’estima que em tenen, però vull creure que alguna cosa positiva hi deuen haver trobat.