Une démonstration du théorème de d'Alembert

Cela fait belle lurette que personne n'en doute :
Sachez donc qu'en chaque équation, autant que la quantité inconnue a de dimensions, autant il peut y avoir de diverses racines, c'est-à-dire de valeurs de cette quantité. [...]
Qui parle de manière aussi péremptoire ? Descartes, en 1637. Il n'était pas le premier à le dire, tout polynôme de degré $ n$ a $ n$ racines (éventuellement complexes et/ou multiples). Ou bien simplement: tout polynôme à coefficients réels admet une racine réelle ou complexe; c'est ce que réaffirme d'Alembert, un bon siècle plus tard.
Soit un multinôme quelconque $ x^m+ax^{m-1}
+bx^{m-2}+\cdots+fx+g$, tel qu'il n'y ait aucune quantité réelle qui étant substituée à la place de $ x$, y fasse évanouir tous les termes, je dis qu'il y aura toujours une quantité $ p+q\sqrt{-1}$ à substituer à la place de $ x$, et qui rendra ce multinôme égal à zéro.
Euler et d'Alembert ont eu un mérite : celui d'être les premiers à se poser la question d'une démonstration. Euler en parle pour la première fois en 1742 dans une lettre à Nicolas Bernoulli, où il affirme que chaque polynôme à coefficients réels s'écrit comme un produit de monômes et de binômes à coefficients réels. Quelques mois plus tard, Euler annonce qu'il a trouvé une démonstration, mais qu'elle n'est «pas encore assez rigoureuse» Il présentera finalement cette démonstration le 10 novembre 1746. C'est le 6 décembre 1746 que d'Alembert envoie la sienne. Il indique en passant qu'Euler aurait «fait mention d'un ouvrage, où il a démontré en général la proposition dont il est question - ouvrage qui n'est pas encore publié». Encore de quoi alimenter une des nombreuses polémiques qui ont émaillé la vie des deux savants. Pour vous donner une idée du ton, voici un extrait d'une lettre d'Euler de 1757, à propos de d'Alembert.
Il avoit prétendu aussi que j'insérasse de nouvelles déclarations sur quantités d'articles que je lui avois volé. Mais ma patience est poussée à bout, et je lui ai fait répondre que je n'en ferois rien, et qu'il puisse publier lui-même ses prétentions partout où il veut, et que je ne m'y opposerois point. Il aura de quoi remplir l'article de prétention dans l'Encyclopédie.
Les deux démonstrations d'Euler et d'Alembert étaient encore bien incomplètes selon nos critères. Voici ce qu'en disait Gauss en 1799, dans sa thèse (il était alors âgé de 22 ans).
Si on mène des opérations avec ces racines impossibles, comme si elles existaient, et si on dit par exemple, que la somme de toutes les racines de l'équation $ x^m+ax^{m-1}+bx^{m-2}+\cdots=0$ est égale à $ -a$ même si certaines d'entre elles peuvent être impossibles (ce qui signifie réellement : même si certaines sont non-existantes et donc manquantes), alors je ne peux que dire que je désapprouve totalement ce genre d'argument.
Gauss donnera au cours de sa carrière 4 démonstrations différentes du théorème : celle de 1799, encore incomplète, deux en 1816 et une dernière en 1849, cinquante ans après la première ! Il ne fut pas le seul. Voici comment Cauchy introduit sa «Seconde note sur les racines imaginaires des équations», publiée au Bulletin de la Société Philomatique en 1817.
Qu'il soit toujours possible de décomposer un polynôme en produit de facteurs réels du premier et du second degré ; ou, en d'autres termes, que toute équation, dont le premier membre est une fonction rationnelle ou entière de la variable $ x$, puisse toujours être vérifiée par des valeurs réelles ou imaginaires de cette variable : c'est une proposition que l'on a déjà prouvée de plusieurs manières. MM. Lagrange, Laplace et Gauss ont déjà employé diverses méthodes pour l'établir ; et j'en ai moi-même donné une démonstration fondée sur des considérations analogues à celles dont M. Gauss a fait usage.
Fort bien: le théorème pourrait donc s'appeler «théorème d'Euler-d'Alembert-Lagrange-Laplace-Gauss-Cauchy». Allons au plus simple : c'est le théorème fondamental de l'algèbre. Peut-être, sauf qu'il n'existe aucune justification purement algébrique. Toutes les démonstrations connues (et elles sont nombreuses), passent à un moment ou un autre par des arguments d'analyse. Celle que nous allons vous présenter n'utilise que les outils de ce chapitre. Nous allons commencer par étendre à des boules fermées dans $ \mathbb{C}$ ce qui vous est bien connu pour les intervalles fermés bornés de $ \mathbb{R}$: toute fonction continue atteint son minimum.

Proposition 4   Soit $ r$ un réel strictement positif, et $ D_r=\{z\in\mathbb{C} ,\;\vert z\vert\leqslant r\}$ le disque fermé de rayon r. Soit $ f$ une fonction continue sur $ D_r$, à valeurs dans $ \mathbb{R}$. Il existe $ z_0\in D_r$ tel que :

$\displaystyle f(z_0) = \inf\{f(z) ,\;z\in D_r\}\;.
$

Démonstration : Vous n'avez pas manqué de remarquer que nous n'avons pas vraiment dit ce que signifie «continue sur $ D_r$». Vous auriez pu écrire vous même la définition :

$\displaystyle \forall x\in D_r ,\;\forall \varepsilon >0 ,\;\exists \eta>0\;,\quad
\vert y-x\vert<\eta\;\Longrightarrow\;\vert f(y)-f(x)\vert<\varepsilon \;.
$

Mais au fait : en tant que fonction d'une variable complexe, $ f$ est aussi fonction de deux variables réelles : la partie réelle et la partie imaginaire. La continuité définie ci-dessus est-elle bien celle de la définition 4 ? Oui, et vous êtes priés de le démontrer à titre d'exercice (Indication : tout disque contient un carré et réciproquement). Tant que vous y serez, vous démontrerez aussi que si $ P$ est un polynôme à coefficients complexes, la fonction $ z\longmapsto \vert P(z)\vert$ est continue sur $ D_r$, pour tout $ r>0$. Nous commençons par montrer par l'absurde que la fonction $ f$ est minorée sur $ D_r$. Si ce n'était pas le cas, il existerait une suite $ (z_n)$ d'éléments de $ D_r$ tels que :

$\displaystyle \forall n\in \mathbb{N}\;,\quad f(z_n)<-n\;.
$

La suite $ (\vert z_n\vert)_{n\in\mathbb{N}}$ est une suite de réels dans $ [0,r]$. D'après le théorème de Bolzano-Weierstrass, il existe une sous-suite $ (\vert z_{\varphi(k)}\vert)_{k\in\mathbb{N}}$ convergente. Mais les arguments des complexes $ z_{\varphi(k)}$ forment une suite de réels à valeurs dans $ [0,2\pi]$. Toujours par Bolzano-Weierstrass, on peut encore extraire une sous-suite de la précédente, disons $ (z_{\psi(h)})_{h\in\mathbb{N}}$ telle que la suite des arguments converge. Mais comme cette suite est extraite de la précédente, la suite des modules converge aussi. Donc la suite converge, vers un complexe $ z$ de $ D_r$. Puisque $ f$ est continue, $ \vert f(z_{\psi(h)})-f(z)\vert$ tend vers 0. C'est impossible car $ f(z_{\psi(h)})$ tend vers $ -\infty$. Donc $ f$ est bien minorée sur $ D_r$, et l'image de $ f$ admet une borne inférieure. Posons

$\displaystyle m=\inf\{ f(x) ,\;x\in D_r\}\;.
$

Par définition de la borne inférieure, il existe une suite $ (z_n)_{n\in\mathbb{N}}$ d'éléments de $ D_r$ telle que

$\displaystyle \lim_{n\to+\infty} f(z_n)=m\;.
$

Bon : extraire de cette suite une sous suite convergente, et démontrer que l'image de la limite est bien $ m$ ne devrait pas vous poser trop de problèmes non ?$ \square$

Théorème 21 (fondamental de l'algèbre)   Soit $ n\in\mathbb{N}^*$, et $ a_0,\ldots,a_n\in\mathbb{C}$, avec $ a_n\neq 0$. La fonction polynôme

$\displaystyle z\longmapsto P(z)=a_0+a_1z+\cdots+a_nz^n$

s'annule sur $ \mathbb{C}$.

Démonstration : Nous allons démontrer
  1. que la fonction $ z\longmapsto \vert P(z)\vert$ atteint son minimum dans $ \mathbb{C}$,
  2. que ce minimum est nul.
Nous commençons par montrer que $ \vert P(z)\vert$ est forcément supérieur à $ \vert P(0)\vert=\vert a_0\vert$ en dehors d'un certain disque $ D_r$. En effet :
$\displaystyle \vert P(z)\vert$ $\displaystyle =$ $\displaystyle \displaystyle{\left\vert z^n\left(a_n+\frac{a_{n-1}}{z}+\cdots+\frac{a_1}{z^{n-1}}
+\frac{a_0}{z^{n}}\right)\right\vert}$  
  $\displaystyle \geqslant$ $\displaystyle \displaystyle{\vert z^n\vert\left(\vert a_n\vert-
\left(\frac{\ve...
...rt}{\vert z\vert^{n-1}}
+\frac{\vert a_0\vert}{\vert z\vert^{n}}\right)\right)}$  

Le terme de la deuxième parenthèse tend vers 0 quand $ \vert z\vert$ tend vers l'infini. Il existe $ M$ tel que pour $ \vert z\vert>M$,

$\displaystyle \vert P(z)\vert>\vert z\vert^n\frac{\vert a_n\vert}{2}\;.
$

Donc il existe $ r>0$, tel que pour $ \vert z\vert>r$, $ \vert P(z)>\vert a_0\vert=\vert P(0)\vert$. Notons $ m$ le minimum de $ \vert P(z)\vert$ sur $ D_r$, et $ z_0$ le point où il est atteint (en vertu de la proposition précédente) :

$\displaystyle \vert P(z_0)\vert=m\leqslant \vert P(0)\vert=a_0<\vert P(z)\vert ,\;\forall z\notin D_r\;.
$

Donc $ m$ est le minimum de $ \vert P(z)\vert$ sur $ \mathbb{C}$ tout entier. Nous allons démontrer par l'absurde que $ m=0$. Posons :

$\displaystyle Q(z)=P(z_0+z)=b_0+b_kz^k+\cdots+b_nz^n\;,
$

$ \vert b_0\vert=m$ et $ k$ est le premier entier $ >0$ tel que $ b_k$ est non nul. Soit $ c$ une racine $ k$-ième de $ -b_0\overline{b_k}$, et $ t$ un réel, tel que $ 0<t<1$ et $ \vert b_k\vert^2t^k<1$.
$\displaystyle \vert Q(ct)\vert$ $\displaystyle =$ $\displaystyle \vert b_0+b_k(-b_0\overline{b_k})t^k
+b_{k+1}c^{k+1}t^{k+1}+\cdots+b_nc^nt^n\vert$  
  $\displaystyle =$ $\displaystyle \vert b_0-b_0\vert b_k^2\vert t^k
+b_{k+1}c^{k+1}t^{k+1}+\cdots+b_nc^nt^n\vert$  
  $\displaystyle \leqslant$ $\displaystyle m(1-\vert b_k\vert^2t^k)+\vert b_{k+1}c^{k+1}t^{k+1}+\cdots+b_nc^nt^n\vert$  
  $\displaystyle \leqslant$ $\displaystyle m(1-\vert b_k\vert^2t^k)+t^{k+1}\Big(\vert b_{k+1}c^{k+1}\vert+\cdots+\vert b_nc^n\vert\Big)$  
  $\displaystyle =$ $\displaystyle m(1-\vert b_k\vert^2t^k)+Ct^{k+1}\;,$  

$ C$ est une constante (rappelons que $ 0<t<1$). Si $ m$ est non nul, La fonction $ t\longmapsto m(1-\vert b_k\vert^2t^k)+Ct^{k+1}$ prend des valeurs strictement négatives au voisinage de $ 0^+$, donc il existe des complexes $ ct$ tels que $ \vert Q(ct)\vert<m$, ce qui contredit la définition de $ m$. Donc $ m$ est nul et $ z_0$ est racine de $ P$.$ \square$

         © UJF Grenoble, 2011                              Mentions légales