Un Ordinateur est-il une Parfaite Machine a Calculer ?

Jean-François COLONNA
[Contact me]

www.lactamme.polytechnique.fr

CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641, École polytechnique, Institut Polytechnique de Paris, CNRS, France

[Site Map, Help and Search [Plan du Site, Aide et Recherche]]
[The Y2K Bug [Le bug de l'an 2000]]
[N'oubliez pas de visiter Une Machine Virtuelle à Explorer l'Espace-Temps et au-delà où vous trouverez plus de 10.000 images et animations à la frontière de l'Art et de la Science]
(Site WWW CMAP28 : cette page a été créée le 13/02/2010 et mise à jour le 03/10/2024 17:10:11 -CEST-)

[in english/en anglais]

Résumé : Un ordinateur est une machine à calculer programmable à la fois finie et discrète. La plupart des nombres et en particulier les nombres réels ne peuvent donc pas y être mémorisés et manipulés exactement. Dans la plupart des calculs, cela introduit des erreurs d'arrondi qui, principalement dans les problèmes sensibles aux conditions initiales, peuvent se propager et s'amplifier. Les propriétés mathématiques usuelles, telle l'associativité, sont perdues et ainsi, deux ordinateurs différents aux niveaux matériel et/ou logiciel pourront donner à partir d'un même programme des résultats différents.

Mots-Clefs : Nombres réels, Nombres Flottants, Erreurs d'arrondi, Associativité, Ordinateur, Real Numbers, Floating point numbers, Rounding-off errors, Associativity, Computer..

Les ordinateurs sont partout et lorsque l'on voit leurs performances, par exemple, dans le domaine des jeux vidéos on a trop tendance à oublier que fondamentalement ils ne "savent" faire que les quatre opérations arithmétiques élémentaires (addition, soustraction, multiplication et division). Face donc à leur omniprésence, il est essentiel de savoir s'ils effectuent correctement ces calculs de base auxquels tout doit se ramener.

Toutes les valeurs numériques que nous utilisons sont exprimées en base 10. Rappelons que, par exemple, l'écriture '5039.28' signifie :
```
                        3       2       1       0       -1       -2
                    5x10  + 0x10  + 3x10  + 9x10  + 2x10   + 8x10
```
Malheureusement, la base 10 ne peut être utilisée dans un ordinateur car pour ce faire il faudrait pouvoir disposer de systèmes physiques à dix états d'équilibre or ceux-ci seraient très difficiles à concevoir et à réaliser. Par contre, nombreux sont les systèmes à deux états d'équilibre et par exemple un interrupteur électrique qui est soit ouvert soit fermé. C'est donc la base 2 qui sera utilisée dans les ordinateurs.

Pour entrer un nombre décimal (base 10) dans un ordinateur, il faudra donc le convertir en binaire (base 2) et inversement pour sortir une valeur binaire d'un ordinateur, il conviendra de la convertir en décimal. A l'intérieur d'un ordinateur, il y a deux types principaux de nombres que les micro-processeurs peuvent manipuler directement :
- Les nombres entiers {...,-2,-1,0,+1,+2,...}.
- Les nombres flottants dont le principe, pour simplifier, consiste à ramener la valeur absolue de tout nombre dans [1,10[ grace à une multiplication par une puissance de 10 appropriée (négative, nulle ou positive). Ainsi, par exemple : -5039.28=-5.03928x10³ Un nombre flottant sera donc défini par un petit nombre décimal (appelé mantisse) et un exposant (respectivement -5.03928 et +3 dans l'exemple précédent).

La mémoire des ordinateurs contiendra donc des chiffres binaires 0 et 1 (ou bits contraction de l'anglais binary digits). Leur capacité pourra être énorme (par exemple mille milliards de bits), mais, et cela est très important à retenir, elle sera toujours finie (il en serait évidemment de même avec toute autre base de numération !).

En général, les nombres entiers sont définis à l'aide de 32 bits : un bit pour le signe (0 et 1 signifiant respectivement '+' et '-') et 31 bits pour la valeur absolue. Ainsi, seuls les nombres entiers de -2147483648 à +2147483647 seront représentables et manipulables. La représentation binaire des entiers est exacte ; ainsi, par exemple le nombre 25 s'écrira avec 32 bits :
```
                    
                    00000000000000000000000000011001
```
car :
```
                                         4      3      2      1      0
                    25 = 16 + 8 + 1 = 1x2  + 1x2  + 0x2  + 0x2  + 1x2  = 11001
```
En ce qui concerne les nombres flottants, 64 bits leurs sont réservés (il convient d'ajouter qu'il existe aussi une représentation n'utilisant que 32 bits, mais que celle-ci sera ignorée par soucis de simplicité). L'inventaire exhaustif des nombres alors accessibles est délicat à réaliser mais de toute évidence leur nombre est fini. A titre d'exemple le nombre pi (dont 12.100.000.000.050 décimales sont connues au mois de décembre 2013) ne peut donc être représenté exactement dans un ordinateur. La représentation flottante des nombres décimaux sera plus compliquée que celle des entiers, mais surtout elle sera en général approximative ; ainsi, par exemple le nombre décimal 0.1 s'écrira avec 64 bits (sans plus d'explications...) :
```
                    1001 1001 1001 1001 1001 1001 1001 1010 0011 1111 1011 1001 1001 1001 1001 1001
```
dont la valeur est très proche de 0.1 sans toute fois l'égaler car, en effet, la somme d'un nombre fini d'inverses de puissances de 2 ne peut être égale à 0.1 !

Intéressons-nous à quelques conséquences malheureuses de cela lors de calculs utilisant les nombres flottants.

Les nombres flottants ne sont pas des nombres au sens mathématique du terme car, en effet, en ce qui concerne l'addition et la multiplication, les propriété d'associativité et de distributivité sont perdues. Rappelons que ces propriétés signifient respectivement :

                    
                    (AxB)xC = Ax(BxC)
                    (A+B)+C = A+(B+C)


                    Ax(B+C) = AxB+AxC

pour tout triplet de nombres 'A', 'B' et 'C'. Vérifions-le pour l'associativité en essayant les deux petits programmes suivant écrits dans le langage C (ces programmes sont communiqués au lecteur afin de permettre à tout un chacun de reproduire le phénomène) :

                    
          double    addition(x,y)                                                         double    multiplication(x,y)
          double    x;                                                                    double    x;
          double    y;                                                                    double    y;
                    {                                                                               {
                    return(x+y);                                                                    return(x*y);
                    }                                                                               }


          main()                                                                          main()
                    {                                                                               {
                    double    a=1.1;                                                                double    a=1.5;
                    double    b=3.7;                                                                double    b=2.3;
                    double    c=5.5;                                                                double    c=3.7;


                    double    x1,x2;                                                                double    x1,x2;


                    x1 = addition(addition(a,b),c);                                                 x1 = multiplication(multiplication(a,b),c);
                    x2 = addition(a,addition(b,c));                                                 x2 = multiplication(a,multiplication(b,c));


                    printf("(%.6f + %.6f) + %.6f = %.15f\n",a,b,c,x1);                              printf("(%.6f * %.6f) * %.6f = %.15f\n",a,b,c,x1);
                    printf("%.6f + (%.6f + %.6f) = %.15f\n",a,b,c,x2);                              printf("%.6f * (%.6f * %.6f) = %.15f\n",a,b,c,x2);
                    }                                                                               }



          (1.100000 + 3.700000) + 5.500000 = 10.300000000000001                           (1.500000 * 2.300000) * 3.700000 = 12.764999999999999
          1.100000 + (3.700000 + 5.500000) = 10.299999999999999                           1.500000 * (2.300000 * 3.700000) = 12.765000000000001

On notera l'utilisation de deux fonctions destinées à effectuer l'addition et la multiplication respectivement ; elles sont là afin de faire respecter impérativement l'ordre des opérations (en effet, pour un compilateur les deux expressions (A+B)+C et A+(B+C) à sont équivalentes, les parenthèses étant redondantes ; il en est de même pour (AxB)xC et Ax(BxC)). Les résultats obtenus sont différents mais malgré tout proches l'un de l'autre. Mais en est-il toujours ainsi ? Exploitons cet autre petit programme (pour des raisons de simplicité et de compréhension la notion d'itération n'y est pas utilisée) :

                    
          main()
                    {
                    double    A,B,x0,x1,x2,x3,x4,x5,x6,x7;


                    B=4095.1;
                    A=B+1;


                    x0 = 1;
                    x1 = (A*x0) - B;
                    x2 = (A*x1) - B;
                    x3 = (A*x2) - B;
                    x4 = (A*x3) - B;
                    x5 = (A*x4) - B;
                    x6 = (A*x5) - B;
                    x7 = (A*x6) - B;


                    printf("x0 = %+.16f\n",x0);
                    printf("x1 = %+.16f\n",x1);
                    printf("x2 = %+.16f\n",x2);
                    printf("x3 = %+.16f\n",x3);
                    printf("x4 = %+.16f\n",x4);
                    printf("x5 = %+.16f\n",x5);
                    printf("x6 = %+.16f\n",x6);
                    printf("x7 = %+.16f\n",x7);
                    }

                    
          x0 =          +1.0000000000000000
          x1 =          +1.0000000000004547
          x2 =          +1.0000000018630999
          x3 =          +1.0000076314440776
          x4 =          +1.0312591580864137
          x5 =        +129.0406374377594148
          x6 =     +524468.2550088063580915
          x7 = +2148270324.2415719032287598

On notera au préalable que ce programme très simple ne contient pas d'erreur de conception (ne peut pas contenir...), ne fait pas appel à des méthodes d'approximation (contrairement au dernier exemple) et qu'enfin les réponses attendues (=1) sont connues a priori (ce qui est exceptionnel !). En effet, la propriété suivante est vraie :

                    A=B+1 ==> A-B=1 ==> x7=x6=x5=x4=x3=x2=x1=x0=1

Mais ce programme ne donne pas du tout des valeurs égales à 1 (sauf évidemment la première). Où est le problème ? En fait, A-B n'est pas égale à 1 ; A-B est égale à 1 plus/moins epsilon (un simple bit), tout simplement parce que 4095.1 et 4096.1 ne sont pas représentables exactement dans un ordinateur à l'aide des nombres flottants ! Il est évidemment possible d'imaginer d'autres façons de faire qui résoudraient ce problème : par exemple en représentant 4095.1 et 4096.1 à l'aide des deux fractions 40951/10 et 40961/10 et en ne travaillant ainsi qu'avec des nombres entiers. Ou bien encore concevoir que le compilateur, par des manipulations "formelles", pourrait se rendre compte que tous les x[i] sont égaux à 1 et remplacer alors les instructions 'x[i+1]=(A*x[i])-B' par 'x[i+1]=1'. Mais cela ne ferait que répondre à ce cas particulier sans résoudre le problème général qui vient encore une fois de la capacité finie des ordinateurs...

Evidemment ce phénomène est indépendant du langage de programmation utilisé comme cela peut se voir avec les versions en Fortran 95 ou encore en Python de ce programme.

L'intérêt de ce programme est donc d'une part de révéler de façon tout à fait violente un problème général d'exactitude des calculs dans un ordinateur. D'autre part il montre qu'une erreur infime (le simple bit qui faisait que A-B n'était pas égal à 1) peut s'amplifier de manière "explosive" ! Enfin, il fait référence à un processus appelé calcul itératif omniprésent, en particulier, en physique mathématique où une grandeur est transformée et retransformé suivant certaines lois. Cela sera le cas dans le dernier exemple avec les coordonnées tridimensionnelles des quatre corps (deux étoiles et deux planètes). En effet, ces dernières seront données a priori à l'instant initial puis transformées ensuite d'instants en instants selon les lois de Newton de la Physique classique. Enfin, on notera qu'un problème linéaire mathématiquement peut ne plus l'être informatiquement (l'ordinateur ne faisant pas la différence entre une constante et une variable) !

Ces deux expériences "simplistes" démontrent qu'un ordinateur, quel qu'il soit, n'est pas une machine à calculer parfaite. La cause en est donc l'impossibilité de représenter exactement tous les nombres dont nous avons besoin.

Malheureusement, la plupart des calculs "utiles" qui sont effectués dans les ordinateurs font référence aux nombres réels. D'après ce qui précède, ces derniers ne pourront pas être ni représentés, ni manipulés exactement dans ces machines (sauf cas très particuliers, comme les petits nombres entiers...).

Précisons d'abord qu'un ordinateur est fait de matériel (le hardware) et de programmes -ou logiciels- (le software). En général deux ordinateurs quelconques ne seront pas strictement identiques ; il en sera ainsi, en particulier, en ce qui concerne l'interprétion des expressions mathématiques. Par exemple, l'expression suivante :
```
                    (A+B)x(C+D)
```
pourra être "comprise" de plusieurs façons différentes :
```
                    (A+B)x(C+D)


                    Ax(C+D) + Bx(C+D)


                    AxC + AxD + BxC + BxD


                    etc...
```
qui sont équivalentes mathématiquement parlant. Mais ceci n'est plus vrai dans un ordinateur, à cause de la perte des propriétés d'associativité et de distributivité. Alors, dans ces conditions, un programme unique pourra produire des résultats non identiques s'il est exécuté sur plusieurs ordinateurs différents. D'autres conséquences négatives sont possibles pour certains problèmes : la perte de la pérennité des résultats (il suffira pour cela, par exemple, que l'ordinateur sur lequel il est développé soit mis à jour), la difficulté, voire l'impossibilié, de faire coopérer des ordinateurs différents, l'irréversibilité du temps numérique,...

Cette expérience montre le calcul des trajectoires de deux planètes en orbite autour d'une étoile binaire. Le même calcul (aussi bien en ce qui concerne le programme que les conditions initiales) est effectué sur trois ordinateurs différents. Les résultats du premier sont coloriés en rouge, du second en vert et du troisième en bleu. L'image 01 montre les positions initiales. Jusqu'à l'image 04 les trois machines donnent des résultats comparables qui, superposés, donnent des trajectoires blanches (puisque, selon les principes de la synthèse additive des couleurs utilisés pour les écrans d'ordinateur, la superposition de quantités égales de Rouge, de Vert et de Bleu donne du gris). Mais au-delà les trajectoires semblent se subdiviser en trois trajectoires colorées visualisant la divergence entre les résultats des trois ordinateurs qui sont donc bien loins d'être d'accord entre-eux et évidemment tout les trois se trompent ! Il convient de noter que le modèle sous-jacent repose sur la mécanique newtonienne et des méthodes de calcul numérique. Mais en fait, peu importe (peu importe aussi la non intégrabilité du problème des N-corps pour N supérieur à 2 démontrée par Henri Poincaré) : ce qui compte ici c'est qu'un même programme donne des résultats qui dépendent du système utilisé.

Il est incontestable que l'ordinateur est une machine aux possibilités quasiment infinies, aussi bien dans la vie courante que dans la recherche scientifique la plus fondamentale. Mais il convient de na pas oublier qu'il n'est pas infaillible et que, comme tout outil, il n'est pas neutre. Connaître et maîtriser ses limites c'est aussi pouvoir en tirer le meilleur parti, mais tout en restant vigilant !

[Plus d'informations et d'autres conséquences en particulier en ce qui concerne le style du programmeur, la difficulté de faire du calcul dit parallèle à l'aide d'un système hétérogène -tant au niveau matériel que logiciel- ou encore l'impossibilité de garantir la reproductibilité et la pérennité de certains résultats].

Un Ordinateur est-il une Parfaite Machine a Calculer ?

Jean-François COLONNA [Contact me]

www.lactamme.polytechnique.fr

CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641, École polytechnique, Institut Polytechnique de Paris, CNRS, France

Copyright © Jean-François COLONNA, 2010-2024. Copyright © CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641 / École polytechnique, Institut Polytechnique de Paris, 2010-2024.

Jean-François COLONNA
[Contact me]

Copyright © Jean-François COLONNA, 2010-2024.
Copyright © CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641 / École polytechnique, Institut Polytechnique de Paris, 2010-2024.