Les Défaillances de l'Informatique : une Nouvelle Menace ?
l'Exemple du Bug de l'An 2000
CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641, École polytechnique, Institut Polytechnique de Paris, CNRS, France
france telecom, France Telecom R&D
[Site Map, Help and Search [Plan du Site, Aide et Recherche]]
[Real Numbers don't exist in Computers and Floating Point Computations aren't safe. [Les Nombres Réels n'existent pas dans les Ordinateurs et les Calculs Flottants ne sont pas sûrs.]]
[N'oubliez pas de visiter Une Machine Virtuelle à Explorer l'Espace-Temps et au-delà où vous trouverez plus de 10.000 images et animations à la frontière de l'Art et de la Science]
(Site WWW CMAP28 : cette page a été créée le 01/26/2000 et mise à jour le 13/09/2024 12:29:17 -CEST-)
(publié dans La Jaune et la Rouge,
revue mensuelle de la société amicale des anciens élèves de l'Ecole Polytechnique,
janvier 2000. Ce texte a été rèdigè au mois d'octobre 1999, soit avant
la date du 31/12/1999)
AVERTISSEMENT :
Ce site est strictement "personnel" et son auteur
est l'unique responsable de son contenu. Il ne reflète donc en aucune façon
les positions officielles que l'Ecole Polytechnique et France Telecom
ont ou pourraient avoir face aux problèmes qu'il décrit.
Enfin, il réside sur un ordinateur appartenant à l'Ecole Polytechnique.
INTRODUCTION :
Dire que l'informatique, les
télécommunications et l'énergie
constituent les infrastructures vitales de
notre économie, de notre défense et de
notre confort est d'une extrême
banalité. Mais s'interroge-t-on
suffisamment sur leurs inter-dépendances que personne ne maîtrise
complètement, ainsi que sur leur
robustesse et leur capacité à résister à
des perturbations ? Et n'existerait-il
pas aussi des risques internes, voire
intrinsèques ? Ne seraient-elles pas que
de gigantesques châteaux de cartes
prêts à s'écrouler à la moindre
occasion ? Finalement, ne construisons-nous pas sur du sable ? Nous allons
montrer sur un exemple précis et
d'apparence anodine, celui de la
mauvaise gestion des dates dans les
ordinateurs, qu'il en est
malheureusement ainsi, et qu'un
malheureux grain de sable dans le
silicium de nos microprocesseurs
pourrait être à l'origine d'importantes
défaillances, tout ceci sans faire preuve
d'un catastrophisme excessif et en
conservant présent à l'esprit que
mieux vaut prévenir que
guérir.
A l'approche de l'an 2000 ressurgit un
millénarisme qui contrairement à celui
de l'an 1000 n'annonce point les
splendeurs du Royaume de Dieu. Bien
au contraire nos peurs sont aujourd'hui
bien réelles, bien concrètes : le spectre
de la pollution, les risques nucléaires,...
plannent au-dessus de nos têtes comme
autant d'oiseaux de proie ; qui n'a pas
tremblé à la vue de ces sous-marins
nucléaires de l'ex-marine soviétique en
train de pourrir dans les ports de la
presqu'île de Kola ?
La Science nous a appris au cours des
siècles passés que le premier janvier de
l'an 2000 serait un jour comme les
autres dans l'histoire de l'Univers.
Malgré cela, ce jour pourrait rester
inscrit dans l'histoire de l'Humanité
comme celui d'un cataclysme artificiel
aux conséquences aujourd'hui encore
inimaginables.
LES PHENOMENES NON LINEAIRES NATURELS :
Pour bien comprendre cela, il est bon
de rappeler qu'il existe dans la nature
des phénomènes caractérisés par le fait
que leurs causes, généralement infimes,
peuvent parfois s'amplifier
démesurement et avoir alors des
conséquences sans commune mesure
avec ce qui leur a donne naissance. La
conséquence en est immédiate :
l'impossibilité, tant théorique que
pratique, de faire à leur sujet des
prévisions à long terme. Les exemples
de tels phénomènes sont nombreux,
mais celui qui vient spontanément à
l'esprit est celui qui a donné naissance à
l'expression faire boule de
neige : l'avalanche.
LES PHENOMENES NON LINEAIRES ARTIFICIELS :
Au cours des décennies passées, la
Science et la Technologie nous ont
offert des phénomènes non linéaires
artificiels, par exemple, celui de
l'échec du vol Ariane 501, le 4 juin
1996. Une petite anomalie dans un
logiciel issu d'Ariane 4 et dans laquelle
elle ne s'était jamais manifestée, a
contraint à l'autodestruction de la fusée
après quelques dizaines de secondes de
vol. Ainsi, une infime anomalie s'est
amplifiée jusqu'a avoir des
conséquences ayant coûté un nombre
appréciable de milliards de francs. Il
convient, pour en terminer avec cet
incident "exemplaire", de préciser que
la compétence des ingénieurs concernés
ne peut être mise en doute : c'est
l'extrême complexité de ces systèmes
qui rend impossible (a jamais ?) leur
fiabilité absolue.
LA PREHISTOIRE DE L'INFORMATIQUE :
Ne à la fin des années quarante,
l'ordinateur avait à sa naissance
vocation de machine à calculer et ses
pères imaginaient alors que seuls
quelques exemplaires de ces monstres
nous seraient utiles. Pesant des dizaines
de tonnes, occupant des centaines de
mêtres carrés au sol, ils étaient
entourés d'armées de spécialistes. Puis,
dans les années cinquante, les
premières applications de gestion
virent le jour. Au début des années
soixante-dix, les performances et les
capacités restaient encore très limitées :
des mémoires centrales de quelques
dizaines de kilo-octets et des disques de
moins d'un méga-octet étaient la
"norme".
En ces temps reculés, point d'écran
couleur et de souris servant à
l'interaction avec les machines, mais
uniquement les 80 colonnes des cartes
perforées. Tout cela contraignait les
programmeurs à beaucoup d'habileté et
à certaines pratiques dont quelques
unes se sont perpétuées jusqu'à
aujourd'hui. L'une d'entre-elles fut la
transposition d'une habitude bien
antérieure à l'informatique, consistant
à omettre les deux premiers chiffres
des années. Mais si l'homme peut
parler sans ambiguïté de
mai 68 et de
la guerre de 70, il en va
malheureusement différemment pour
nos chers ordinateurs...
L'INFORMATIQUE AUJOURD'HUI :
En l'espace de quelques années, le
paysage informatique a bien changé.
Cela est du principalement à
l'intégration à très grande
échelle (VLSI),
technique qui permet de réaliser de
façon fiable, automatique et
économique, sur une surface de l'ordre
du centimêtre carré, des systèmes qui
hier demandaient des dizaines de
mêtres cubes. Aujourd'hui, à côté des
machines qui portent le nom
d'ordinateur, rares sont les dispositifs,
mêmes parmi les plus quotidiens, qui
n'intègrent pas l'une de ces "puces"
(microprocesseurs, mémoires,...). A
cela s'ajoute la facilité avec laquelle
tous ces dispositifs peuvent
communiquer entre-eux et échanger de
l'information. Ainsi l'informatique
actuelle est omniprésente et
communicante.
La plupart des ordinateurs de la
planète, qu'ils soient visibles (un PC
sur un bureau) ou invisibles (un
dispositif de contrôle de processus
industriel) communiquent donc entre-eux. Il est alors possible d'affirmer
qu'ils forment un système non linéaire
dont la complexité dépasse
l'entendement et qui peut, dans
certaines circonstances, devenir
imprévisible et chaotique.
QUELQUES REMARQUES CONCERNANT LES DEVELOPPEMENTS INFORMATIQUES :
Avant de présenter le bug
de l'an 2000, il semble utile de faire
quelques remarques très générales
permettant de mieux appréhender
celui-ci, tout à la fois dans sa
magnifique simplicité et son effroyable
complexité...
L'éxperience montre que la durée de
vie des applications informatiques
dépasse en général largement celle qui
est envisagée par leurs concepteurs : il
n'est pas rare de voir aujourd'hui des
chaînes de traitement conçues il y a
plus de vingt ans et encore
opérationnelles. Malheureusement,
leurs développements eurent lieu bien
souvent sans que des méthodes strictes
et bien documentées soient utilisées. Et
cela n'a fait ensuite que s'aggraver au
cours de leurs années d'exploitation
car, elles ont du évoluer pour intégrer
de nouvelles fonctionnalités et pour
corriger les inévitables anomalies
(bugs ou
bogues en français)
introduites par les concepteurs et les
programmeurs.
Le travail de celui qui doit s'introduire
dans de tels logiciels est semblable à
celui du paléontologue qui cherche à
déchiffrer le passé à partir des
quelques traces qu'il a laissé. Ainsi, un
programme peut être vu bien souvent
comme un empilement instable d'un
certain nombre de couches déposées de
façon plus ou moins anarchique et
précaire au cours des années. Les
informaticiens préfèrent l'ajout à la
suppression parce que cela est plus
simple et moins risqué. La complexité
et l'instabilité chronique qui en
résultent ne peuvent qu'aller en
s'amplifiant : l'informatique au
quotidien n'est ni un Art, ni une
Science, ce n'est que du Bricolage...
Lorsqu'en 1875 Graham Bell inventa le
téléphone à l'Université de Boston, il
n'imaginait absolument pas la portée de
son invention. Cette absence de
prévisibilité à long terme (voire à
moyen ou à court terme), de même que
l'inévitable existence d'anomalies et de
risques, se retrouvent tout
naturellement lors de tout
développement et de toute innovation
informatiques. Ainsi, l'écran et le
clavier facilitent l'interaction avec
l'ordinateur, introduisent une nouvelle
forme d'ergonomie et de confort ; mais
inversement, nos vertèbres cervicales
et lombaires ne vont-elles pas en
souffrir, et ce temps réel qu'ils
permettent ne va-t-il pas nous pousser à
agir avec plus de précipitation, moins
de réflexion et de discernement qu'en
ces temps reculés ou la réponse de la
machine nous arrivait après de
nombreuses heures d'attente fébrile ?
Lors de développements informatiques,
les concepteurs sont amenés à faire des
choix bien souvent arbitraires et
certains d'entre-eux s'avèrent être par
la suite irréversibles. Ils créent ainsi de
fortes relations de dépendance qu'il
faut ensuite absolument respecter : c'est
la notion de compatibilité. C'est le cas
des codes utilisés pour représenter les
caractères d'imprimerie ou encore les
80 colonnes des cartes perforées encore
gravées dans de nombreux logiciels
d'aujourd'hui... Dans tous les cas,
l'ensemble des spécialistes
reconnaissent unanimêment qu'il serait
plus que souhaitable de faire quelque
chose : oui, mais quoi et surtout
comment ?
Les systèmes informatiques sont
généralement d'une complexité qui
dépasse nos capacités de maîtrise.
L'attitude la plus répandue consiste
donc à éviter de toucher à ce qui
semble fonctionner correctement, sauf
cas de force majeure (cas du
bug de l'an 2000). En
effet, l'expérience montre que toute
modification, même mineure, dans un
logiciel fait courir des risques graves à
celui-ci, ainsi qu'a l'intégrité de la
mission qu'il remplit.
Enfin, contrairement à une idée très
répandue, les ordinateurs possèdent des
limites qui peuvent être soit
intrinsèques (la continuité -au sens
mathématique du terme- n'existe pas
dans un ordinateur), soit imposées par
les concepteurs et les programmeurs,
souvent de façon tout à fait arbitraire.
Celles-ci peuvent être atteintes avec
plus ou moins de facilité, mais
systématiquement, cela constitue une
situation de grand danger car
généralement ignorée et donc non
prévue...
LE BUG DE L'AN 2000 :
L'exemple bien trop réel que nous
allons maintenant décrire va nous
permettre d'illustrer concrètement ces
différents points. Avant toute chose,
précisons que, pour simplifier, nous
supposerons les années écrites à l'aide
de quatre chiffres décimaux et nous
appelerons pseudo-numéro
de siècle les deux premiers chiffres de
cette représentation (par exemple 19
pour 1999). Précisons que ce pseudo-numéro de siècle ne correspond au
véritable numéro de siècle que pour les
années dont l'écriture se termine par
00 ; ceci implique en particulier que
l'entrée dans le vingt-et-unieme siècle
et dans le troisième millénaire n'aura
lieu que le premier janvier de l'an
2001 (l'an 2000 est la dernière année
du vingtième siècle).
Le pseudo-numéro de siècle maltraité :
déjà été évoqué, ce
premier problème, est de loin le plus
conséquent. La pratique ancienne de
n'utiliser que les deux derniers chiffres
des années, comme cela se retrouve
dans le numéro INSEE des français, fut
donc transposée dans le monde de
l'informatique. En effet, les dates, et
donc les années, constituent des
données omniprésentes dans les
ordinateurs et en particulier dans les
systèmes de gestion. Cela constitua
donc une véritable idée de génie,
capable de faire économiser 50% des
octets nécessaires à la mémorisation des
années, tout en permettant de faire
correctement les opérations
arithmétiques utiles et en particulier les
calculs de durées ; par exemple, un
enfant né en [19]90 aura [19]99-[19]90=9 ans en 1999.
Malheureusement, cette propriété ne se
conservera pas au passage de la Saint
Sylvestre 1999 ; ce même enfant aura
[20]00-[19]90=-90 ans en 2000. Il nous
est évident qu'une telle valeur est
incorrecte, puisqu'un âge ne peut être
négatif, mais comment se comportera
un programme en sa présence ? Il est
impossible de répondre en toute
généralité à cette question, mais il est
certain que ces circonstances n'ayant en
général pas été prévues, le résultat sera
a priori imprévisible...
Ce choix n'était en fait qu'un moyen
provisoire destiné à compenser la
faible capacité des machines
préhistoriques. Les programmeurs
d'alors n'imaginaient pas que cette
façon de représenter les années se
perpétuerait au cours des décennies
suivantes ; il est donc logique qu'il n'en
aient pas prévu les funestes
conséquences.
Cette pratique est extremêment
répandue, même sur des systèmes
informatiques donnant l'illusion d'une
gestion des années sur quatre chiffres ;
l'édition de "1998" sur un relevé
bancaire ne prouve rien : les deux
caractères "19" peuvent avoir été
ajoutés a posteriori lors
de l'impression. De plus, les formats de
la date varient d'un pays à l'autre ;
parmi trois valeurs donnant chacune
sur deux chiffres le jour, le mois et
l'année, pour retrouver cette dernière,
l'algorithme fréquemment utilisé
consiste à rechercher la valeur
strictement supérieure à 31. Il est
évident qu'à partir du premier janvier
[20]00 cette pratique sera défaillante,
tout au moins jusqu'en [20]32. Ainsi,
ces deux exemples montrent que la
représentation et la manipulation des
dates dans les ordinateurs n'est ni aussi
simple, ni aussi logique que le bons
sens le laisserait supposer...
Ainsi, une gestion des années sur deux
chiffres pourra conduire à des calculs
de durée erronés, à des relations
d'ordre temporel inversées ou encore à
des actions automatiques déclenchées au
mauvais moment ou pas du tout.
Malheureusement, le problème du
codage des années sur deux chiffres
n'est pas le seul : quatre autres
l'accompagnent...
Les dates inaccessibles :
pour représenter dans les programmes
certaines conditions particulières telle
une erreur ou la fin d'une liste d'objets
contenant des dates, une pratique très
répandue a consisté à utiliser une date
(9/9/99,...) ou une année (99,...)
particulières, les rendant par la-même
inaccessibles. Ces valeurs furent
choisies parce que d'une part elles
demandaient la frappe d'une touche
unique sur un clavier et que d'autre
part, elles semblaient appartenir à un
futur bien lointain. Cette anomalie n'a
provoqué que quelques
dysfonctionnements mineurs : par
exemple, elle a rendu impossible la
délivrance de passeports provisoires en
Suède dans les premiers jours de 1999.
L'arithmetique sur les dates :
dans les systèmes informatiques de gestion,
certaines données numériques, comme
les dates, sont préférentiellement
codées sous forme de chaînes de
caractères. Ainsi, l'année "1998", sera
représentée par la suite
{"1","9","9","8"}. Lorsque des calculs
doivent être effectués sur ces
représentations, le programmeur doit
faire accomplir explicitement à la
machine tout ce qui est fait lors d'un
calcul manuel et en particulier la
propagation des retenues. Oublier cela
lors de la détermination de l'année
suivante peut donner fréquemment des
résultats corrects ("1998" suivie de
"1999") et de temps en temps, des
surprises ("1999" suivie de "199:"). De
telles anomalies ont déjà été
rencontrées en Italie, lors d'opérations
portant sur des cartes bancaires, à la
fin des années quatre-vingt.
La capacité limitée :
Il ne suffit pas
à un ordinateur d'archiver des dates
"statiques". Pour accomplir ses
missions, il doit aussi être capable de
déterminer en permanence la date et
l'heure courantes. Cela est réalisé à
l'aide d'un instant de référence
arbitraire et d'un compteur incrémenté
périodiquement d'une unité. Que se
passe-t-il si ce dernier est sous-dimensionné par rapport à l'usage
prévu ? Le système GPS
[Global Positioning System]
donne un exemple d'une telle
anomalie. Celui-ci utilise une
constellation de satellites et nécessite,
au niveau des mobiles qui l'utilisent,
des récepteurs. Ces derniers ont besoin
de la date et ils la determinent, en
particulier, à l'aide d'un compteur de
semaines qui ne peut compter que de 0
à 1023. Ainsi, tous les récepteurs GPS
sont repassés à 0 le 21 août 1999 à
23:59:47 UTC en ne provoquant
aucune catastrophe, mais seulement
quelques anomalies dans des systèmes
grand public de navigation (maritime
et automobile). Malgré cela, le choix
d'une telle limite (de l'ordre de 20 ans)
dans un dispositif d'origine militaire,
semble tout à fait arbitraire et
mystérieux !
De telles anomalies se retrouvent
potentiellement dans la plupart des
ordinateurs. Remarquons enfin que
cette non extensibilité des ordinateurs
concerne aussi de nombreuses autres
informations : par exemple le stockage
des numéros de sécurite sociale ou
encore de téléphone.
Les années bissextiles :
les unités de mesure du temps reposent
historiquement sur des considérations
astronomiques. C'est ainsi, que l'année
correspond à la durée de la révolution
de la Terre autour du Soleil, soit
environ 365.2422 jours, ce qui n'est
pas un nombre entier. Afin que l'année
astronomique reste en phase avec le
calendrier, la seule solution est de
donner à cette dernière une longueur
variable de 365 ou de 366 jours. Ainsi,
périodiquement, des années dites
bissextiles sont
introduites. Jusqu'à la réforme imposée
par Grégoire XIII en 1582, les années
bissextiles revenaient tous les quatre
ans, ce qui donnait une année moyenne
de 365.25 jours donc légèrement trop
longue. Le calendrier, dit
grégorien, fut donc
destiné à compenser cette anomalie aux
prix d'une définition plus complexe de
la bissextilite. Une année sera bissextile
si elle est divisible par 4 sauf si elle est
séculaire (c'est-a-dire divisible par
100) et non divisible par 400. Ainsi,
2000 et 1996 sont bissextiles, alors que
1900 et 1999 ne le sont pas.
L'ensemble de ces critères est
généralement méconnu du public,
même cultivé, et aussi, bien souvent,
absent des ouvrages de référence. C'est
ainsi que le Petit Robet, dans son
édition de 1976, donne à la page 179 la
définition "bissextile : se
dit de l'année qui revient tous les
quatre ans et dont le mois de février
comporte 29 jours" ! Cela a donné
naissance à quelques logiciels et
matériels présentant des anomalies
graves leur faisant considérer que l'an
2000 n'était pas bissextile.
Ainsi, ce qui est appelé communément
le bug de l'an 2000 est en
fait l'union d'un certain nombre
d'anomalies de gestion des dates dans la
plupart de nos ordinateurs, tant au
niveau des matériels que des logiciels.
Ces anomalies qui sont plus le résultat
de choix anciens que d'erreurs, sont
particulièrement élémentaires à
spécifier. Cette constatation à deux
conséquences immédiates : la première
concerne l'incrédulité de ceux qui
découvrent ces problèmes, alors que la
seconde fait croire à ces derniers que la
solution est, elle-aussi, élémentaire. De
par la nature non linéaire de ces
"phénomènes", il n'en est rien, tout au
contraire.
LES RESPONSABLES (LES COUPABLES ?) :
Mais avant de décrire les difficultés
correspondantes, il est bon de
rechercher les responsabilités et
d'essayer de comprendre comment il
est possible que la plupart des acteurs
concernés aient attendu la dernière
minute pour agir, alors que ces
problèmes sont connus depuis plus de
vingt ans, dans le milieu bancaire en
particulier.
Les informaticiens semblent bien
évidemment être les coupables tout
désignés. En effet, ils n'ont pas su voir
à long terme les conséquences de leurs
choix et ils n'ont pas été capables
d'écrire des programmes sans erreurs.
Ils n'ont pas eu ensuite la franchise
d'avouer leurs fautes, le courage
d'expliquer les conséquences néfastes
de ces dernières et la force de
demander les énormes moyens
indispensables pour effectuer les
réparations utiles... Rien
ne sert de courir, il faut partir à point,
regrettons donc que le nécessaire ne fut
point fait lorsqu'il en était encore
temps ; fait donc posément,
correctement et non point dans la
précipitation, elle-même source
évidente de nouvelles anomalies. Mais
arrêtons-la de les accabler : en effet,
l'absence de prévisibilité et de fiabilité
est une constante dans toutes les
activités humaines.
Malgré cela, pourquoi les grandes
associations professionnelles que sont
l'ACM [The Association for Computing Machinery] ou encore
l'IEEE [The Institute of Electrical & Electronics Engineers]
n'ont-elles pas tiré le signal d'alarme
plus tôt ? Pourquoi a-t-il fallu attendre
ces derniers mois pour voir publier de
trop brefs articles sur ce sujet ? Est-ce
parce que la maintenance n'est pas une
activitê digne d'intérêt ou pire parce
que qu'elle ne fait pas partie de
l'univers de l'informatique ? Mais les
ordinateurs ne sont pas des objets
abstraits et simples ; ce sont des
machines complexes, composées de
nombreuses entités coopérantes
présentant toutes, de façon plus ou
moins chronique, des anomalies. La
maintenance fait donc partie de la vie
de l'informaticien et doit donc être
traitêe avec tout le respect dû à ce qui
finalement conditionne le bon
fonctionnement quotidien de nos
machines. Enfin, l'ampleur des
difficultés auxquelles nous sommes
aujourd'hui confrontés aurait pu
susciter des vocations, par exemple,
dans le monde de l'Intelligence
Artificielle. Malheureusement, il est
trop tard !
Ainsi, les informaticiens (des temps
héroïques...) ont des circonstances
atténuantes. Mais qu'en est-il des
utilisateurs eux-mêmes ? En effet,
nombreux sont ceux qui connaissaient
ces problèmes depuis longtemps : les
banquiers, par exemple, ne font-ils pas
des prêts à vingt ou trente ans ? Ils
savaient donc des les années soixante-dix que l'absence du pseudo-numéro de
siècle était nuisible. Il est certain
qu'alors seul le strict nécessaire a été
fait ; n'aurait-ce pas été faire preuve de
clairvoyance que d'extrapoler vers les
domaines non encore critiques ?
Notons de plus qu'alors l'informatique
était beaucoup moins omniprésente, ce
qui rendait ces problèmes plus faciles à
résoudre. Pourquoi enfin n'ont-ils pas
fortement fait pression sur les grands
constructeurs dont ils sont parmi les
plus gros clients ? Cela aurait
certainement accéléré l'arrivée sur le
marche de systèmes "compatibles" et
peut-être étouffé l'incendie avant qu'il
ne se propage ! La aussi, il est
malheureusement trop tard !
Que dire maintenant de la
responsabilité des média ? Elle semble
considérable puisqu'un événement
n'existe que s'il est relaté ; son
importance est alors proportionnelle au
nombre de lignes et de minutes qui lui
est consacré. A titre d'exemple, la
maladie de la vache folle, tant au
niveau des média grand public que
professionnels a été plus longuement
décrite que les problèmes liés à la
mauvaise gestion informatique des
dates. Est-ce à dire que leurs
importances relatives sont dans le
même ordre ? Rien n'est moins sûr
puisqu'aujourd'hui toute nos activités
reposent sur les épaules de nos
ordinateurs. Il donc dramatique de
constater le trop long silence de la
presse, en particulier informatique,
tant nationale qu'internationale.
Enfin, le monde politique à lui aussi
fait preuve d'une absence regrettable,
mais encore faut-il que l'information
remonte au sommet de la pyramide...
En France, il a fallu attendre le 20
février 1998 pour qu'une mission
présidée par Gérard Théry soit
constituée. L'ampleur du problème est
telle, qu'elle aurait demandé d'une part
une coordination internationale au plus
haut niveau des états et d'autre part que
des informations soient communiquées
aux citoyens afin qu'ils sachent l'etat
réel dans lequel se trouvent les
administrations, les services publics et
de santé, la distribution des énergies,
les systèmes de transport, la défense
nationale,... Les plans de secours mis
en place fonctionneront-ils (le
malheureux accident survenu dans la
nuit du 25 au 26 septembre 1998 à
l'Hôpital Edouard-Herriot de Lyon est
particulièrement instructif) ? En cas
d'incidents, le retour à la normale sera-t-il garanti rapidement (au mois de
février 1998, la ville d'Auckland en
Nouvelle-Zélande a été complètement
privée d'électricité pendant plusieurs
semaines à la suite de la mise hors-service des cables haute-tension qui
l'alimentaient) ? Est-on capables de
revenir provisoirement au papier et au
crayon ? Autant de questions que tous
se posent naturellement ; l'absence de
réponses ne peut qu'engendrer plus
d'inquiétude et déclencher des
mouvements de panique dont les
conséquences pourraient être bien plus
graves que celles des incidents réels,
peut-être inexistants d'ailleurs... Ces
réactions possibles pourraient être
déclenchées par des pénuries
artificielles portant, par exemple, sur
l'argent liquide ou encore les biens de
première nécessité (dans les premiers
jours de janvier 1999, quelques
bureaux de poste français ont été pris
d'assaut à la suite de l'indisponibilité du
système informatique gérant les
comptes d'épargne).
A cela, il convient d'ajouter le
calendrier de la mise en place de
l'Euro qui a été défini, sans
apparemment prendre en compte le fait
évident qu'il est difficile, pour ne pas
dire impossible, de mener à bien et
correctement deux projets
informatiques d'une telle ampleur
simultanément. Enfin, sachant le déficit
généralisé en informaticiens, la loi
française sur les 35 heures n'est-elle
pas incompatible, provisoirement, avec
l'urgence de la situation (notons au
passage qu'il ne s'agit pas ici de
critiques envers l'Euro et les mesures
pour l'emploi, mais simplement de
remarques de bon sens : serait-il
raisonnable de demander à des
pompiers qui éteignent un incendie,
d'abandonner leur tâche, sous prétexte
qu'il est dix-sept heures trente ?).
Finalement, ne serions-nous tous pas à
la fois responsables et coupables ? En
tout cas, quelle que soit la réponse donnée
à cette interrogation, il parait évident
que nous devons tous nous sentir
concernés, tant à l'intérieur des
structures professionnelles auxquelles
nous appartenons, qu'en tant que
citoyen. De notre attitude responsable
dépendra en grande partie la victoire...
LES SOLUTIONS :
Tous les problèmes que nous venons de
décrire sont élémentaires et ne
demandent aucune compétence
particulière pour être compris. Alors
où est la difficulté ? Les systèmes
informatiques sont semblables aux
icebergs : 10% de réel émergé (le
matériel) et 90% de virtuel immergé
(le logiciel) ; or autant il est facile
d'appréhender la complexité matérielle
car visible, autant cela est difficile pour
la complexité logicielle
puisqu'intangible. En fait, les
informaticiens sont en face d'un
problème assez similaire à celui qui
consisterait à leur demander de
compter les grains de sable sur une
plage. Il est bien posé (ou enfin
presque, car il suppose que la notion de
plage est définie sans ambiguïté),
élémentaire, sans aucune difficulté
théorique. Comptons donc : un grain
de sable, deux grains de sable,... mille
grains de sable. Ici, déjà la fatigue se
fait sentir, mais aussi le découragement
car, en effet, que sont mille grains de
sable par rapport à une plage ?
En ce qui concerne la gestion des dates
dans nos ordinateurs, la situation est
identique : les opérations individuelles
de correction sont élémentaires ; la
difficulté réside uniquement dans leur
nombre. Il y aurait actuellement, de
par le monde, environ cent milliards de
lignes de programmes concernées. Un
mythe répandu consiste à affirmer
l'existence d'une solution miracle.
Malheureusement, celle-ci n'existe pas ;
en effet, pour qu'un outil universel de
mise à jour puisse être conçu, il aurait
fallu qu'au cours des décennies passées,
des méthodes strictes de développement
aient été utilisées. Il n'en est rien et par
exemple, le nombre de façons de
représenter une date dans un
ordinateur est compris entre beaucoup
et l'infini... Il convient d'ajouter que
même si cette solution existait, elle ne
dispenserait pas de la première étape
incontournable : l'inventaire.
En effet, avant de corriger les
matériels et les logiciels, il est
nécessaire de disposer de leur liste
exhaustive. Or, aussi paradoxal que
cela puisse paraître, ces inventaires, en
général, n'existent pas ; il faut donc
commencer par les établir.
L'expérience montre que pour une
banque, plusieurs dizaines de milliers
de logiciels sont utilisés et ce
dénombrement demande parfois plus
d'une année pour être réalisé
proprement ! Malheureusement,
l'informatique concernée par le
bug n'est pas faite, loin
s'en faut, d'ordinateurs posés sur nos
bureaux et contenant quelques logiciels
bien rangés... Non, elle est partout :
aussi bien dans les ascenseurs, les
climatiseurs, les robots de
fabrication,... Et c'est certainement la
que le risque est le plus grand : dans
cette informatique qualifiée
d'enfouïe qui assure en
permanence le bon fonctionnement de
tout notre environnement et dont nous
ignorons presque tout !
Il n'y a donc pas d'autre solution que
de passer au peigne fin ces milliards de
lignes de programmes et ces millions
de systèmes spécialisés : nous sommes à
la recherche d'aiguilles (les dates) aux
formes et en nombre inconnus dans une
meule de foin planétaire ! Si la prise de
conscience avait eu lieu en temps utile,
il aurait été envisageable de remplacer
l'ancien par du nouveau. Mais un point
de non retour a été franchi et seules
donc les corrections restent
envisageables. En réalité, la situation
est en général plus précaire que cela :
lorsque sont prises en compte les
ressources humaines disponibles, le
temps restant et la quantité de travail à
accomplir, il apparait que bien souvent,
même ce "rafistolage" exhaustif est
impossible ! S'impose alors un tri
permettant de fixer les priorités : quels
sont les logiciels et les matériels qui
sont vitaux tant pour l'homme que
pour l'entreprise et quels sont ceux qui
le sont moins ? Tout ceci doit être
évidemment associe à une analyse des
risques encourus, ainsi qu'à la mise en
place de plans de secours.
Mais en quoi consiste donc ces
"rafistolages" ? La bonne solution au
problème du codage des années sur
deux chiffres consisterait à étendre les
zones de mémoire destinées à stocker et
à manipuler des années. Combien de
chiffres seraient nécessaires ? Quatre
paraissent a priori
raisonnables, mais ce problème ne se
reposera-t-il pas alors en 9999 ? Cette
remarque en forme de boutade est
destinée à nous rappeler deux points
essentiels : les limites arbitraires (et
souvent irréversibles) imposées par les
programmeurs et le manque de
visibilité à long terme. Quatre chiffres
sont évidemment suffisants ;
malheureusement, la complexité des
opérations correspondantes est
rédhibitoire. D'autres solutions doivent
donc être mise en œuvre. L'une des
plus répandues, consiste à choisir, dans
un certain contexte, une année dite
pivot codée sur quatre
chiffres, par exemple 1960 ; ensuite
toute année AA sera étendue sur quatre
chiffres uniquement là où cela est utile.
Cette extension se fera à l'aide d'un test
simple : si AA est supérieure à [19]60,
il lui est substitué 19AA et 20AA dans
le cas contraire. Cette solution,
présente un certain nombre de dangers.
Le premier concerne la cohérence ; en
effet, il est important que la même date
pivot soit utilisée par tous les systèmes
en relation : mais est-ce possible ? Non
en toute généralité, car cela signifierait
à la limite que l'ensemble de la planète
utilise la même. Le second danger est
plus lointain ; en effet, que se passera-t-il lorsque tous les obstacles qui
s'annoncent devant nous auront été
franchis avec plus ou moins de succès ?
La réponse est déjà connue : nous
commettrons les mêmes erreurs que
par le passé et nous oublierons nos
rafistolages. Or la notion même
d'année pivot contient sa propre limite,
de l'ordre de quelques dizaines
d'années. Ainsi, sans résoudre les vrais
problèmes, nous sommes en train de
mettre en place des bombes à
retardement qui donneront bien des
soucis à nos successeurs !
Dans tout projet informatique, il est
essentiel de vérifier la conformité de la
réalisation par rapport au cahier des
charges et ces tests occupent environ
50% du temps global ! Pour le
bug, deux types de tests
doivent être accomplis ; d'abord des
tests de non régression qui permettent
de vérifier que les corrections
apportées ont maintenu l'intégralité des
fonctionnalités antérieures. Au niveau
d'une banque, par exemple, cela se fait
en mettant en place un site indépendant
du site opérationnel, puis en comparant
leurs résultats ; cette approche est
malheureusement plus statistique
qu'exhaustive. Ensuite, des tests de
compatibilité doivent être conduits afin
de vérifier que les problèmes de date
ont été résolus. Certaines dates
particulièrement critiques doivent être
examinées à la loupe (le jeudi
09/09/1999, le lundi 03/01/2000, le
mardi 29/02/2000, le mercredi
01/03/2000, le mardi 10/10/2000,...).
Cette série de tests est particulièrement
délicate, personne ne sachant en toute
généralité ni ce qu'il faut tester, ni
comment vieillir les jeux de test sans
introduire de biais pervers.
Evalué très grossièrement, le coût des
corrections est au niveau de la planète
de l'ordre de mille milliards de dollars
! Mais il y a deux raisons poussant à
augmenter cette évaluation : d'une part
l'absence d'exemple de grands projets
informatiques pour lesquels les budgets
initiaux ont été respectés et d'autre part
les dédommagements dûs aux
inévitables dégats et catastrophes : ils
sont actuellement évalués à deux mille
milliards de dollars ! Les assureurs ont
triplement à s'inquiéter : ils sont tout à
la fois parmi les plus gros utilisateurs
de l'informatique, les plus sensibles à
ces problèmes de gestion de dates et les
plus concernés de par leur fonction ; ils
n'ont d'ailleurs pas manque de rappeler
(fort justement d'ailleurs !) que le
bug ne comportait aucun
caractère aléatoire, l'arrivée du
01/01/2000 étant connue depuis
quelques siècles...
Pour la première fois dans l'histoire de
l'informatique, des projets ont des
dates d'achèvement immuables. Or
rares, pour ne pas dire inexistants, sont
les projets qui se sont achevés à temps,
tout en respectant les budgets et les
fonctionnalités.
Enfin, nous sommes en présence d'un
magnifique exemple
d'effet domino : de par
l'interconnectivité généralisée, il ne
suffit pas, qu'une entreprise soit prête ;
il importe que l'intégralité de ses
clients et de ses fournisseurs avec
lesquels elle entretient en permanence
des relations informatiques, soient eux-aussi prêts, sous peine de risques
graves de "pollution". Ainsi, en plus du
délicat travail de mise à niveau interne,
chacun doit procéder à un colossal
travail externe de sensibilisation... Le
monde de la banque et de la finance est
particulièrement sensible à ce
phénomène ; un scénario catastrophe,
indépendant du bug et des
plus réalistes malheureusement,
consiste à imaginer sur une place
boursière, n'importe où dans le monde,
un ordinateur défaillant qui
provoquerait une anomalie qui se
propagerait ensuite, de façon quasiment
irréversible, à la vitesse de la lumière,
causant des ventes massives, un krach,
une récession...
CONCLUSION :
Les problèmes de gestion des dates
dans les ordinateurs, même s'ils sont
élémentaires à spécifier constituent une
réelle menace pour l'intégrité de nos
économies, voire même pour la
sécurite de nos états. Il n'y a
a priori aucune activité,
ni personne qui en soit réellement à
l'abri, ne serait-ce qu'à cause des
interdépendances. Malheureusement il
ne s'agit là que d'un exemple concret
d'une catastrophe possible parmi
d'autres, qui gisent potentiellement
dans nos technologies, prêtes à éclater à
tout moment.
Nos réalisations reposent aujourd'hui
toutes sans exception sur
l'informatique. Pratiquée au quotidien,
celle-ci est à des années-lumière de la
pureté des 0s et des 1s de l'algèbre de
Boole et de ses règles absolues : elle
n'est ni Art, ni Science, mais
Bricolage. Bricolage de génie parfois,
ses réussites sont là pour en témoigner
: l'ordinateur est en particulier un outil
fantastique pour amplifier nos facultés
intellectuelles et nous permettre des
progrès sans précédents dans le
domaine de la Connaissance. Mais
bricolage approximatif le plus souvent,
qui pourra nous conduire vers d'autres
catastrophes aux conséquences
incalculables dans un avenir plus ou
moins proche.
Le bug est une donc une
opportunité à saisir : le temps n'est-il
pas venu de s'interroger sur cette
complexité dont nous sommes à
l'origine, que parfois nous ne
maitrîsons plus et qui nous échappe
alors ? Soyons en tout cas conscients de
notre responsabilité aujourd'hui et
œuvrons chacun à notre niveau pour
faire de la Saint Sylvestre 1999 une
Saint Sylvestre comme les autres...
Copyright © Jean-François COLONNA, -2024.
Copyright © France Telecom R&D and CMAP (Centre de Mathématiques APpliquées) UMR CNRS 7641 / École polytechnique, Institut Polytechnique de Paris, -2024.