BréguetDepuis que la Bibliothèque nationale de France (Bnf) a fait savoir qu’elle étudiait la possibilité de faire appel à Google pour la numérisation de son fonds, un débat nourri s’est installé. C’est un débat comme on les aime : confus et grandiloquent. Pour ce qui est de la Bnf, les enjeux sont assez bien expliqués dans un papier de Libération (voir aussi celui-ci) qui montre que, d’une part, aucun accord n’a été conclu, et d’autre part que Google est tout de même bien placé si la numérisation du fonds devait passer par un partenaire privé. Sur la scène médiatico-politique, les clivages sont francs. Après le cri d’alarme de l’ancien directeur de la Bnf, Jean-Noël Jeanneney, c’est Emmanuel Hogg, président de l’Ina, qui dénonce dans Le Monde un « pacte faustien ». En face, Camille Pascal, de France Télévisions, vilipende « l’anti-américanisme primaire » et son auxiliaire « l’anti-capitalisme » qui nourriraient l’hostilité au partenariat avec Google. Entre les deux, le ministre de la culture vante les vertus du juste milieu en termes audacieux :

je n’oppose pas ici, dans une vision frontale et caricaturale qui serait ridicule, la technologie au patrimoine, Google à Europeana, le public au privé, la France à l’Amérique, Astérix à Goliath.

Dame ! Astérix et Goliath, c’est une métaphore intéressante, et une belle affiche pour un match virtuel, entre un débat Platon-Michel Onfray sur Twitter et un chat entre Mary Stuart et Carla Bruni… S’il ne faut pas opposer la technologie au patrimoine, on ne voit pas pourquoi on se priverait de rapprocher le petit Gaulois et le grand Philistin…

Dans ce débat, il est beaucoup question d’une éventuelle domination culturelle de l’Amérique sur l’Europe, ainsi que de délicats problèmes liés au respect du droit d’auteur. Il est, curieusement, assez peu question des livres en eux-mêmes. Tout au plus rencontre-t-on quelques pieuses incantations qui font miroiter le rêve d’une sorte de bibliothèque virtuelle universelle. Ainsi Camille Pascal, qui n’hésite pas à voir dans Google l’agent principal des Lumières du futur :

Grâce à Google, l’étudiante afghane peut dépasser les frontières culturelles qui lui sont imposées  : il serait fou qu’elle ne puisse pas y trouver en accès direct le texte original du Dictionnaire philosophique de Voltaire.

Ne soyons pas mesquins, et évitons de signaler à M. Pascal que cet ouvrage indispensable est également consultable sur Gallica. L’argument aurait, du reste, peu de chances de porter, puisque ce monsieur décrète, dans le même article, que « le site Gallica, qui a certainement mobilisé des trésors d’intelligence, a été pensé pour tout sauf pour être consulté  ! » Ce n’est pas mon avis, mais on peut sans hésiter concéder qu’un service comme GoogleBooks rend d’inestimables services au chercheur, voire à l’étudiante afghane.

Les preuves ne sont pas difficiles à trouver. Pas plus tard que sous l’avant-dernier billet paru sur ce blog, un commentateur obligeant signalait une excellente édition, lisible et complète, de l’opuscule de La Harpe sur le fanatisme, dont Gallica propose l’édition originale, certes, mais aussi fort mal imprimée. GoogleBooks est, incontestablement, une mine d’œuvres épuisées, oubliées et autrement inaccessibles au commun des mortels. Pour mettre la main sur le texte intégral de la « prophétie de Cazotte », du même La Harpe, j’avais dû monter une expédition à la Bnf (la vraie, la François Mitterrand) ; on ne peut que se réjouir à la perspective de trouver un jour une version numérisée du précieux premier volume des œuvres complètes de La Harpe.

Et que dire de la possibilité, offerte par Google, de lire de larges extraits d’ouvrages récents, amputés seulement de quelques pages par respect pour le droit de copie ? Cela suffit, bien souvent, à décider que tel livre ne mérite pas davantage d’attention, ou qu’il vaut au contraire la peine de se procurer la version intégrale, imprimée et reliée, à prix d’argent. GoogleBooks change la vie du lecteur de livres.

Le prodige a cependant ses limites, à côté desquelles le débat national, englué dans ses attendus géo-politico-économiques, me semble passer joyeusement. Les ambiguïtés se concentrent, à mes yeux, sur cette idée d’une « bibliothèque virtuelle », celle qui intéresse au premier chef, après tout, le lecteur de livres. Assurément, si je procède sur Google en fonction de mes habitudes de rat de bibliothèque, je m’en sers comme d’un bon vieux fichier : j’entre le nom de l’auteur et le titre du livre, et je vois ce qui sort. L’étudiante afghane qui s’intéresse au Dictionnaire philosophique et qui procède ainsi se voit proposer dans l’ordre le premier tome d’une édition de 1829, puis celui d’une édition de 1765, puis le troisième tome de l’édition 1829, puis le premier d’une autre édition de 1765, et ainsi de suite. C’est un peu confus, mais on s’y retrouve. Une édition complète (en un volume, avec toutes les « mises à jour », comme on dirait aujourd’hui) se trouve sur la liste en dix-neuvième position. Je la recommande à l’attention des censeurs de l’université de Kaboul, car cette édition de 1835 comprend notamment, à partir de la p. 754, un article « Juifs » (absent des premières éditions) dont ils auraient tort – du moins de leur point de vue – de vouloir priver l’étudiante afghane.

Seulement voilà. Google n’est pas vraiment conçu comme un fichier de bibliothèque. Son principe intrinsèque est tout autre, et c’est un principe Google : la recherche est censée fonctionner par mots-clés. On n’entre pas un titre et un auteur, mais un mot ou une suite de mots, et le système conçoit, en réalité, les livres du monde comme une extension mirifique de world wide web. Il s’agit d’annexer à l’Internet le contenu de tout ce qui s’est imprimé depuis Gutenberg. Et, dans cette perspective, le lecteur de livre est quelque peu perplexe.

Mettons que l’étudiante afghane, décidément éprise de liberté, s’intéresse à la démocratie. Formée à l’école Google, elle tape donc « démocratie ». Logique. Ce qui l’est moins, c’est le résultat :

1. La démocratie, Etienne Vacherot, 1860.

2. Démocratie française, Valéry Giscard d’Estaing, 1983.

3. De la démocratie en Amérique, Alexis de Tocqueville, 1868…

Je ne veux pas sembler minimiser la contribution de MM. Vacherot (Etienne) et Giscard d’Estaing (Valéry) à la cause de la démocratie, mais avouons qu’ils ne doivent leur première position dans la liste qu’à l’usage du mot « démocratie » dans leur titre, joint peut-être à un nombre considérable d’occurrences du même terme dans leur ouvrage. À ce compte-là, il ne faut pas s’étonner que le Contrat social n’apparaisse pas dans la liste, et qu’en revanche un chef-d’œuvre trop sous-estimé comme La Démocratie de Georges Marchais y figure en neuvième position.

Le principe sous-jacent au fonctionnement de GoogleBooks est que les livres sont une source d’informations, au sens spécial que ce terme reçoit dans le jargon de l’informatique et des sciences de la cognition. Un livre qui mentionne mille fois le mot « démocratie » est réputé devoir fournir plus d’informations sur la démocratie qu’un livre qui, n’usant peut-être jamais du mot, s’attache à comprendre les fondements du lien social et les conditions d’une participation collective à la décision politique. C’est oublier que les livres ne sont pas des bases de données, et que leur principal usage dans la civilisation, ce n’est pas d’être parcourus par le filtre improbable de « mots-clés », mais d’être lus.

Au crible de GoogleBooks, la première référence sur la « morale » est un livre d’un certain Jacques Matter, de 1860, et sur la « religion » un « poëme » de Louis Racine de 1763. Il est inutile de souligner qu’un bibliothécaire qui alimenterait selon ces critères les rayons « Morale » et « Religion » de son établissement rendrait un piètre service aux usagers, afghans ou non. Je me demande si Frédéric Mitterrand songeait à cela lorsqu’il écrivait, dans sa tribune du Monde, que « la numérisation de notre patrimoine est une chose trop sérieuse pour être laissée aux seuls spécialistes »…

On touche là au fond du problème. Une bibliothèque n’est pas un amoncellement quelconque de « sources d’informations » ; bibliothécaire est un métier. L’informatique est sûrement un outil stupéfiant, mais elle ne saurait remplacer le savoir et l’expérience accumulée de siècles d’amour des livres.

À cet égard, les prouesses de Google laissent pour le moins à désirer. En matière de livres, il y a bel et bien des « informations » dont le lecteur de livres aiment être pourvu. Ce sont ce qu’on appelle techniquement les « méta-données » : nom complet de l’auteur et dates de naissance et de mort, lieu et date de l’édition, nom de l’éditeur, de l’éventuel préfacier, nombre de pages, par exemple. Aucune recherche sérieuse ne peut négliger ces éléments d’information. Or la recherche de ces données est un travail sérieux, que les machines à numériser manipulées par Google semblent bien incapables de mener à bien. Il suffit de comparer une notice de Gallica et l’espèce d’équivalent proposé par Google : faites l’essai avec le Dictionnaire philosophique, vous m’en direz des nouvelles ! Il me semble léger de prétendre que Gallica ne soit pas fait pour être consulté : le site paraît au contraire fait pour être consulté par ceux qui savent ce que consulter veut dire…

Mettons les choses au mieux, et donnons sa chance à GoogleBooks en l’utilisant comme il semble pouvoir être utilisé : travaillons par mots-clés et par critères. Je peux fort bien m’intéresser, après tout, à des questions lexicographiques, et me demander par exemple si le mot « sociologie » est utilisé avant 1850. GoogleBooks, dans sa fonction « Recherche avancée », me promet des découvertes captivantes. Jugez plutôt.

Certes, la moisson est abondante. Mais le dépouillement donne des résultats curieux. La liste me propose d’abord un numéro de la vénérable Revue britannique. Méta-donnée disponible : la date, 1808. Vérification faite, le volume, s’il contient bien le mot « sociologie », est publié en 1868. La reconnaissance optique a raté son coup. Deuxième résultat, exaltant de prime abord : un ouvrage de… 1783 ! Je me précipite. C’est un livre intitulé Qui êtes-vous ? Il s’agit en réalité d’un « Annuaire des contemporains » publié en 1924. D’où peut bien sortir ce 1783 ? Eh, bien ! de l’endroit où la machine Google a l’habitude de trouver les dates de publication, c’est-à-dire dans les premières pages du volume : la date se lit en effet. 1783C’est une publicité pour Bréguet (« Chronomètres de marine, régulateurs astronomiques, montres de précision »; voir la reproduction ci-dessus), qui porte en bas de page la mention : « Maison fondée en 1783 »… Je n’aurai guère plus de chances avec le troisième titre proposé dans la liste, portant la date de 1838 (Mémoires pour servir à l’histoire de la philosophie du XVIIIe siècle, par M. Philibert Damiron). Le mot «sociologie» y figure bien, mais c’est dans le catalogue de l’éditeur reproduit en fin d’ouvrage – lequel fut achevé d’imprimer en 1907. « Trop sérieuse pour être confiée aux spécialistes », la numérisation du patrimoine ?

Un lecteur de livres attend d’une bibliothèque numérique les mêmes services que d’une bibliothèque normale : il compte sur un travail sérieux d’organisation, pour trouver sur les bons rayons les livres pertinents, et sur un fichier fiable pour identifier facilement les livres dont il a besoin. Pour l’instant, GoogleBooks est très loin de Gallica pour ce genre de prestation. Il ne l’emporte que sur le plan strictement quantitatif. La masse est impressionnante. À qui possède déjà le savoir nécessaire pour s’y orienter, pour trier et ne retenir que ce qui importe vraiment, les services rendus sont déjà inestimables ; mais il y a loin, très loin, de cette masse confuse à la réalisation d’une bibliothèque. Et l’on ne voit pas que les performances quantitatives de Google en matière de numérisation bête et mécanique puissent dispenser d’un travail humain colossal pour donner à ces milliards de mégabits la forme d’une bibliothèque universelle. GoogleBooks produit à la chaîne de la matière numérique.

Google, ce n’est peut-être pas l’enfer des bibliothèques, mais c’est un peu l’envers des bibliothèques, ou une bibliothèque à l’envers : un amas offert au public avant tout effort de catalogage et de classement. On ne peut qu’espérer que l’esprit humain saura peu à peu donner forme à cette matière, à défaut d’avoir pu, comme cela arrive habituellement dans les bibliothèques, présider au rassemblement des ouvrages choisis.