L'actualité du livre
Histoire & Sciences socialeset Sociologie / Economie  

Google Livres et le futur des bibliothèques numériques
de Alain Jacquesson
Cercle de La Librairie - Bibliothèques 2010 /  36 €- 235.8  ffr. / 223 pages
ISBN : 978-2-7654-0980-9

L'auteur du compte rendu : ancien élève de l'Ecole des chartes et de l'Ecole nationale supérieure des sciences de l'information et des bibliothèques, Rémi Mathis est conservateur au département des estampes de la BnF. Il a notamment publié Les Bibliographies nationales rétrospectives (2010) et codirigé un numéro des Papers on French Seventeenth Century Literature (2010).


Bibliothèque universelle à domicile ou privatisation de la connaissance ?

Jamais certainement dans l'histoire de l'humanité les changements technologiques, entraînant à leur suite une remise en cause complète des pratiques intellectuelles, n'ont été aussi rapides. Songeons que Google fut fondé il y a seulement 12 ans et que la plupart d'entre nous ne l'avait pas utilisé il y a une décennie. Si le moteur de recherche a bouleversé notre manière de pratiquer internet, et partant la structuration même du réseau, le projet Google Livres possède certainement des résonances plus profondes au sein de la culture occidentale. Le rêve d'une bibliothèque universelle, réunissant en un endroit unique l'intégralité des connaissances scientifiques et y permettant l'accès, est récurrent, des Grecs anciens à nos modernes médiathèques.

Une bibliothèque universelle librement accessible à chacun depuis son bureau, c'est ce que promet Google Livres. On comprend que cela fasse rêver. On comprend également qu'un tel projet puisse faire peur. Car, de manière surprenante, ce ne sont pas les bibliothécaires travaillant depuis 2500 ans sur ces fonds qui sont en train de réaliser ce formidable défi mais de vulgaires informaticiens. Ce ne sont pas des philanthropes travaillant pour le bien de la communauté, mais une entreprise récente et d'une puissance incroyable, dont on ignore la stratégie à long terme et les volontés profondes.

Nous nous trouvons aujourd'hui encore au beau milieu du gué : Google Livres est déjà un extraordinaire outil pour tous les chercheurs ; et des bibliothèques parmi les plus prestigieuses, les plus riches et les plus anciennes au monde ont rejoint le projet. Bien des questions se posent néanmoins, le modèle juridique ne sera pas stable tant que plusieurs jugements n'auront pas été rendus, le modèle économique n'est pas entièrement clarifié, des questions techniques se posent encore. Surtout, des concurrents tentent de s'imposer avant qu'il ne soit trop tard et que Google se trouve suffisamment puissant pour écraser dans l'œuf toute velléité d'opposition ou de monter un projet semblable.

On lit chaque semaine des événements nouveaux venant remettre en cause ou conforter telle ou telle partie du projet. Aussi était-il bon de décider de s'arrêter afin de prendre du recul et de contempler le travail effectué pendant les quelques années du projet, de juger des enjeux, de souligner avantages et inconvénients, forces et faiblesses, appuis et oppositions. Bref, de proposer un arrêt sur image afin d'aider le lecteur à comprendre la suite des événements et de faire la part de la propagande – venant des deux camps – et de l'information.

C'est en cela que cet ouvrage est utile, voire remarquable. Dans sa manière de faire, d'amener l'information petit à petit, de décortiquer la question, il se rapproche d'un manuel – ce n'est pas pour rien que son auteur a dirigé l'École de bibliothécaires de Genève et enseigne encore aujourd'hui à la Haute école de gestion de la même ville (en plus d'avoir été directeur de la bibliothèque de Genève). Son sommaire est extrêmement structuré afin de permettre au lecteur de suivre le déroulement du texte au plus près sans se perdre, avec de très nombreux renvois d'un chapitre à un autre.

Le premier chapitre revient sur les fondamentaux, c'est à dire d'abord sur une courte histoire de Google en 15 pages puis sur une histoire des moteurs de recherches en général (issu des techniques plus anciennes de la recherche documentaire et de la bibliographie d'antan) et de celui de Google en particulier, afin d'expliquer en quoi cette dernière constitue une réussite exceptionnelle et d'où proviennent sa popularité et sa supériorité par rapport aux autres.

Il ne faut pas oublier que la recherche d'information dans des masses énormes de données est le travail premier des bibliothécaires depuis des siècles et que les fondateurs de Google sont des universitaires, issus des universités du Michigan et de Stanford. Ces derniers voient donc très rapidement l'intérêt de faire travailler leur moteur sur des données numérisées issues des grandes bibliothèques universitaires des États-Unis. C'est le sujet de la troisième partie de l'ouvrage, portant sur les années 2002 à 2004, au cours desquelles, en sus des deux universités suscitées, Harvard, Oxford et la New York Public Library sont séduites par le projet. En fait, il répond directement à un projet pré-existant de ces universités – cela fait bien longtemps que l'on parle de numérisation en bibliothèque – mais qu'elles n'avaient pu mener à bien faute de fonds ou de prestataire capable. C'est à cette époque également que sont mises au point les procédures de numérisation, qui doivent à la fois respecter le cahier des charges des bibliothèques, notamment en matière de conservation des ouvrages, et des conditions de rapidité et de coût drastiques. C'est enfin à cette époque – notamment à la foire du livre de Francfort 2004 – que l'entreprise présente le volet «éditeurs» de son projet : la volonté est de les «aider» à mettre leurs livres en valeur et d'aider à leur vente en en indexant le contenu plein texte.

Ces diverses approches et projets trouvent leur aboutissement à la date du 14 décembre 2004. C'est alors en effet qu'est faite l'annonce de la collaboration avec les bibliothèques et le lancement de ce qui est appelé à être la plus grande bibliothèque numérique du monde, voire – étant donné la puissance de Google – la seule véritable bibliothèque numérique encyclopédique. Aussitôt, espoirs et craintes se déchaînent.

L'ouvrage se sépare en réalité en deux parties distinctes. Si les cinq premiers chapitres abordent la question dans une approche historique, les sept derniers visent à analyser les réalisations et sont par là plus problématisés.

On ne saurait numériser des millions de livres sans avoir pensé à des procédures adaptées à la fois à la conservation des livres et à la dimension exceptionnelle du projet. La qualité de la numérisation de Google est souvent critiquée : elle n'atteint pas celle directement pilotée par les bibliothèques. Aussi est-il intéressant de connaître les dessous techniques de la digitisation made in Google, et surtout de leur conservation pérenne. Une fois les images obtenues, la procédure n'en est pas à son terme car il est primordial de disposer de fichiers en plein texte afin de pouvoir y effectuer des recherches d'occurrences et de permettre le copier-coller. À cet égard, Google rencontre les mêmes difficultés que toute institution : les OCR sont encore de bien piètre qualité sur les typographies anciennes. Si la BnF tente une expérience de correction collaborative, Google tente lui d'améliorer ses outils, avec encore peu de résultats.

Le 7ème chapitres revient, lui, sur l'interface accessible au public et à la pratique quotidienne que des millions de chercheurs et citoyens font chaque jour de Google Livres. Nous en savons gré à l'auteur car cet aspect des choses – pourtant le plus prosaïque qui soit ; en tout cas le plus important – est souvent oublié dans les approches purement morales ou stratégiques de journalistes qui n'ont visiblement jamais utilisé ce qui est avant tout un outil.

Comme tout projet vivant, Google Livres se développe et le fait même d'exister vient modifier son existence. De nouveaux partenaires signent avec l'entreprise : on parle particulièrement en France de la Bibliothèque municipale de Lyon mais, c'est également le cas d'un État tout entier – l'Italie – pour ses deux bibliothèques nationales. Le retournement le plus spectaculaire est la BnF, qui avoue à l'été 2009 discuter avec Google : l'ère Jeanneney est belle et bien enterrée. Cela ne signifie néanmoins pas que Google a les mains libres : les controverses demeurent et opposent l'entreprise à des groupes d'une grande diversité, dans de nombreux pays. Question de l'opt-in remis en cause dans plusieurs pays, la tentative de «Règlement» et de main basse sur les œuvres orphelines, procès en France et en Belgique, prise de position de nombreuses personnalités dont la ministre de la Justice en Allemagne, etc.

Aussi l'auteur s'interroge-t-il sur l'avenir des bibliothèques numériques en mettant en perspective la réalité du travail effectué par Google, les possibilités offertes par les technologies actuelles, ainsi que les projets viables susceptibles de concurrencer (avec un bonheur à déterminer) Google Livres ; ainsi que les faiblesses de ce dernier projet – notamment la question des métadonnées.

L'ouvrage propose une bibliographie assez limitée mais a la bonne idée de renvoyer vers des bibliographies disponibles en ligne les lecteurs qui voudraient approfondir tel ou tel point. La faiblesse la plus grande repose sans doute sur l'utilisation des sources. Le nombre de notes de bas de page est hélas assez faible, ce qui ne permet pas toujours au lecteur de savoir d'où viennent les renseignements donnés. Or, Google – sans doute plus qu'une autre multinationale – a toujours tenté de réécrire sa propre histoire et il faut se méfier de la manière dont l'entreprise présente la naissance de ses projets (voir par exemple la relation des premiers contacts avec l'université du Michigan, p.38).

Au final, le livre est on ne peut plus utile. Alors que la tête nous tourne quand médias, blogs et communiqués de presse apportent chaque jour leur lot d'information à chaud, nous avons l'occasion avec cette lecture de faire une pause et d'affermir les bases grâce à un regard doublement décalé. Décalé dans le temps – puisqu'il s'agit d'une analyse à froid – et (légèrement) décalé dans l'espace (pour les Français franco-centrés que nous sommes trop souvent) : l'auteur a été directeur des bibliothèques de l'université de Genève puis de la bibliothèque de la même ville. Il n'est pas sans intérêt pour un Français de lire ce point de vue décalé, qui permet de se sortir de l'appréhension trop locale de ces questions essentiellement transnationales. Jacquesson s'appuie ainsi sur les transformations que la présence de Google a engendrées en Suisse ou en Allemagne et nuance l'importance des actions judiciaires françaises.

Rédigé à la manière d'un manuel, on y retrouve très facilement l'information recherchée et on le lit en quelques heures en étant sûr de retenir l'essentiel. Bien que la maison d'édition qui l'a publié vise en premier lieu un public de professionnels du livre, il gagnera à être lu par le public le plus large, qui y prendra plaisir et y trouvera les clefs nécessaires à la compréhension de l'actualité. Le contenu de l'ouvrage, visant à toujours remettre en contexte les informations offertes, ainsi que son plan extrêmement clair vont d'ailleurs dans ce sens. Parfois trop structuré, peut-être, puisque le grand 4 fait deux pages et demi si l'on en retire ce qui concerne Amazon et non Google... Ou que le grand 5 fait 4 pages sur l'unique journée du 14 décembre 2004 : lui consacrera-t-on un jour un des volumes de la célèbre collection des «Journées qui ont fait la France [ou le monde]» ?

Mais, dans tous les cas, il constitue un nécessaire contre-point aux ouvrages plus engagés, signés de certains des acteurs de la grande numérisation, tels que l'ouvrage de J.-N. Jeanneney (qui persiste et signe dans une troisième édition récente) ou la justification de B. Racine (Google et le nouveau monde) : ce livre prend un recul salutaire afin de s'extraire du flux des informations diverses – voire de la désinformation distillée par les différents acteurs. Le regret est hélas celui que nous aurons devant tout livre imprimé portant sur un sujet d'actualité : appelé à être très rapidement obsolète, sera-t-il mis à jour ? S'il l'est, les acquéreurs de la première édition n'en bénéficieront assurément pas... Espérons donc que cette publication se poursuive sur Internet afin de continuer à rendre le service que cet bel ouvrage rend assurément en cet instant précis.

Car n'oublions pas que, bien que les politiques aiment commenter ces enjeux et font croire qu'ils sont pris à bras le corps, c'est bien loin d'être le cas. Le budget de numérisation de la BnF – largement le plus important en France – est de 7 millions d'euros, c'est à dire à peine le coût de construction d'une annexe de bibliothèque municipale. C'est dire si le grand emprunt sera le bienvenu, si tant est qu'il puisse apporter une réelle solution à ce problème. C'est dire également que, si Google est un problème, ce n'est actuellement certainement pas de France que viendra la solution si une véritable action n'est pas immédiatement engagée.

Rémi Mathis
( Mis en ligne le 31/08/2010 )
Droits de reproduction et de diffusion réservés © Parutions 2024



www.parutions.com

(fermer cette fenêtre)