Archive pour le 25 mai 2005

Mercredi 25 mai 2005

Google Print : Bibliothèque universelle ou asservissement du savoir ?

Dépassé, le projet fabuleux et quelque peu mégalomane de François Mitterrand !. Au classement du Grand Livre des Records, la dimension de notre Bibliothèque Nationale n’a plus rien de pharaonique, si ce n’est probablement celle de ses coûts d’entretien. L’initiative récente de Google risque même de reléguer Alexandre le Conquérant au rang d’un génial mécène égaré dans son siècle… Car ce dont il s’agit aujourd’hui n’est rien moins que la constitution d’une bibliothèque universelle, une tour de Babel des savoirs, des langues et des littératures.

Passionnant en lui-même, le projet Google de numérisation de milliers de livres est tout à fait emblématique des problèmes (éco, culturels, politiques) suscités par la nouvelle économie internet.

J’ai, depuis trois mois, épluché tous les articles qui décrivent ce projet. Et ce week-end, je me suis replongé dans une lecture étonnante, riche de toutes les utopies, mais parsemée de trompe-l’œil et de chausse-trappes.

Rappel : Il y a dans le monde, actuellement, des milliers de projets de numérisation (archives de musées, d’entreprises, fonds de bibliothèques, mémoires de recherches, doc administratifs, etc…). Dans le domaine culturel, deux propositions ont fait l’objet d’un débat public. La première émane de « Amazon.com ». En octobre 2003, le libraire en ligne a lancé le programme « Search inside the book ». Près de 200 éditeurs sollicités, l’ambition de rendre consultables jusqu’à 120 000 livres !

Et puis, il y a eu « Google Print ». La firme de Mountain View (Californie) a confirmé l’accord de 5 des plus grandes bibliothèques anglo-saxonnes de lui confier la numérisation de leur fond (Harvard, Stanford, bibliothèque du Michigan, New-York Public Library, Oxford). Avec un objectif encore plus incroyable : 15 millions d’ouvrages scannés, 4,5 milliards de pages, le tout disponible dans 6 ans ! ! !

Ces projets ont suscité aux USA un immense enthousiasme et, finalement, assez peu de critiques. Parmi celles-ci, listons les principales parce qu’on n’a pas fini d’en parler :

1) Problèmes techniques : manipulation des ouvrages lors des opérations de scanning.

2) Problèmes liés au financement par la publicité.

3) Problèmes des droits d’auteur et du copyright (idem que pour la musique en ligne…).

En Europe, le débat s’est focalisé autour de la réaction de Jean-Noël Jeanneney, Président de la BN. Aux propositions de Google, il a opposé des arguments supplémentaires qui dépassent largement les aspects techniques du dossier.

4) Problème de la destination des données. Pour JNJ, « accumuler, ce n’est pas organiser ». Il faut (et qui doit ?) s’occuper de la codification, des répertoires, des indexations. C’est un travail que le bibliothécaire ne peut abandonner à l’intégrateur. Même dans ce cas, il faut déterminer des standard communs à toutes les bibliothèques. Sinon, on fait un Quid ou on prend le risque de disperser les données dans les millions de pages de Google.

5) Problème de l’hégémonie de Google : Est-il raisonnable qu’à terme, l’accès aux données soit subordonné aux préoccupations financières d’une seule société privée.

6) Problème de l’hégémonie linguistique : Puisqu’il s’agit d’une multinationale, quelle place va-t-on garantir aux productions de langue française, aux autres langues que l’anglais, dans les répertoires, les classements, et la promotion.

7) L’avenir des bibliothèques : Peut-on lancer un programme de numérisation et en confier l’exploitation à une entreprise dont l’objet n’est pas lié à l’avenir physique du livre. S’agit-il, dès lors, de mettre un contenu à disposition des internautes, au détriment des bibliothèques ou, au contraire, de faire venir les lecteurs dans les bibliothèques ?

8) La question déontologique : à supposer qu’on résolve toutes les questions précédentes, jusqu’où peut-on disséquer un livre, le présenter en « page d’informations », sans respecter l’ouvrage dans sa cohérence et menacer ainsi son intégrité. « Un livre de littérature n’est pas qu’un ensemble de pages écrites ».

Sur la base de ces questions, 19 bibliothèques européennes (Allemagne, Finlande, Grèce, Espagne, Belgique et toutes celles qui sont implantées dans l’ancien bloc de l’Est) ont signé leur adhésion à un contre-projet européen. Pour le moment, au stade de l’idée, avec demande de financement auprès de l’UE…

Oui, cette affaire est passionnante parce qu’elle remet en cause l’inertie de notre secteur culturel public (l’offre de Google a réveillé nos gestionnaires publics). Elle oblige les acteurs culturels à « penser la démarche technologique » non pas simplement comme média, comme support, mais comme façonneur de contenu (30 ans après Marshall Mac Luhan, c’est pas trop tôt).

Le chantier est immense. Une chose est certaine : en focalisant le débat sur les techniques de numérisation, on se trompe. D’abord parce qu’on peut résoudre la moitié de ces problèmes en élaborant des cahiers des charges adaptés. Mais surtout, cet aspect de la question restera mineur si l’on ne traite pas de l’essentiel : l’exploitation des contenus et les critères de sélection par les moteurs de recherche.

Google n’a jamais fait mystère de ses objectifs : accroître la masse de données accessibles pour multiplier les occasions de ramasser de la publicité (je ne polémique pas, je ne fais que citer le leitmotiv d’Adam Smith, le responsable du projet). Du quantitatif donc.

Ce que réclame Jean-Noël Jeanneney, c’est du qualitatif. Nous retrouvons ici la problématique sur laquelle nous avons échangé, celle des critères de référencement et de classement des moteurs de recherche (blog du 4 mai). A suivre, donc…

Michel-Edouard Leclerc