Posté le 17 déc 2010 dans la catégorie:A la Une. Vous pouvez suivre les réponses via le fil RSS 2.0.
Vous pouvez laisser un commentaire ou un trackback depuis votre site
Alors que paraissent des travaux dans Science, qui décortiquent le contenu de 5 millions d’ouvrages, Google lance aujourd’hui une banque de données des mots de son immense bibliothèque. Première impressions, sur fond de réchauffement climatique.
Cinq cent milliards de mots. C’est ce que contiennent les 5 millions de livres analysés par une équipe scientifique qui présente ses résultats aujourd’hui dans la revue Science. Soit 4% de ce que l’humanité a produit depuis qu’on imprime des livres. Un extrait des 12 millions de livres numérisés par Google depuis 2004. L’équipe, formée principalement de biologistes, mathématiciens et de stastisticiens, a travaillé pendant 3 ans 1/2 pour montrer quelques-unes des fonctions de son outil: évolution des verbes irréguliers en anglais, variation de popularité des noms propres, impact de la censure politique, à l’époque nazie dans les livres allemands, du Mccarthysme aux Etats-Unis, ou lors des événements de Tienanmen dans les ouvrages chinois… Pour en savoir plus sur Culturomics.org, cet outil que Google a mis en ligne il y a quelques heures, je vous invite àvous reporter au papier que je publie dans Le Temps ce matin. Les chercheurs ont choisi ce drôle de mot, culturomique en français, la contraction de culture et de génomique, histoire de rappeler que c’est la course au génome qui nous a appris à fouiller dans des milliards de données.
Lire la suite :
http://effetsdeterre.fr/2010/12/17/le-monde-a-portee-de-mots/