La recherche d’images express

mardi 27 mai 2008 Economie

Une méthode mathématique qui vient d’être mise au point parvient à analyser des images tellement compressées qu’elles n’occupent plus qu’un kilo-octet. Cette avancée permet à un simple PC de fouiller une bibliothèque aussi vaste que le web.

Jusqu’où peut-on dégrader une image de sorte qu’elle reste reconnaissable ? La question n’est pas si triviale qu’elle en a l’air et vient de recevoir une réponse de la part d’une équipe internationale. Ces chercheurs ont appliqué à des photographies la classique compression JPeg de nombreuses fois de suite. Le résultat est étonnant : la quantité minimale varie, selon les cas, entre 256 et 1.024 octets, soit moins du millième de l’encombrement habituel d’une photo produite par un appareil numérique. Après une telle cure d’amaigrissement, la qualité de la photo devient épouvantable mais l’équipe a démontré qu’elle restait reconnaissable.

Le but de Antonio Torralba (Massachussetts Institute of Technology), Rob Fergus (Courant Institute of Mathematical Sciences, université de New York) et Yair Weiss (School of Computer Science, Hebrew University, Jérusalem, Israël) n’était pas de réaliser une performance mais de mettre au point une méthode efficace pour trouver un certain type d’image parmi des milliers ou des millions. Actuellement, expliquent-ils, le Web regorge d’images que tout le monde peut utiliser. Même les ordinateurs personnels en stockent un très grand nombre sur leurs disques durs. Mais pour rechercher une image, on ne peut encore que se limiter à du texte, en l’occurrence son titre ou des mots-clés. La reconnaissance de formes existe mais elle est très lente et reste inapplicable à de grands stocks d’images. Impossible, en pratique, pour un logiciel de résoudre ce problème simple : « quelles sont les photographies où l’on voit un paysage verdoyant ? ».
Les traits caractéristiques d’une image

D’où cette idée : simplifions les images au maximum pour en faire des copies de faible taille (en octets) et mettons au point une méthode mathématique pour caractériser les formes qui s’y trouvent. C’est ce qu’ont fait les trois chercheurs. « Nous essayons de trouver un code binaire très court pour identifier une image » précise Antonio Torralba. Pour l’instant, la méthode qu’ils ont mise au point fonctionne par comparaison. A partir d’une image test, elle sait trouver dans une photothèque toutes celles qui lui ressemblent. Montrez-lui une photo de paysage et le logiciel rapportera tous les paysages de la base de données. Si, parmi, ces images, l’une d’elles a déjà été identifiée par un être humain par le mot « paysage », alors le problème est complètement résolu. Le logiciel sait désormais que ce mot s’applique à toutes les images qu’il a trouvées.

Avec une taille par image réduite entre 256 et 1.024 octets, la méthode permet un travail rapide. Un simple ordinateur personnel peut alors effectuer le travail dans un temps raisonnable en utilisant une quantité de mémoire relativement faible. Pour leurs tests, les chercheurs ont ainsi enregistré 12,9 millions de photographies issues d’Internet dans seulement 600 Mo.

Cette recherche n’est qu’une étape insiste les chercheurs. Il faut qu’au moins l’une des images trouvées ait été identifiée et le problème reste entier pour les objets inhabituels qui figurent rarement dans les images. Mais ce travail brise une limite, en permettant à la puissance informatique d’un micro-ordinateur de fouiller dans d’immenses bases de données, à commencer par le Web.


futura sciences

Répondre à cet article

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici
  • Ce formulaire accepte les raccourcis SPIP [->url] {{gras}} {italique} <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Suivre les commentaires : RSS 2.0 | Atom

Articles relatifs