Logo de Webaroo

La startup Webaroo propose une technologie de cache thématique afin de fournir aux internautes un système de navigation hors-ligne. Il est ainsi possible de télécharger des packs thématiques sur un dispositif mobile (un ordinateur portable) susceptible de ne pas bénéficier souvent d'une connexion Internet. Chaque pack contient une sélection de pages Web choisies selon un algorithme spécifique, qui, selon Webaroo, permet d'obtenir des pages de haute qualité (haute densité d'information). L'utilisateur peut également réaliser des recherches sur ces pages sélectionnées et lorsqu'il est connecté, il peut resynchroniser sa collection de pages Web afin de rafraîchir son contenu.

Le logiciel de téléchargement et synchronisation du cache local n'est disponible que pour Windows (il utilise .Net). Peut-être bientôt un portage Mono ?

Petite question subsidiaire : peut-on à terme conserver tout le Web sur son disque dur en local ? Actuellement, on estime le nombre de pages Web constituant le Web statique accessible (indexable par les moteurs de recherche) à 10 milliards de pages. En estimant qu'une page Web compressée occupe environ 4 Ko en moyenne (sans prendre en compte les éventuelles images et éléments multimédias liés), il est nécessaire de disposer 40 téra-octets de mémoire de masse. C'est très facilement envisageable : un disque dur actuel pouvant atteindre une capacité de 500 Go, il suffit de moins de 100 disques durs pour indexer tout le contenu textuel du Web (reste ensuite à constituer un index inversé afin de réaliser un moteur de recherche[1]). En revanche, une telle capacité de stockage est encore peu aisément transportable : il faudra attendre le développement et la généralisation des supports de stockage holographiques ou sur ADN afin d'améliorer drastiquement la densité de stockage d'information. Mais la taille du Web n'évoluera-t-elle pas plus vite que l'augmentation de la densité de stockage ? Probablement pas car l'expansion du Web atteindra un seuil plus vite que celle des densités de stockage. En attendant, Webaroo a pour projet de stocker sur un disque dur de 80 Go (disque dur standard de portable actuel) l'essentiel du Web.

  1. Finalement créer un moteur de recherche ne demande pas tant de ressources matérielles que l'on peut imaginer.
🗓 Publié le lundi 10 avril 2006
Envoyez vos commentaires à propos de cet article