Mardi, 15 janvier 2008

De meilleurs temps d’accès avec les disques Flash

Enregistré dans : Recherche d'informations — Daniel Lemire @ 9:23 pm

Steve Jobs vient de présenter le MacBook Air. Il est mince et léger, mais ce qui m’intéresse est qu’il utilise un disque Flash:

Utilisant une technologie similaire à celle d’iPod nano et d’autres produits à mémoire flash, MacBook Air intègre pour la première fois un disque SSD (solid-state drive). Disponibles en deux capacités, ces disques ne contiennent aucune pièce amovible et accèdent aux données beaucoup plus rapidement que les disques durs standard, ce qui se traduit par un gain notable de performances lors du démarrage de l’ordinateur et de l’ouverture des fichiers et des applications. En outre, les disques SSD offrent une meilleure durabilité et préservent mieux les données en cas de chute accidentelle.

Plus tôt, IBM et EMC nous annonçait la disponibilité de solutions à base de disques Flash pour les entreprises.

Les disques Flash sont intéressants:

  • Ils sont environ 250 fois plus rapides.
  • Ils utilisent moins d’électricité (environ 30% de moins).
  • Ils sont silencieux.
  • Ils sont petits.
  • Ils sont 15 à 20 fois plus chers, mais leurs prix diminuent rapidement.

La mémoire RAM a un temps d’accès qui n’est que 10 à 20 fois plus petit. Ces nouveaux disques viennent réduire l’écart entre la mémoire interne et la mémoire externe. Cependant, les disques Flash supportent mal l’écriture aléatoire. Il vaut mieux écrire sur de tels disques de manière séquentielle.

Dimanche, 6 janvier 2008

Corriger le HTML?

Enregistré dans : XML — Daniel Lemire @ 10:50 am

Douglas Crockford dans Fixing HTML propose de corriger le HTML. Il commence par remettre en question le XHTML qui est, selon lui, un échec.

Voici quelques suggestions intéressantes pour la norme HTML 5:

  • Seul l’encodage des caractères UTF-8 devrait être permis.
  • La création de balises à la volée. Vous avez besoin d’un élément de type «menu»? Vous pouvez en créer un!
  • La création d’attributs à la volée. Vous avez besoin d’un attribut de type «auteur»? Vous pouvez en créer un!

Vendredi, 7 décembre 2007

Tracer des graphiques avec la Google Chart API

Enregistré dans : Recherche d'informations, XML — Daniel Lemire @ 9:21 am

Google vient de lancer la Google Chart API! Un service web de type REST.

Imaginions que vous vouliez représenter les valeurs 10, 58 et 95. L’URI suivant (sur une seule ligne) fera l’affaire:


http://chart.apis.google.com/chart?chs=200x125
&chd=t:10.0,58.0,95.0
&cht=bvs

Voici le résultat:

Lundi, 3 décembre 2007

Quintura: un nouveau moteur de recherche avec une interface innovative

Enregistré dans : Recherche d'informations — Daniel Lemire @ 7:51 am

Quintura est un moteur de recherche qui permet d’explorer des termes voisins du terme que vous avez saisi, pour vous aider à préciser votre requête.

Mercredi, 28 novembre 2007

PageRank: que du marketing?

Enregistré dans : Recherche d'informations — Daniel Lemire @ 7:07 pm

Selon certains chercheurs, il semble que PageRank ne soit pas particulièrement un bon algorithme malgré sa grande popularité et son prestige certain. Voyez plutôt ce qu’en disent Upstill et al.:

Log of indegree was highly correlated with Google-reported PageRank scores, and just as effective when predicting desirable company attributes. Further, we found that PageRank scores for sites within a known spam network were no lower than would be expected on the basis of their indegree. We encounter no compelling evidence to support the use of PageRank over indegree.

Référence: Upstill, T. and Craswell, N. and Hawking, D., Predicting fame and fortune: Pagerank or indegree, ADCS2003, 2003.

Autres références
: Hits on the web: how does it compare? et Beyond PageRank: Machine Learning for Static Ranking.

Mardi, 27 novembre 2007

Ne passez pas par Google: allez directement à Wikipédia!

Enregistré dans : Recherche d'informations — Daniel Lemire @ 4:01 pm

Véronis souligne que dans le tier des cas, Google offre un lien vers Wikipédia comme premier résultat. Son explication est très intéressante:

Comment expliquer cet intérêt soudain pour Wikipedia de la part des deux moteurs ? (…)Le bon vieux temps de l’algorithme PageRank est révolu. (…) L’explosion des blogs et des sites de news a fortement changé la donne.

S’abonner à ce blogue:
- par lecteur,
- par courriel.

Lundi, 26 novembre 2007

Comment résoudre des problèmes difficiles

Enregistré dans : Mathématiques — Daniel Lemire @ 8:14 am

Je constate souvent que des étudiants semblent ne pas connaître de stratégie efficace pour s’attaquer à des problèmes difficiles. Pourtant, c’est la clef du succès en science et technologie.

La recette est pourtant simple: si vous ne savez pas comment résoudre un problème, il faut le transformer. La transformation peut prendre plusieurs formes:

  • On peut tailler une tranche du problème. Si vous ne savez pas résoudre le problème lui-même, peut-être est-ce que vous pouvez résoudre un cas particulier du problème? Si votre problème est abstrait, c’est souvent la meilleure solution.
  • On peut considérer un problème plus général. Il arrive qu’un cas particulier du problème que vous tentiez de résoudre ne vous dise rien, mais qu’une version plus générale du problème vous soit familière.
  • Vous pouvez découper le problème. Il arrive que le problème soit trop complexe ou trop difficile et que même des cas particuliers du problème soient trop difficiles. On peut alors découper le problème en plus petits problèmes et tenter de les résoudre.

L’objectif est toujours le même: vous devriez faire en sorte que vous puissiez toujours faire de petits progrès de telle manière à ce que vous puissiez eventuellement résoudre le problème. Il ne faut jamais rester figé devant un problème. Il faut toujours le transformer, le retourner, faire preuve d’imagination et, surtout, ne pas se laisser intimider.

La persévérance est sans aucun doute ce qui différentie le plus les gens qui sont capables de résoudre des problèmes difficiles des autres.

Vendredi, 16 novembre 2007

AT&T a gagné le prix de 50 000$ de la compétition Netflix

Enregistré dans : Recherche d'informations — Daniel Lemire @ 8:53 am

AT&T est le gagnant du $50,000 Progress Prize offert par la compagnie Netflix dans le cadre de son concours de filtrage collaboratif. L’objectif de la compétition est d’améliorer les algorithmes de filtrage collaboration par au moins 10% avec un prix d’un million de dollars à la clef. L’équipe d’AT&T a publié la description complète de leur solution.

Lundi, 29 octobre 2007

INFO 242 - XML Foundations

Enregistré dans : XML — Daniel Lemire @ 8:55 am

Erik Wilde rend disponible le contenu de son cours sur XML offert à l’Université de Californie à Berkeley. Voici quelques éléments intéressants de son cours:

Mercredi, 10 octobre 2007

La désambiguation des mots avec wikipédia

Enregistré dans : Recherche d'informations — Daniel Lemire @ 12:54 pm

En recherche d’informations, les mots peuvent avoir plusieurs sens. Je me demandais récemment si on ne pouvais pas utiliser wikipédia pour résoudre ce problème. En effet, wikipédia connaît la différence entre Java (l’île) et Java (le langage). Il se trouve que Google a mis au point et breveté cette même technique!

Bunescu, R. and Pasca, M., Using Encyclopedic Knowledge for Named Entity Disambiguation, EACL-06, 2006.

(Source.)

« Page précédentePage suivante »

XHTML valide

Powered by WordPress