Dimanche, 6 janvier 2008

Corriger le HTML?

Filed under: XML — Daniel Lemire @ 10:50

Douglas Crockford dans Fixing HTML propose de corriger le HTML. Il commence par remettre en question le XHTML qui est, selon lui, un échec.

Voici quelques suggestions intéressantes pour la norme HTML 5:

  • Seul l’encodage des caractères UTF-8 devrait être permis.
  • La création de balises à la volée. Vous avez besoin d’un élément de type «menu»? Vous pouvez en créer un!
  • La création d’attributs à la volée. Vous avez besoin d’un attribut de type «auteur»? Vous pouvez en créer un!

Vendredi, 7 décembre 2007

Tracer des graphiques avec la Google Chart API

Filed under: Recherche d'informations,XML — Daniel Lemire @ 9:21

Google vient de lancer la Google Chart API! Un service web de type REST.

Imaginions que vous vouliez représenter les valeurs 10, 58 et 95. L’URI suivant (sur une seule ligne) fera l’affaire:

http://chart.apis.google.com/chart?chs=200x125

&chd=t:10.0,58.0,95.0
&cht=bvs

Voici le résultat:

Lundi, 3 décembre 2007

Quintura: un nouveau moteur de recherche avec une interface innovative

Filed under: Recherche d'informations — Daniel Lemire @ 7:51

Quintura est un moteur de recherche qui permet d’explorer des termes voisins du terme que vous avez saisi, pour vous aider à préciser votre requête.

Mercredi, 28 novembre 2007

PageRank: que du marketing?

Filed under: Recherche d'informations — Daniel Lemire @ 7:07

Selon certains chercheurs, il semble que PageRank ne soit pas particulièrement un bon algorithme malgré sa grande popularité et son prestige certain. Voyez plutôt ce qu’en disent Upstill et al.:

Log of indegree was highly correlated with Google-reported PageRank scores, and just as effective when predicting desirable company attributes. Further, we found that PageRank scores for sites within a known spam network were no lower than would be expected on the basis of their indegree. We encounter no compelling evidence to support the use of PageRank over indegree.

Référence: Upstill, T. and Craswell, N. and Hawking, D., Predicting fame and fortune: Pagerank or indegree, ADCS2003, 2003.

Autres références
: Hits on the web: how does it compare? et Beyond PageRank: Machine Learning for Static Ranking.

Mardi, 27 novembre 2007

Ne passez pas par Google: allez directement à Wikipédia!

Filed under: Recherche d'informations — Daniel Lemire @ 4:01

Véronis souligne que dans le tier des cas, Google offre un lien vers Wikipédia comme premier résultat. Son explication est très intéressante:

Comment expliquer cet intérêt soudain pour Wikipedia de la part des deux moteurs ? (…)Le bon vieux temps de l’algorithme PageRank est révolu. (…) L’explosion des blogs et des sites de news a fortement changé la donne.

S’abonner à ce blogue:
- par lecteur,
- par courriel.

Lundi, 26 novembre 2007

Comment résoudre des problèmes difficiles

Filed under: Mathématiques — Daniel Lemire @ 8:14

Je constate souvent que des étudiants semblent ne pas connaître de stratégie efficace pour s’attaquer à des problèmes difficiles. Pourtant, c’est la clef du succès en science et technologie.

La recette est pourtant simple: si vous ne savez pas comment résoudre un problème, il faut le transformer. La transformation peut prendre plusieurs formes:

  • On peut tailler une tranche du problème. Si vous ne savez pas résoudre le problème lui-même, peut-être est-ce que vous pouvez résoudre un cas particulier du problème? Si votre problème est abstrait, c’est souvent la meilleure solution.
  • On peut considérer un problème plus général. Il arrive qu’un cas particulier du problème que vous tentiez de résoudre ne vous dise rien, mais qu’une version plus générale du problème vous soit familière.
  • Vous pouvez découper le problème. Il arrive que le problème soit trop complexe ou trop difficile et que même des cas particuliers du problème soient trop difficiles. On peut alors découper le problème en plus petits problèmes et tenter de les résoudre.

L’objectif est toujours le même: vous devriez faire en sorte que vous puissiez toujours faire de petits progrès de telle manière à ce que vous puissiez eventuellement résoudre le problème. Il ne faut jamais rester figé devant un problème. Il faut toujours le transformer, le retourner, faire preuve d’imagination et, surtout, ne pas se laisser intimider.

La persévérance est sans aucun doute ce qui différentie le plus les gens qui sont capables de résoudre des problèmes difficiles des autres.

Vendredi, 16 novembre 2007

AT&T a gagné le prix de 50 000$ de la compétition Netflix

Filed under: Recherche d'informations — Daniel Lemire @ 8:53

AT&T est le gagnant du $50,000 Progress Prize offert par la compagnie Netflix dans le cadre de son concours de filtrage collaboratif. L’objectif de la compétition est d’améliorer les algorithmes de filtrage collaboration par au moins 10% avec un prix d’un million de dollars à la clef. L’équipe d’AT&T a publié la description complète de leur solution.

Lundi, 29 octobre 2007

INFO 242 – XML Foundations

Filed under: XML — Daniel Lemire @ 8:55

Erik Wilde rend disponible le contenu de son cours sur XML offert à l’Université de Californie à Berkeley. Voici quelques éléments intéressants de son cours:

Mercredi, 10 octobre 2007

La désambiguation des mots avec wikipédia

Filed under: Recherche d'informations — Daniel Lemire @ 12:54

En recherche d’informations, les mots peuvent avoir plusieurs sens. Je me demandais récemment si on ne pouvais pas utiliser wikipédia pour résoudre ce problème. En effet, wikipédia connaît la différence entre Java (l’île) et Java (le langage). Il se trouve que Google a mis au point et breveté cette même technique!

Bunescu, R. and Pasca, M., Using Encyclopedic Knowledge for Named Entity Disambiguation, EACL-06, 2006.

(Source.)

Jeudi, 4 octobre 2007

Conférence par Sergey Brin

Filed under: Recherche d'informations — Daniel Lemire @ 8:37

Voici une conférence offerte par Sergey Brin, co-fondateur de Google. Très intéressant.

« Page précédentePage suivante »

XHTML valide

Powered by WordPress