Jeudi, 25 juin 2009

Entrevue avec Tim Bray sur l’avenir du Web

Classé dans : XML — Daniel Lemire @ 12:03

Tim Bray, un des inventeurs du XML, a accordé une entrevue sur l’avenir du Web (en anglais).

Mercredi, 10 juin 2009

Transitivité et inégalité du triangle: est-ce la même chose?

Classé dans : Recherche — Daniel Lemire @ 1:19

Frédérik montre que l’inégalité du triangle n’implique pas la transitivité. Ainsi, montrer que la transitivité n’est pas satisfaite ne suffit pas à conclure que l’inégalité du triangle ne tient pas.

Je vous soumet qu’une violation de la transitivité peut pratiquement toujours être comprise comme une violation d’inégalités du triangle. En effet, dans l’exemple de Frédérik, on dit que A et B sont similaires si s(A,B) est plus petit qu’une petite constante. Voici deux inégalités du triangle qui impliquent la transitivité: s(A,B)+s(B,C) > 2 s(A,C) et max(s(A,B),s(B,C)) > s(A,C) .

Vendredi, 5 juin 2009

Accélérez vos sites web!

Classé dans : XML — Daniel Lemire @ 10:06

Google rend disponible un outil permettant d’analyser vos sites web afin d’accélérer le chargement des pages. Page Speed est un plugin pour le navigateur Firefox. Avant d’installer Page Speed, il faut d’abord installer le plugin Firebug. Page Speed fait une analyse de vos instructions CSS.

Lundi, 11 mai 2009

Comment créer un fil RSS à partir d’un groupe Facebook

Classé dans : Recherche d'informations, XML — Daniel Lemire @ 9:44

Les forums de Facebook sont excellents à bien des points de vue. Malheureusement, ils ne permettent pas de recevoir automatiquement un avis chaque fois qu’un ajout est fait sur le forum. Heureusement, il existe une solution. L’application web Facebook Group RSS Feed permet d’obtenir un fil RSS à partir de tout forum facebook. Il suffit de trouve l’identifiant du groupe.  Par exemple, si l’URI du groupe est

http://www.facebook.com/group.php?gid=57220667716&ref=ts

alors, l’identifiant est 57220667716. Il suffit de saisir ce nombre pour obtenir en retour un fil RSS. Ce fil RSS peut être utilisé en conjonction avec un aggrégateur RSS tel que Google Reader pour surveiller sans effort les activités d’un forum.

Lundi, 27 avril 2009

Identification de la langue d’un texte

Classé dans : Recherche d'informations — Daniel Lemire @ 2:48

Comment est-ce qu’une machine fait-elle pour déterminer sur un bout de texte donné est en anglais ou en français? L’approche la plus commune se base sur les statistiques des n-grammes. (Pour en savoir plus, voir l’article Modèles de langue du cours INF 6460.) Mais que fait-on lorsqu’il y a un mélange de langues anglaise et française? Comment savoir où se termine le français et où débute l’anglais?

Will Fitzgerald de chez Powerset (Microsoft) a publié les transparents d’une présentation sur l’identification de la langue d’un texte. Il fournit de nombreux exemples pratiques. Il nous invite aussi à consulter un article de ses collègues, Unsupervised Language Identification.

Jeudi, 16 avril 2009

Bénéfices et mythes du RDF

Classé dans : XML — Daniel Lemire @ 11:23

Michael Bergman a publié un billet, que je trouve intéressant, intitulé Advantages and Myths of RDF. Il y reprend certains des avantages du RDF:

  • C’est une norme ouverte et bien supportée.
  • Le RDF permet de faire du traitement automatique, sans pour autant dépendre de schémas rigides.

Il y dénonce aussi quelques mythes:

  • Le RDF est équivalent au XML.
  • Le RDF s’écrit en XML.

Mardi, 31 mars 2009

Nouvelle mouture du cours INF 6450

Classé dans : XML — Daniel Lemire @ 2:35

Nous publions aujourd’hui une nouvelle version des notes de cours pour INF 6450 (Gestion de l’information avec XML). La nouvelle version devrait être en ligne vers 17h aujourd’hui. La version papier du manuel ne sera disponible que plus tard cet été.

J’ai corrigé environ une centaine de coquilles dans les 400 pages du manuel. J’aimerais remercier tous les étudiants qui m’ont aidé en me faisant des commentaires.

Il n’y a pas de grande nouveauté dans le matériel du cours. Ce fut une année de consolidation après les nombreux ajouts de l’an passé.

Par contre, j’abandonne les forums de l’Université pour un groupe sur Facebook. Il sera dorénavant obligatoire d’y participer! J’espère que les activités de discussion en ligne seront plus intéressantes cette année!

Mardi, 24 février 2009

Clay Shirky et la crise du trop-plein d’informations

Classé dans : Recherche d'informations — Daniel Lemire @ 7:13

Clay Shirky est l’auteur bien connu de plusieurs livres portant sur les technologies web. Cet exposé sur le trop-plein d’informations est particulièrement intriguante (en anglais):

Le plan de relance américain rend obligatoire l’utilisation du XML!

Classé dans : XML — Daniel Lemire @ 12:17

Le gouvernement américain vient de lancer un nouveau plan de relance. Rien de bien original? Sauf que les agences gouvernementales devront rendre disponible leurs rapports sous le forme de documents XML de type Atom ou RSS.

Source: Aaron Swartz

Vendredi, 30 janvier 2009

Le moteur de recherche Lucène est maintenant commercialisé

Classé dans : Recherche d'informations — Daniel Lemire @ 10:01

Le moteur de recherche open source Lucène utilisé dans les cours INF 6460 et INF 6104 est maintenant commercialisé: il sera maintenant possible d’obtenir du soutien technique pour ce logiciel.

Page suivante »

XHTML valide

Powered by WordPress