Mardi, 24 février 2009

Le plan de relance américain rend obligatoire l’utilisation du XML!

Classé dans : XML — Daniel Lemire @ 12:17

Le gouvernement américain vient de lancer un nouveau plan de relance. Rien de bien original? Sauf que les agences gouvernementales devront rendre disponible leurs rapports sous le forme de documents XML de type Atom ou RSS.

Source: Aaron Swartz

Vendredi, 30 janvier 2009

Le moteur de recherche Lucène est maintenant commercialisé

Classé dans : Recherche d'informations — Daniel Lemire @ 10:01

Le moteur de recherche open source Lucène utilisé dans les cours INF 6460 et INF 6104 est maintenant commercialisé: il sera maintenant possible d’obtenir du soutien technique pour ce logiciel.

Vendredi, 12 décembre 2008

JOLAP est mort, vive OLAP4j?

Classé dans : Entrepôts de données — Daniel Lemire @ 10:18

Il existe un langage équivalent à SQL pour les bases de données multidimensionnelles (OLAP) appelé MDX. Malheureusement, alors que XML a l’API DOM, OLAP aurait bien besoin d’une API normalisée permettant de développer des applications sur la base des moteurs multidimensionnelles. J’annonçais en 2005 qu’un candidat à la normalisation, Java OLAP Interface (JOLAP), semble ne pas avoir d’avenir. Julian Hyde a alors proposé olap4j. Cependant, il semble qu’olap4j connaît aussi des difficultés, même au sein des technologies d’affaires open source tel que le projet  Eclipse BIRT.

Mardi, 2 décembre 2008

La technologie Google par Michael Nielsen

Classé dans : Recherche d'informations — Daniel Lemire @ 5:36

Michael Nielsen vient de publier la première partie d’un cours sur la technologie Google. Michael présente une analyse de PageRank similaire à ce qu’on trouve à la semaine 11 de mes cours INF 6460 et INF 6104.

Mardi, 25 novembre 2008

Évaluation des sites web des partis politiques

Classé dans : Recherche d'informations, XML — Daniel Lemire @ 4:37

Le web devrait être universellement accessible. Les personnes handicappées devraient pouvoir naviguer sur tous les sites importants.

Dans cet esprit, les gens d’AccessibilitéWeb ont étudié les sites web des partis politiques québécois. Il se trouve que le Parti Québecois, puis Québec Solidaire, sont les grands gagnants de cette analyse. Par contre, il reste beaucoup de progrès à faire même chez le Parti Québécois.

Vendredi, 7 novembre 2008

Moteurs de recherche d’entreprise versus Google

Classé dans : Recherche d'informations — Daniel Lemire @ 10:42

Daniel Tunkelang souligne que chercher des documents au sein d’une entreprise est parfois plus difficile que de chercher des pages sur le web. En effet, si les pages web sont destinées à accueillir des visiteurs et à les rediriger aux besoins, les documents d’une entreprise sont souvent conçus pour un usage unique et un contexte particulier qui ne prend pas en compte la recherche documentaire.

Mercredi, 5 novembre 2008

Sélection des courriels sur la base de la langue

Classé dans : Recherche d'informations — Daniel Lemire @ 1:23

Avec GMail, on peut sélectionner de manière approximative les courriels selon leur langue. Il suffit de taper dans le moteur de recherche:

language:french

ou

language:chinese in:spam

Google fait sans doute une analyse statistiques des n-grammes pour déterminer la langue utilisée.

Lundi, 3 novembre 2008

Décomposer un document XML en noeuds… en ligne!

Classé dans : sans catégorie — Daniel Lemire @ 11:13

Il peut être parfois un peu difficile de comprendre la notion de noeud en XML. Le mieux est d’apprendre avec des exemples. Je viens donc de publier un nouvel outil qui décompose n’importe quel document XML en noeuds.

Mardi, 28 octobre 2008

À la découverte du microblogue

Classé dans : Recherche d'informations, XML — Daniel Lemire @ 10:05

Depuis quelques semaines, j’ai un microblogue sur twitter. Essentiellement, un microblogue est une suite de messages courts et éphémères. Si vous vous intéressez à ce que je fais en ce moment, vous pourrez peut-être en avoir une meilleure idée en lisant mon microblogue!

Un des avantages du microblogue est que dès que le microbillet est écrit, il est possible de le trouver avec le moteur de recherche de Twitter, alors qu’un billet sur un blogue doit d’abord être indexé par Google, ce qui peut prendre plusieurs jours. C’est moins une caractéristique du microblogue qu’une conséquence du fait que Twitter demeure le principal hébergeur des microblogues et qu’il peut donc tout indexer à la volée.

Évidemment, mon microblogue est disponible en XML. En fait, Twitter offre la plupart des données au format XML, incluant les résultats de recherche.

Tiens, tiens! Il n’y a pas d’article microblogue sur wikipédia?

Samedi, 18 octobre 2008

Des menus déroulants avec CSS

Classé dans : XML — Daniel Lemire @ 11:07

Des menus déroulants avec CSS? C’est possible! Voici un example :

« Page précédentePage suivante »

XHTML valide

Powered by WordPress