Mardi, 31 mars 2009

Nouvelle mouture du cours INF 6450

Filed under: XML — Daniel Lemire @ 2:35

Nous publions aujourd’hui une nouvelle version des notes de cours pour INF 6450 (Gestion de l’information avec XML). La nouvelle version devrait être en ligne vers 17h aujourd’hui. La version papier du manuel ne sera disponible que plus tard cet été.

J’ai corrigé environ une centaine de coquilles dans les 400 pages du manuel. J’aimerais remercier tous les étudiants qui m’ont aidé en me faisant des commentaires.

Il n’y a pas de grande nouveauté dans le matériel du cours. Ce fut une année de consolidation après les nombreux ajouts de l’an passé.

Par contre, j’abandonne les forums de l’Université pour un groupe sur Facebook. Il sera dorénavant obligatoire d’y participer! J’espère que les activités de discussion en ligne seront plus intéressantes cette année!

Mardi, 24 février 2009

Clay Shirky et la crise du trop-plein d’informations

Filed under: Recherche d'informations — Daniel Lemire @ 7:13

Clay Shirky est l’auteur bien connu de plusieurs livres portant sur les technologies web. Cet exposé sur le trop-plein d’informations est particulièrement intriguante (en anglais):

Le plan de relance américain rend obligatoire l’utilisation du XML!

Filed under: XML — Daniel Lemire @ 12:17

Le gouvernement américain vient de lancer un nouveau plan de relance. Rien de bien original? Sauf que les agences gouvernementales devront rendre disponible leurs rapports sous le forme de documents XML de type Atom ou RSS.

Source: Aaron Swartz

Vendredi, 30 janvier 2009

Le moteur de recherche Lucène est maintenant commercialisé

Filed under: Recherche d'informations — Daniel Lemire @ 10:01

Le moteur de recherche open source Lucène utilisé dans les cours INF 6460 et INF 6104 est maintenant commercialisé: il sera maintenant possible d’obtenir du soutien technique pour ce logiciel.

Vendredi, 12 décembre 2008

JOLAP est mort, vive OLAP4j?

Filed under: Entrepôts de données — Daniel Lemire @ 10:18

Il existe un langage équivalent à SQL pour les bases de données multidimensionnelles (OLAP) appelé MDX. Malheureusement, alors que XML a l’API DOM, OLAP aurait bien besoin d’une API normalisée permettant de développer des applications sur la base des moteurs multidimensionnelles. J’annonçais en 2005 qu’un candidat à la normalisation, Java OLAP Interface (JOLAP), semble ne pas avoir d’avenir. Julian Hyde a alors proposé olap4j. Cependant, il semble qu’olap4j connaît aussi des difficultés, même au sein des technologies d’affaires open source tel que le projet  Eclipse BIRT.

Mardi, 2 décembre 2008

La technologie Google par Michael Nielsen

Filed under: Recherche d'informations — Daniel Lemire @ 5:36

Michael Nielsen vient de publier la première partie d’un cours sur la technologie Google. Michael présente une analyse de PageRank similaire à ce qu’on trouve à la semaine 11 de mes cours INF 6460 et INF 6104.

Mardi, 25 novembre 2008

Évaluation des sites web des partis politiques

Filed under: Recherche d'informations,XML — Daniel Lemire @ 4:37

Le web devrait être universellement accessible. Les personnes handicappées devraient pouvoir naviguer sur tous les sites importants.

Dans cet esprit, les gens d’AccessibilitéWeb ont étudié les sites web des partis politiques québécois. Il se trouve que le Parti Québecois, puis Québec Solidaire, sont les grands gagnants de cette analyse. Par contre, il reste beaucoup de progrès à faire même chez le Parti Québécois.

Vendredi, 7 novembre 2008

Moteurs de recherche d’entreprise versus Google

Filed under: Recherche d'informations — Daniel Lemire @ 10:42

Daniel Tunkelang souligne que chercher des documents au sein d’une entreprise est parfois plus difficile que de chercher des pages sur le web. En effet, si les pages web sont destinées à accueillir des visiteurs et à les rediriger aux besoins, les documents d’une entreprise sont souvent conçus pour un usage unique et un contexte particulier qui ne prend pas en compte la recherche documentaire.

Mercredi, 5 novembre 2008

Sélection des courriels sur la base de la langue

Filed under: Recherche d'informations — Daniel Lemire @ 1:23

Avec GMail, on peut sélectionner de manière approximative les courriels selon leur langue. Il suffit de taper dans le moteur de recherche:

language:french

ou

language:chinese in:spam

Google fait sans doute une analyse statistiques des n-grammes pour déterminer la langue utilisée.

Lundi, 3 novembre 2008

Décomposer un document XML en noeuds… en ligne!

Filed under: sans catégorie — Daniel Lemire @ 11:13

Il peut être parfois un peu difficile de comprendre la notion de noeud en XML. Le mieux est d’apprendre avec des exemples. Je viens donc de publier un nouvel outil qui décompose n’importe quel document XML en noeuds.

« Page précédentePage suivante »

XHTML valide

Powered by WordPress