Mercredi, 10 octobre 2007

La désambiguation des mots avec wikipédia

Enregistré dans : Recherche d'informations — Daniel Lemire @ 12:54 pm

En recherche d’informations, les mots peuvent avoir plusieurs sens. Je me demandais récemment si on ne pouvais pas utiliser wikipédia pour résoudre ce problème. En effet, wikipédia connaît la différence entre Java (l’île) et Java (le langage). Il se trouve que Google a mis au point et breveté cette même technique!

Bunescu, R. and Pasca, M., Using Encyclopedic Knowledge for Named Entity Disambiguation, EACL-06, 2006.

(Source.)

Jeudi, 4 octobre 2007

Conférence par Sergey Brin

Enregistré dans : Recherche d'informations — Daniel Lemire @ 8:37 am

Voici une conférence offerte par Sergey Brin, co-fondateur de Google. Très intéressant.

Mercredi, 26 septembre 2007

Des sociétés à suivre en recherche d’informations

Enregistré dans : Recherche d'informations — Daniel Lemire @ 8:44 am

Une des compagnies les plus en vue présentement dans le domaine de la recherche d’informations est Powerset. Mon cours de recherche d’informations comprend d’ailleurs une entrevue avec un de leurs employés (Will Fitzgerald). L’objectif visé par Powerset est d’ajouter l’analyse de la langue à la recherche d’informations pour permettre de répondre à des requêtes plus fines que les recherches par mots-clefs supportées par Google.

CastTV est une nouvelle société qui se spécialise dans la recherche de contenu vidéo basé sur leur emplacement dans les pages web et sur les méta-données disponibles. Viewdle est une autre société qui tente de résoudre le problème de la recheche de contenu vidéo, en analysant le contenu des vidéos pour en extraire des métadonnées.

FAROO est une société qui propose un moteur de recherche entièrement distribuée. Au lieu d’avoir un seul ensemble de serveurs, tel que Google, un tel système met plutôt à contribution les machines des utilisateurs.

Vendredi, 14 septembre 2007

Nouvelles brèves

Enregistré dans : Recherche d'informations, XML — Daniel Lemire @ 8:04 am

Le cours INF 6450 (Gestion de l’information avec XML) sera prochainement à l’offre publique. Après plus d’un an à la mise à l’essai, tous les étudiants qui ont rempli le questionnaire d’évaluation du cours ont dit qu’ils recommanderaient ce cours à d’autres étudiants en informatique.

Cette année, je vais préparer un cours de deuxième cycle: INF 6104 (recherche d’informations et web). Le cours reprendra l’orientation du cours INF 6460, mais avec des travaux différents.

Lundi, 27 août 2007

In Google we trust

Enregistré dans : Recherche d'informations — Daniel Lemire @ 4:23 pm

Selon Radio-Canada, une étude a montré que les utilisateurs de Google font aveuglément confiance à l’ordre dans lequel les résultats sont présentés.

Source: Allan Bernard.

Jeudi, 19 juillet 2007

Google Gadgets API

Enregistré dans : XML — Daniel Lemire @ 5:18 pm

La Google Gadgets API est un outil pour construire rapidement de petites applications Web à l’aide d’un simple fichier XML.

Voici un programme très simple:

<?xml version="1.0" encoding="UTF-8" ?>
<Module>
<ModulePrefs title="hello world example" />
<Content type="html">
<![CDATA[
Hello, world!
]]>
</Content>
</Module>

Voici un exemple de résultat plus sophistiqué:

ou un autre:

Jeudi, 21 juin 2007

Entrepôts de ressources d’apprentissage multimédia (ERASME)

Enregistré dans : Recherche — Daniel Lemire @ 8:44 am

Avec Gilbert Paquette et Petko Valtchev, j’ai décroché une subvention d’un million de dollars de la fondation canadienne pour l’innovation et du gouvernement du Québec pour bâtir un entrepôts de données à des fins de recherche. L’entrepôt comprendra des teraoctets d’espace de stockage et un amas de machines puissantes pour les calculs de haute performance.

Les autres chercheurs inclus dans le projet sont Martin Brooks (CNRC), Abdulmotaleb El Saddik (U. Ottawa), Étienne Gagnon (UQAM), Robert Godin (UQAM), Owen Kaser (UNB), Hakim Lounis (UQAM), François Magnan (UQAM), Olga Marino (UQAM), Hafedh Mili (UQAM), et Guy Tremblay (UQAM).

Mercredi, 6 juin 2007

Podcast de la troisième semaine (INF 6460)

Enregistré dans : Recherche d'informations, baladodiffusion — Daniel Lemire @ 1:11 pm

Voici le podcast de la troisième semaine. J’y discute des sources de données.

 
icon for podpress  Podcast de la troisième semaine (INF 6460) [23:04m]: Play Now | Play in Popup | Download

Podcast de la deuxième semaine (INF 6460)

Enregistré dans : Recherche d'informations, baladodiffusion — Daniel Lemire @ 1:09 pm

Voici le podcast de la deuxième semaine. J’y discute les données non structurées, les méta-données, etc.

 
icon for podpress  Standard Podcast [39:16m]: Play Now | Play in Popup | Download

Lundi, 28 mai 2007

Noël et le nouvel an

Enregistré dans : Recherche d'informations — Daniel Lemire @ 7:52 am

(Merci à Mahmoud El-Bachir.)

« Page précédentePage suivante »

XHTML valide

Powered by WordPress