Vendredi, 7 novembre 2008

Moteurs de recherche d’entreprise versus Google

Enregistré dans : Recherche d'informations — Daniel Lemire @ 10:42 am

Daniel Tunkelang souligne que chercher des documents au sein d’une entreprise est parfois plus difficile que de chercher des pages sur le web. En effet, si les pages web sont destinées à accueillir des visiteurs et à les rediriger aux besoins, les documents d’une entreprise sont souvent conçus pour un usage unique et un contexte particulier qui ne prend pas en compte la recherche documentaire.

Mercredi, 5 novembre 2008

Sélection des courriels sur la base de la langue

Enregistré dans : Recherche d'informations — Daniel Lemire @ 1:23 pm

Avec GMail, on peut sélectionner de manière approximative les courriels selon leur langue. Il suffit de taper dans le moteur de recherche:

language:french

ou

language:chinese in:spam

Google fait sans doute une analyse statistiques des n-grammes pour déterminer la langue utilisée.

Mardi, 28 octobre 2008

À la découverte du microblogue

Enregistré dans : Recherche d'informations, XML — Daniel Lemire @ 10:05 am

Depuis quelques semaines, j’ai un microblogue sur twitter. Essentiellement, un microblogue est une suite de messages courts et éphémères. Si vous vous intéressez à ce que je fais en ce moment, vous pourrez peut-être en avoir une meilleure idée en lisant mon microblogue!

Un des avantages du microblogue est que dès que le microbillet est écrit, il est possible de le trouver avec le moteur de recherche de Twitter, alors qu’un billet sur un blogue doit d’abord être indexé par Google, ce qui peut prendre plusieurs jours. C’est moins une caractéristique du microblogue qu’une conséquence du fait que Twitter demeure le principal hébergeur des microblogues et qu’il peut donc tout indexer à la volée.

Évidemment, mon microblogue est disponible en XML. En fait, Twitter offre la plupart des données au format XML, incluant les résultats de recherche.

Tiens, tiens! Il n’y a pas d’article microblogue sur wikipédia?

Vendredi, 15 août 2008

Un excellent livre en ligne (gratuit!) sur la recherche d’informations

Enregistré dans : Recherche d'informations — Daniel Lemire @ 12:53 pm

Quelle belle idée! Ce livre est disponible entièrement en ligne (en PDF et HTML):

Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.

Lundi, 28 juillet 2008

Cuil: un nouveau moteur de recherche est né

Enregistré dans : Recherche d'informations — Daniel Lemire @ 12:36 pm

Il y a dorénavant un nouveau compétiteur pour Google: Cuil. Malheureusement, il semble incapable de trouver le site Web du cours INF 6460, par exemple.

Mardi, 24 juin 2008

Une nouvelle science?

Enregistré dans : Recherche d'informations — Daniel Lemire @ 10:26 am

Chris Anderson nous annonce la fin de la science. Selon lui, dans un monde où nous avons une quantité quasiment infinie de données, les modèles théoriques deviennent moins importants.

Encore faut-il trouver ce qu’on cherche!

Jeudi, 13 mars 2008

Yahoo! mise sur le web sémantique

Enregistré dans : Recherche d'informations, XML — Daniel Lemire @ 6:47 pm

Il semble que Yahoo! mise maintenant sur le web sémantique pour concurrencer Google. Ils prévoient enrichir leurs outils de recherche avec le traitement des données RDF incluant Dublin Core, Creative Commons et FOAF.

Vendredi, 22 février 2008

La recherche d’informations et la nouvelle économie

Enregistré dans : Recherche d'informations — Daniel Lemire @ 8:29 am

Ce matin, j’ai trouvé un cours très intéressant par le professeur Panos de l’Université de New York intitulé Search and the New Economy. Le cours est en ligne avec des extraits vidéo.

Lundi, 18 février 2008

La recommandation d’articles scientifiques dans une bibliothèque numérique

Enregistré dans : Recherche d'informations — Daniel Lemire @ 11:24 am

André Vellino donnera une conférence en français sur les systèmes de recommandations dans nos bureaux (100, rue Sherbrooke ouest, local 2720) à 12h30 ce jeudi (21 février 2008).

Recommender systems for scientific digital libraries that have been the subject of experiments in recent years have used corpora that are primarily in the field of computer science. However, designing an effective recommender system for journal articles in a broader Scientific, Technical and Medical (STM) digital library poses special challenges and presents unique opportunities.

This talk describes a recommender system for scientific scholarly articles that is both hybrid (content and collaborative filtering based) and multi-dimensional (across different rating criteria.) Our hypothesis is that such a design for a recommendation engine can improve scientists’ ability to discover new knowledge from a digital library provided that an interface to these recommendations can simultaneously offer explanations for the recommendations and increase the user’s control over how the recommender behaves.

Cette conférence sera diffusée sur le web avec une technologie Microsoft: mms://mediasrv.lorit.ca/presentation.

Mardi, 12 février 2008

Des emplois en recherche d’informations à Montréal?

Enregistré dans : Recherche d'informations — Daniel Lemire @ 10:57 am

Yahoo! embauche des spécialistes de la recherche d’informations à Montréal. Fernando Diaz — un chercheur en recherche d’informations chez Yahoo! — m’a envoyé l’offre d’emploi suivante (en anglais).

Machine Learning / NLP / Information Retrieval Researcher

Yahoo! Applied Research Lab
Montreal, QC

Job Responsibilities

The NLP group in Yahoo’s Applied Research Lab is looking for an researcher with the following qualifications:

-Strong knowledge of the Information Retrieval (IR) field
-Deep familiarity and hands-on experience in machine learning techniques
-Ability to conduct experiments involving massive data sources (mainly text and data mining)
-Background in natural language processing or computational linguistics
-Proven experience in software development in the fields mentioned above

Minimum Job Qualifications

The work that this researcher is expected to be conducting will be in the general area of Information Retrieval, typically will be related to one of Yahoo!’s initiatives in the area of search, including but not limited to relevance ranking, question answering, information extraction, text classification or subjectivity analysis. The candidate will be expected to have impact on product initiatives and at the same time will be encouraged to contribute to the general research community by active participation in scientific forums, publications, etc.

Masters Degree required

Preferable Job Qualifications

PhD

Yahoo! Inc. is an equal opportunity employer. For more information, please contact Fernando Diaz (diazf@yahoo-inc.com), Jean-François Crespo (jfcrespo@yahoo-inc.com), or visit http://careers.yahoo.com.

Page suivante »

XHTML valide

Powered by WordPress