Mercredi, 16 avril 2008

La version 2008 du cours « Gestion de l’information avec XML » est en ligne!

Enregistré dans : XML — Daniel Lemire @ 10:15 am

Nous venons de mettre la nouvelle version du cours INF 6450 – Gestion de l’information avec XML en ligne. Il y a plusieurs nouveautés:

  • Le site du cours est maintenant compatible avec Firefox (Windows, Mac, Linux), Opera (Windows, Mac, Linux) et Safari (Windows et Mac). Il n’est toujours pas possible de naviguer correctement sur le site avec Internet Explorer.
  • Il y a maintenant davantage de questions d’autoévaluation.
  • J’ai ajouté plus de détails sur XSLT 2.0 et XPath 2.0 même si l’essentiel du cours porte toujours sur XSLT 1.0 et XPath 1.0.
  • L’introduction à XQuery est maintenant plus substantielle et une question dans le travail 4 a été ajoutée sur ce sujet.
  • Une introduction au HTML 5 a été ajoutée.
  • Il y a un traitement plus complet de Relax NG, incluant maintenant une documentation des types définis pour XML Schema.
  • Le travail 2 portant sur une discussion collaborative peut maintenant se faire en utilisant le blogue du cours.

Mardi, 1 avril 2008

Open XML: une nouvelle norme ISO?

Enregistré dans : XML — Daniel Lemire @ 2:03 pm

Il semble que le format de bureautique Open XML développé par Microsoft va devenir une norme reconnue par l’organisme ISO.

Ce qu’il faut savoir au sujet de XPath

Enregistré dans : XML — Daniel Lemire @ 10:50 am

Dare Obasanjo a écrit un excellent article sur les détails de la syntaxe XPath 1.0 (en anglais). Vous croyez tout savoir sur XPath?

Jeudi, 13 mars 2008

Yahoo! mise sur le web sémantique

Enregistré dans : Recherche d'informations, XML — Daniel Lemire @ 6:47 pm

Il semble que Yahoo! mise maintenant sur le web sémantique pour concurrencer Google. Ils prévoient enrichir leurs outils de recherche avec le traitement des données RDF incluant Dublin Core, Creative Commons et FOAF.

Vendredi, 22 février 2008

La recherche d’informations et la nouvelle économie

Enregistré dans : Recherche d'informations — Daniel Lemire @ 8:29 am

Ce matin, j’ai trouvé un cours très intéressant par le professeur Panos de l’Université de New York intitulé Search and the New Economy. Le cours est en ligne avec des extraits vidéo.

Lundi, 18 février 2008

La recommandation d’articles scientifiques dans une bibliothèque numérique

Enregistré dans : Recherche d'informations — Daniel Lemire @ 11:24 am

André Vellino donnera une conférence en français sur les systèmes de recommandations dans nos bureaux (100, rue Sherbrooke ouest, local 2720) à 12h30 ce jeudi (21 février 2008).

Recommender systems for scientific digital libraries that have been the subject of experiments in recent years have used corpora that are primarily in the field of computer science. However, designing an effective recommender system for journal articles in a broader Scientific, Technical and Medical (STM) digital library poses special challenges and presents unique opportunities.

This talk describes a recommender system for scientific scholarly articles that is both hybrid (content and collaborative filtering based) and multi-dimensional (across different rating criteria.) Our hypothesis is that such a design for a recommendation engine can improve scientists’ ability to discover new knowledge from a digital library provided that an interface to these recommendations can simultaneously offer explanations for the recommendations and increase the user’s control over how the recommender behaves.

Cette conférence sera diffusée sur le web avec une technologie Microsoft: mms://mediasrv.lorit.ca/presentation.

Mardi, 12 février 2008

Des emplois en recherche d’informations à Montréal?

Enregistré dans : Recherche d'informations — Daniel Lemire @ 10:57 am

Yahoo! embauche des spécialistes de la recherche d’informations à Montréal. Fernando Diaz — un chercheur en recherche d’informations chez Yahoo! — m’a envoyé l’offre d’emploi suivante (en anglais).

Machine Learning / NLP / Information Retrieval Researcher

Yahoo! Applied Research Lab
Montreal, QC

Job Responsibilities

The NLP group in Yahoo’s Applied Research Lab is looking for an researcher with the following qualifications:

-Strong knowledge of the Information Retrieval (IR) field
-Deep familiarity and hands-on experience in machine learning techniques
-Ability to conduct experiments involving massive data sources (mainly text and data mining)
-Background in natural language processing or computational linguistics
-Proven experience in software development in the fields mentioned above

Minimum Job Qualifications

The work that this researcher is expected to be conducting will be in the general area of Information Retrieval, typically will be related to one of Yahoo!’s initiatives in the area of search, including but not limited to relevance ranking, question answering, information extraction, text classification or subjectivity analysis. The candidate will be expected to have impact on product initiatives and at the same time will be encouraged to contribute to the general research community by active participation in scientific forums, publications, etc.

Masters Degree required

Preferable Job Qualifications

PhD

Yahoo! Inc. is an equal opportunity employer. For more information, please contact Fernando Diaz (diazf@yahoo-inc.com), Jean-François Crespo (jfcrespo@yahoo-inc.com), or visit http://careers.yahoo.com.

Lundi, 28 janvier 2008

HTML 5… une première esquisse du nouveau HTML?

Enregistré dans : XML — Daniel Lemire @ 8:55 pm

W3C a publié une première esquisse du HTML 5 aujourd’hui. HTML 5 vient remplacer HTML 4 et XHTML 1.

  • Il n’y plus d’élément “acronym” parce qu’il n’était pas assez utilisé.
  • Les éléments “canvas”, “video” et “audio” sont ajoutés: le HTML devient pleinement multimédia. Par contre MathML et SVG demeurent des normes distinctes.
  • Les éléments “article”, “section” et “figure” sont ajoutés.

Mardi, 15 janvier 2008

De meilleurs temps d’accès avec les disques Flash

Enregistré dans : Recherche d'informations — Daniel Lemire @ 9:23 pm

Steve Jobs vient de présenter le MacBook Air. Il est mince et léger, mais ce qui m’intéresse est qu’il utilise un disque Flash:

Utilisant une technologie similaire à celle d’iPod nano et d’autres produits à mémoire flash, MacBook Air intègre pour la première fois un disque SSD (solid-state drive). Disponibles en deux capacités, ces disques ne contiennent aucune pièce amovible et accèdent aux données beaucoup plus rapidement que les disques durs standard, ce qui se traduit par un gain notable de performances lors du démarrage de l’ordinateur et de l’ouverture des fichiers et des applications. En outre, les disques SSD offrent une meilleure durabilité et préservent mieux les données en cas de chute accidentelle.

Plus tôt, IBM et EMC nous annonçait la disponibilité de solutions à base de disques Flash pour les entreprises.

Les disques Flash sont intéressants:

  • Ils sont environ 250 fois plus rapides.
  • Ils utilisent moins d’électricité (environ 30% de moins).
  • Ils sont silencieux.
  • Ils sont petits.
  • Ils sont 15 à 20 fois plus chers, mais leurs prix diminuent rapidement.

La mémoire RAM a un temps d’accès qui n’est que 10 à 20 fois plus petit. Ces nouveaux disques viennent réduire l’écart entre la mémoire interne et la mémoire externe. Cependant, les disques Flash supportent mal l’écriture aléatoire. Il vaut mieux écrire sur de tels disques de manière séquentielle.

Dimanche, 6 janvier 2008

Corriger le HTML?

Enregistré dans : XML — Daniel Lemire @ 10:50 am

Douglas Crockford dans Fixing HTML propose de corriger le HTML. Il commence par remettre en question le XHTML qui est, selon lui, un échec.

Voici quelques suggestions intéressantes pour la norme HTML 5:

  • Seul l’encodage des caractères UTF-8 devrait être permis.
  • La création de balises à la volée. Vous avez besoin d’un élément de type «menu»? Vous pouvez en créer un!
  • La création d’attributs à la volée. Vous avez besoin d’un attribut de type «auteur»? Vous pouvez en créer un!
Page suivante »

XHTML valide

Powered by WordPress