INF6304   INF6304, Interfaces intelligentes
Automne 2011
format impression
 

Quiz Recherche d'information

Version pour les chargés de cours.

  1. Comment détermine t-on le nombre de dimensions que l'on doit conserver avec l'approche LSI?
  2. Définissez et expliquez la notion de "fréquence inverse des documents" (inverse document frequency)
  3. Quels sont les avantages/désavantages des modèles d'espace vectoriels par rapport aux mots-clés?
  4. Quelle est la différence entre la mesure de similarité basée sur le cosinus par rapport à celle basée la formule suivante?
  5. En quoi la théorie de la recherche d'information est-elle pertinente aux interfaces intelligentes? Quels sont les autres domaines d'applications de la RI?
  6. Pourquoi Google a réussi à supplanter tous les autres engins de recherche à ce jour?
  7. Expliquez la formule du PageRank :

  8. La formule suivante fournit le ratio d'augmentation des chances en fonction des mots présents dans un document :

    Cette formule repose sur une hypothèse, laquelle?

  9. Consultez l'extrait suivant de l'offre d'emploi de Microsoft et expliquez en quoi les techniques évoquées peuvent les aider à atteindre leur objectifs. Utilisez des exemples pour étayer vos réponses.

    Microsoft is building a platform to help understand users' intent. Mature products have a multitude of menu options in their GUIs, making it hard for users to find the features they need. The platform will aid interaction through text (or speech) and map these to intents and actions. It will be used by many Microsoft products, including Office and the OS, and will enable more natural interactions between users and computers in the long term, starting with assistance/help in the shorter term. The platform will be using machine learning / data mining / information retrieval technologies for analyzing implicit and explicit user feedback to detect intent. Designing new algorithms and modifying existing ones for this goal is an important challenge.

  10. Définissez une interface intelligente.
  11. Énoncez et expliquez trois principes d'interfaces à initiatives mixtes.
  12. Expliquez comment à partir de l'algorithme PageRank il est possible d'obtenir une page ne contenant aucun des mots clés de la requête.