|
| | Quiz Recherche d'informationVersion pour les chargés de cours.
- Comment détermine t-on le nombre de dimensions que l'on doit conserver avec l'approche
LSI?
- Définissez et expliquez la notion de "fréquence inverse des documents" (inverse
document frequency)
- Quels sont les avantages/désavantages des modèles d'espace vectoriels par rapport aux mots-clés?
- Quelle est la différence entre la mesure de similarité basée sur le cosinus par
rapport à celle basée la formule suivante?
- En quoi la théorie de la recherche d'information est-elle pertinente aux interfaces
intelligentes? Quels sont les autres domaines d'applications de la RI?
- Pourquoi Google a réussi à supplanter tous les autres engins de recherche à ce jour?
- Expliquez la formule du PageRank :
- La formule suivante fournit le ratio d'augmentation des chances en fonction des mots
présents dans un document :
Cette formule repose sur une hypothèse, laquelle?
- Consultez l'extrait suivant de l'offre d'emploi de Microsoft et expliquez en quoi les
techniques évoquées peuvent les aider à atteindre leur objectifs. Utilisez des exemples
pour étayer vos réponses.
Microsoft is building a platform to help understand users' intent. Mature products
have a multitude of menu options in their GUIs, making it hard for users to find the
features they need. The platform will aid interaction through text (or speech) and map
these to intents and actions. It will be used by many Microsoft products, including
Office and the OS, and will enable more natural interactions between users and
computers in the long term, starting with assistance/help in the shorter term. The
platform will be using machine learning / data mining / information retrieval
technologies for analyzing implicit and explicit user feedback to detect
intent. Designing new algorithms and modifying existing ones for this goal is an
important challenge.
- Définissez une interface intelligente.
- Énoncez et expliquez trois principes d'interfaces à initiatives mixtes.
- Expliquez comment à partir de l'algorithme PageRank il est possible d'obtenir une page
ne contenant aucun des mots clés de la requête.
|