Les mesures de similarité statistique

Besoin d'aide ?
somdn_product_page

(Nombre de téléchargements - 0)

Catégorie :

Pour des questions et des demandes, contactez notre service d’assistance E-mail : info@chatpfe.com

Table des matières

1 INTRODUCTION GÉNÉRALE
2 CHAPITRE 1 : CATÉGORISATION DES TEXTES
2.1 INTRODUCTION
2.2 DÉFINITIONS
2.3 TYPES DE LA CATÉGORISATION
2.3.1 Multi/mono catégorie
2.3.2 Catégorisation centrée-document, catégorisation centrée-catégorie
2.4 LES ÉTAPES DE LA CATÉGORISATION
2.4.1 Indexation
2.4.1.1 Tokenisation
2.4.1.2 Elimination des mots vides
2.4.1.3 Lemmatisation
2.4.1.4 Pondération
2.4.2 Sélection des termes
2.4.2.1 Gain d’information (IG information gain)
2.4.2.2 Mutuel information (MI mutuel information)
2.4.2.3 Chi Square χ²
2.4.3 Choix du classificateur
2.4.3.1 Classification par arbres de décision
2.4.3.2 Classification bayésienne
2.4.3.3 Classification à base d’exemples présentatifs(K plus proches voisins)
2.4.3.4 Classification à base de règles
2.4.3.5 Classification par réseaux de neurones
2.4.3.6 Classification par SVM( supports vector machine )
2.4.3.7 Classification par sélection des attributs
2.4.4 Evaluation du model
2.5 CONCLUSION
3 CHAPITRE 2 : MESURES DE SIMILARITE
3.1 INTRODUCTION
3.2 DÉFINITION
3.3 CLASSIFICATION DES APPROCHES DE MESURES DE SIMILARITE:
3.3.1 Approches basées sur les arcs
3.3.1.1 Mesure de Wu et Palmer
3.3.1.2 La mesure de [Zargayouna et Salotti, 2004]
3.3.1.3 La mesure de [Thabet et al, 2007]
3.3.1.4 La mesure de Rada et al
3.3.3 Approches basées sur les noeuds
3.3.2.1 La mesure de Resnik
3.3.2.2 La mesure de Lin
3.3.2.3 La mesure de Hirst et St-Onge
3.3.3 Les approches Hybrides
3.3.3.1 La mesure de Jiang et Conrath
3.3.3.2 La mesure de Leacock et Chodorow
3.4 CONCLUSION
4 CHAPITRE 3 : NOTRE TRAVAIL
4.1 INTRODUCTION
4.2 ARCHITECTURE DE NOTRE APPROCHE
4.2.1 Tokenization
4.2.2 Pondération
4.2.3 Apprentissage et classification
4.2.4 Repondération du vecteur conceptuel du document à classer
4.2.5 Classement du document
4.3 FIGURE DU PROGRAMME
4.4 LES RESSOURCES UTILISÉES
4.4.1 Description des corpus
4.4.2 Environnement de travail
4.4.3 La bibliothèque FREELING
4.4.4 Java
4.4.5 WordNet
4.4.6 La bibliothèque JWS(java wordnet similarity)
4.5 CONCLUSION
5 CONCLUSION GÉNÉRALE
6 BIBLIOGRAPHIE

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *