Back to Search

Apprentissage statistique et extraction de concepts à partir de corpus

AUTHOR Turenne-N
PUBLISHER Univ Europeenne (02/28/2018)
PRODUCT TYPE Paperback (Paperback)

Description
Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d''un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L''accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais "clustering") faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.
Show More
Product Format
Product Details
ISBN-13: 9786131563409
ISBN-10: 6131563403
Binding: Paperback or Softback (Trade Paperback (Us))
Content Language: French
More Product Details
Page Count: 272
Carton Quantity: 30
Product Dimensions: 6.00 x 0.61 x 9.00 inches
Weight: 0.89 pound(s)
Country of Origin: FR
Subject Information
BISAC Categories
Computers | Information Technology
Computers | General
Descriptions, Reviews, Etc.
publisher marketing
Cette thèse présente un modèle de construction automatique et approximatif de la représentation du sens d''un texte. On adapte des techniques de documentation automatique à des bases documentaires non indexées. Les techniques classiques reposent sur une indexation vectorielle. Chaque document est représenté par un descripteur, on définit une distance entre ces descripteurs. L''accès aux documents pertinents est basé sur des calculs de proximité entre ces descripteurs. Une structuration du domaine, couvert par des documents, est obtenue par une classification (en anglais "clustering") faisant apparaître des thèmes sémantiques. Il faut améliorer les techniques en leur permettant de traiter les documents non indexés, en améliorant les résultats par une adaptation de connaissances linguistiques et une analyse des relations que marquent les cooccurrences entre termes.
Show More
List Price $110.00
Your Price  $108.90
Paperback