document.corpus
index

# -*- coding: utf-8 -*-

 
Classes
       
builtins.object
Corpus

 
class Corpus(builtins.object)
    Objet Corpus qui stocke une collection de documents.
 
Attributes
----------
collection : dict[int,Document]
    Dictionnaire avec en clé l'id du document et en valeur l'objet Document
nbMoyenMot : float
    Nombre moyen de mots dans les documents du corpus
 
  Methods defined here:
__init__(self)
Constructeur de la classe Document
 
Construit un corpus vide
__iter__(self)
Permet d'itérer sur les documents dans les boucles for
ex: for doc in corpus
addDocument(self, doc)
Ajouter un document au corpus
 
Parameters
----------
doc : Document
    Document à ajouter au corpus
 
Raises
------
KeyError
    Si l'id du doc est déjà dans le corpus
extraction(self, extracteur)
Méthode appelant la méthode extraction de chaque document.
 
Parameters
----------
extracteur : Extracteur
    Objet Extracteur traitant le contenu pour extraire les termes
getCollection(self)
Getter de la collection de document
 
Returns
-------
dict[int,Document]
    La collection de document du corpus
getDocumentById(self, iddoc)
Getter de document avec l'id
 
Parameters
----------
iddoc : int
    L'id du document que l'on veut récupérer
 
Returns
-------
Document
    Le document d'id iddoc
 
Raises
------
KeyError
    Si l'iddoc ne correspond à aucun document du corpus
getNbMoyenMot(self)
Getter de nbMoyenMot
 
Returns
-------
float
    Le nombre de mots moyen par document du corpus
size(self)
Returns
-------
int
    Le nombre de documents dans le corpus

Data descriptors defined here:
__dict__
dictionary for instance variables (if defined)
__weakref__
list of weak references to the object (if defined)