| |
- builtins.object
-
- Corpus
class Corpus(builtins.object) |
|
Objet Corpus qui stocke une collection de documents.
Attributes
----------
collection : dict[int,Document]
Dictionnaire avec en clé l'id du document et en valeur l'objet Document
nbMoyenMot : float
Nombre moyen de mots dans les documents du corpus |
|
Methods defined here:
- __init__(self)
- Constructeur de la classe Document
Construit un corpus vide
- __iter__(self)
- Permet d'itérer sur les documents dans les boucles for
ex: for doc in corpus
- addDocument(self, doc)
- Ajouter un document au corpus
Parameters
----------
doc : Document
Document à ajouter au corpus
Raises
------
KeyError
Si l'id du doc est déjà dans le corpus
- extraction(self, extracteur)
- Méthode appelant la méthode extraction de chaque document.
Parameters
----------
extracteur : Extracteur
Objet Extracteur traitant le contenu pour extraire les termes
- getCollection(self)
- Getter de la collection de document
Returns
-------
dict[int,Document]
La collection de document du corpus
- getDocumentById(self, iddoc)
- Getter de document avec l'id
Parameters
----------
iddoc : int
L'id du document que l'on veut récupérer
Returns
-------
Document
Le document d'id iddoc
Raises
------
KeyError
Si l'iddoc ne correspond à aucun document du corpus
- getNbMoyenMot(self)
- Getter de nbMoyenMot
Returns
-------
float
Le nombre de mots moyen par document du corpus
- size(self)
- Returns
-------
int
Le nombre de documents dans le corpus
Data descriptors defined here:
- __dict__
- dictionary for instance variables (if defined)
- __weakref__
- list of weak references to the object (if defined)
| |