document.document
index

# -*- coding: utf-8 -*-

 
Classes
       
builtins.object
Document

 
class Document(builtins.object)
    Document(contenu)
 
Objet Document qui stocke son id, son contenu, les termes extraits depuis
son contenu et le nombre de mots qui le compose.
 
Attributes
----------
id : int
    L'id du document
contenu : str
    Le contenu du document
termes : list[tuple(str*)]
    Par défaut à None. Après appel de la méthode extraction contient la
    liste des termes extraits à partir du contenu.
nbMot : int
    Nombre de mots dans le document
 
  Methods defined here:
__init__(self, contenu)
Constructeur de la classe Document
 
Parameters
----------
contenu : str
    Le contenu du document
extraction(self, extracteur)
Methode permetant d'extraire les termes du document selon le
traitement fait par l'extracteur. Place le resultat dans l'attribut termes
 
Parameters
----------
extracteur : Extracteur
    Objet Extracteur traitant le contenu pour extraire les termes
getContenu(self)
Getter d'attribut contenu
 
Returns
-------
str
    Le contenu du document
getId(self)
Getter d'attribut id
 
Returns
-------
int
    L'id du document
getNbMot(self)
Getter d'attribut nbMot
 
Returns
-------
int
    Le nombre de mots dans le document
getTermes(self)
Getter d'attribut termes
 
La variable termes correspond à la liste des termes extraits par l'extracteur
lors de l'appel à la fonction extraction. Il faut donc impérativement
faire appel à la méthode extraction avant de faire appel à ce getter.
 
Returns
-------
list[tuple[str*]]
    Les termes extraits du document
 
Raises
------
RuntimeError
    Ce getter ne peut être appelé qu'après avoir appelé la méthode extraction

Data descriptors defined here:
__dict__
dictionary for instance variables (if defined)
__weakref__
list of weak references to the object (if defined)

Data and other attributes defined here:
cpt = 0