| |
- builtins.object
-
- Document
class Document(builtins.object) |
|
Document(contenu)
Objet Document qui stocke son id, son contenu, les termes extraits depuis
son contenu et le nombre de mots qui le compose.
Attributes
----------
id : int
L'id du document
contenu : str
Le contenu du document
termes : list[tuple(str*)]
Par défaut à None. Après appel de la méthode extraction contient la
liste des termes extraits à partir du contenu.
nbMot : int
Nombre de mots dans le document |
|
Methods defined here:
- __init__(self, contenu)
- Constructeur de la classe Document
Parameters
----------
contenu : str
Le contenu du document
- extraction(self, extracteur)
- Methode permetant d'extraire les termes du document selon le
traitement fait par l'extracteur. Place le resultat dans l'attribut termes
Parameters
----------
extracteur : Extracteur
Objet Extracteur traitant le contenu pour extraire les termes
- getContenu(self)
- Getter d'attribut contenu
Returns
-------
str
Le contenu du document
- getId(self)
- Getter d'attribut id
Returns
-------
int
L'id du document
- getNbMot(self)
- Getter d'attribut nbMot
Returns
-------
int
Le nombre de mots dans le document
- getTermes(self)
- Getter d'attribut termes
La variable termes correspond à la liste des termes extraits par l'extracteur
lors de l'appel à la fonction extraction. Il faut donc impérativement
faire appel à la méthode extraction avant de faire appel à ce getter.
Returns
-------
list[tuple[str*]]
Les termes extraits du document
Raises
------
RuntimeError
Ce getter ne peut être appelé qu'après avoir appelé la méthode extraction
Data descriptors defined here:
- __dict__
- dictionary for instance variables (if defined)
- __weakref__
- list of weak references to the object (if defined)
Data and other attributes defined here:
- cpt = 0
| |