| |
- parserCorpus.parserCorpus.ParserCorpus(builtins.object)
-
- ParserSplit
class ParserSplit(parserCorpus.parserCorpus.ParserCorpus) |
|
Objet qui permet de construire un corpus, les documents dans le fichier .txt
doivent être séparés par "##END##" |
|
- Method resolution order:
- ParserSplit
- parserCorpus.parserCorpus.ParserCorpus
- builtins.object
Methods defined here:
- parse(self, path)
- Methode qui permet de construire un corpus à partir d'un .txt.
Ici le motif "##END##" doit être une ligne entre deux documents dans le
.txt. Si aucun motif "##END##" n'est présent alors le corpus sera composé
d'un seul document de contenu tout le .txt.
Parameters
----------
path : str
Chemin du fichier à analyser
Raises
------
FileNotFoundError
Si le chemin vers le fichier n'existe pas
PermissionError
Si les permissions du fichier ne permettent pas l'ouverture
Returns
-------
Corpus
Le corpus extrait du fichier passé en argument
Data descriptors inherited from parserCorpus.parserCorpus.ParserCorpus:
- __dict__
- dictionary for instance variables (if defined)
- __weakref__
- list of weak references to the object (if defined)
| |