parserCorpus.parserSplit
index

# -*- coding: utf-8 -*-

 
Modules
       
re

 
Classes
       
parserCorpus.parserCorpus.ParserCorpus(builtins.object)
ParserSplit

 
class ParserSplit(parserCorpus.parserCorpus.ParserCorpus)
    Objet qui permet de construire un corpus, les documents dans le fichier .txt
doivent être séparés par "##END##"
 
 
Method resolution order:
ParserSplit
parserCorpus.parserCorpus.ParserCorpus
builtins.object

Methods defined here:
parse(self, path)
Methode qui permet de construire un corpus à partir d'un .txt.
Ici le motif "##END##" doit être une ligne entre deux documents dans le
.txt. Si aucun motif "##END##" n'est présent alors le corpus sera composé
d'un seul document de contenu tout le .txt.
 
Parameters
----------
path : str
    Chemin du fichier à analyser
 
Raises
------
FileNotFoundError
    Si le chemin vers le fichier n'existe pas
PermissionError
    Si les permissions du fichier ne permettent pas l'ouverture
 
Returns
-------
Corpus
    Le corpus extrait du fichier passé en argument

Data descriptors inherited from parserCorpus.parserCorpus.ParserCorpus:
__dict__
dictionary for instance variables (if defined)
__weakref__
list of weak references to the object (if defined)