débutante: fréquence des mots sur Python - Python - Programmation
Marsh Posté le 27-12-2009 à 20:49:23
solution:
*/ str.split
*/ dict (ou mieux: collections.defaultdict)
Marsh Posté le 28-12-2009 à 13:28:07
> kasis : donne-nous un bout de code pour que nous puissons t'aider... Après avoir ouvert ton fichier, effectue un str.split() sur le contenu (mais en terme de consommation mémoire je ne sais pas si ça va passer si ton livre est vraiment gros). Une fois que, grâce à split(), tu auras récupéré les mots, un dictionnaire te permettra de les ranger et d'en calculer la fréquence. Mais écris d'abord un peu de code !
Marsh Posté le 27-12-2009 à 20:37:09
Bonjour à tous. (et bonnes fêtes!)
Je débute avec Python, et j'ai un petit problème concernant le calcul de la fréquence de mots.
Je travaille sur un texte conséquent (livre numérisé) et je dois calculer la fréquence de mots (combien de token pour chaque type).
Je dois faire la liste des mots les plus fréquents et garder les mots qui apparaissent par exemple 10, 15, 20 fois dans le texte.
Seulement je suis vraiment perdue, je n'ai strictement aucune idée de comment je peux trouver ce résultat. Le tutoriel avec lequel je travaille ne m'a pas aidé..
SVP, une petite aide serait le bienvenue.
Merci d'avance.
Bonne soirée =)