[PyXML] Impossible de parser un fichier avec des accents ...

Impossible de parser un fichier avec des accents ... [PyXML] - Python - Programmation

Marsh Posté le 30-06-2004 à 18:42:34    

Salut,
 
j'ai un fichier XML, qui contient une suite d'éléments que je veux insérer ensuite dans une base de donnée.
 
J'utilise un script Python qui fait ça, en utilisant PyXML (SAX) pour la partie "parsing" du fichier XML, et MySQL for Python pour la partie XML.
 
Dans un de mes fichiers, j'ai des données qui contiennent des accents, et PyXML me lève une exception xml.sax._exceptions.SAXParseException au moment où il rencontre un accent :/
 
J'ai bien déclaré dans mon fichier XML l'encodage, avec <?xml version="1.0" encoding="UTF-8"?>, mais je crois pas que je puisse faire quelque chose au niveau de PyXML ...
 
Est-ce que quelqu'un peut m'aider pour résoudre ce problème ?
 
Merci :jap:

Reply

Marsh Posté le 30-06-2004 à 18:42:34   

Reply

Marsh Posté le 30-06-2004 à 18:45:09    

tes accents sont encodés en UTF-8 ? t'es sûr ? c'est pas plutot de l'ISO-8859-1


---------------
ma vie, mon oeuvre - HomePlayer
Reply

Marsh Posté le 30-06-2004 à 18:55:54    

D'après la personne responsable du fichier XML, ça serait de l'ascii "normal", je suppose effectivement ISO-8859-1 ... :heink:
 
J'ai essayé de chaner l'encodage dans le XML et la directive d'encodage de mon script Python, mais ça change rien :/

Reply

Marsh Posté le 30-06-2004 à 18:57:28    

:o
Méa culpa, il est tard, j'ai pas mangé à midi, je suis fatigué, et j'éditais pas le bon fichier :o
 
Effectivement, avec de l'ISO-8859-1, ça marche beaucoup mieux [:benou]
 
Merci Benou :D

Reply

Marsh Posté le 30-06-2004 à 23:14:24    

En passant, l'encodage UTF-16 permet aussi de résoudre le problème ... en fait, c'est peut-être le même que l'ISO-8859-1 (faudrait vérifier)

Reply

Marsh Posté le 30-06-2004 à 23:25:59    

l'iso 8859-1 n'est pas un sous-ensemble de l'utf-16

Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed