Conversion : Fichiers DOC en HTML...

Conversion : Fichiers DOC en HTML... - Programmation

Marsh Posté le 02-02-2001 à 16:01:20    

Je sais, on peux le faire avec M$ Word, mais le code est carrément crade, pour ne pas dire affreux... les pages qui sont générées font (au moins) 10 fois la taille qu'elles devraient faire...
Alors, quelqu'un sait comment je pourrais faire , voire où trouver un logiciel qui me fait de code HTML propre à partir d'un fichier DOC...
 
Merci.


---------------
Gourou 2001 : vive le glandage, c ma raison d'être !!!
Reply

Marsh Posté le 02-02-2001 à 16:01:20   

Reply

Marsh Posté le 05-02-2001 à 09:15:48    

help !


---------------
Gourou 2001 : vive le glandage, c ma raison d'être !!!
Reply

Marsh Posté le 05-02-2001 à 09:47:26    

Essaye avec staroffice ( peut etre)


---------------
La bave du crapaud n'empèche pas la caravane de passer .
Reply

Marsh Posté le 05-02-2001 à 11:17:47    

la seule solution simple que je vois serait de faire un copier-coller dans un éditeur HTMl digne de ce nom.
 
Ou encore d'enregistrer au format HTML depuis word puis d'utliser dreamweaver 3.0 (ou 4.0) pour faire un clean-up HTML (c'est dans le menu commande), cette fonction marche plutôt pas mal même si elle laisse des petits bouts à nettoyer à la main.


---------------
Webmaster du site de l'Île-Saint-Denis : http://www.lile-saint-denis.fr
Reply

Marsh Posté le 05-02-2001 à 11:21:47    

pas staroffice, le code est aussi pourri que celui fournit par word.

Reply

Marsh Posté le 05-02-2001 à 11:22:44    

démonstration :ss
 
j'ai écrit "test" dans word et j'ai enregistré au format HTML.
 
Voici la version word :ss
 
<html xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns="http://www.w3.org/TR/REC-html40">
 
<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 9">
<meta name=Originator content="Microsoft Word 9">
<link rel=File-List href="./test_fichiers/filelist.xml">
<title>test</title>
<!--[if gte mso 9]><xml>
 <o:DocumentProperties>
ss<o:Author>MoonPC</o:Author>
ss<o:LastAuthor>MoonPC</o:LastAuthor>
ss<o:Revision>1</o:Revision>
ss<o:TotalTime>0</o:TotalTime>
ss<o:Created>2001-02-05T10:18:00Z</o:Created>
ss<o:LastSaved>2001-02-05T10:18:00Z</o:LastSaved>
ss<o:Pages>1</o:Pages>
ss<o:Company>icilalune</o:Company>
ss<o:Lines>1</o:Lines>
ss<o:Paragraphs>1</o:Paragraphs>
ss<o:Version>9.2812</o:Version>
 </o:DocumentProperties>
</xml><![endif]--><!--[if gte mso 9]><xml>
 <w:WordDocument>
ss<w:HyphenationZone>21</w:HyphenationZone>
 </w:WordDocument>
</xml><![endif]-->
<style>
<!--
 /* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
 {mso-style-parent:"";
 margin:0cm;
 margin-bottom:.0001pt;
 mso-pagination:widow-orphan;
 font-size:12.0pt;
 font-family:"Times New Roman";
 mso-fareast-font-family:"Times New Roman";}
@page Section1
 {size:595.3pt 841.9pt;
 margin:70.85pt 70.85pt 70.85pt 70.85pt;
 mso-header-margin:35.4pt;
 mso-footer-margin:35.4pt;
 mso-paper-source:0;}
div.Section1
 {page:Section1;}
-->
</style>
</head>
 
<body lang=FR style='tab-interval:35.4pt'>
 
<div class=Section1>
 
<p class=MsoNormal>test</p>
 
</div>
 
</body>
 
</html>
 
 
et voici la version après nettoyage automatique avec dreamweaver 3.0 :ss
 
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<title>test</title>
<style><!--
.Normal
 {font-size:12.0pt;
 font-family:"Times New Roman";}
-->
</style>
</head>
<body lang=FR class="Normal" bgcolor="#ffffff">
<p>test</p>
</body>
</html>


---------------
Webmaster du site de l'Île-Saint-Denis : http://www.lile-saint-denis.fr
Reply

Marsh Posté le 05-02-2001 à 14:12:53    

Je sais que dreamweaver 3 ou 4 est très efficace !! mais il n'est pas donné non plus ($289) !!!ss
Comment faire autrement ???
Merci à tous ...


---------------
Gourou 2001 : vive le glandage, c ma raison d'être !!!
Reply

Marsh Posté le 09-02-2001 à 01:51:05    

Peut-être avec Netscape Composer si c'est pas trop compliqué comme formatage de texte...
Mais je te déconseille Frontpage, qui rajoute pas mal de <p align=center...> qui sont mal compris par Netscape.[g]

Reply

Marsh Posté le 09-02-2001 à 02:58:21    

1)Tu sauves ton .doc en .rtf
2)Tu ecris en perl un programme rtf-->html
(ou recuperes celui du CPAN)
Et voila
A+,


---------------
There's more than what can be linked! --    Iyashikei Anime Forever!    --  AngularJS c'est un framework d'engulé!  --
Reply

Marsh Posté le 09-02-2001 à 08:54:36    

Merci pour vos réponses .
Mais c quoi CPAN ???


---------------
Gourou 2001 : vive le glandage, c ma raison d'être !!!
Reply

Marsh Posté le 09-02-2001 à 08:54:36   

Reply

Marsh Posté le 09-02-2001 à 09:01:11    

OK... c bon, j'ai trouvé tout seul ce que ca voulait dire... mais comment on exécute un script PERL (scuzez moi je débute...)


---------------
Gourou 2001 : vive le glandage, c ma raison d'être !!!
Reply

Sujets relatifs:

Leave a Replay

Make sure you enter the(*)required information where indicate.HTML code is not allowed