Conversion : Fichiers DOC en HTML... - Programmation
Marsh Posté le 05-02-2001 à 09:15:48
help !
Marsh Posté le 05-02-2001 à 09:47:26
Essaye avec staroffice ( peut etre)
Marsh Posté le 05-02-2001 à 11:17:47
la seule solution simple que je vois serait de faire un copier-coller dans un éditeur HTMl digne de ce nom.
Ou encore d'enregistrer au format HTML depuis word puis d'utliser dreamweaver 3.0 (ou 4.0) pour faire un clean-up HTML (c'est dans le menu commande), cette fonction marche plutôt pas mal même si elle laisse des petits bouts à nettoyer à la main.
Marsh Posté le 05-02-2001 à 11:21:47
pas staroffice, le code est aussi pourri que celui fournit par word.
Marsh Posté le 05-02-2001 à 11:22:44
démonstration :ss
j'ai écrit "test" dans word et j'ai enregistré au format HTML.
Voici la version word :ss
<html xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:w="urn:schemas-microsoft-com:office:word"
xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<meta name=ProgId content=Word.Document>
<meta name=Generator content="Microsoft Word 9">
<meta name=Originator content="Microsoft Word 9">
<link rel=File-List href="./test_fichiers/filelist.xml">
<title>test</title>
<!--[if gte mso 9]><xml>
<o:DocumentProperties>
ss<o:Author>MoonPC</o:Author>
ss<o:LastAuthor>MoonPC</o:LastAuthor>
ss<o:Revision>1</o:Revision>
ss<o:TotalTime>0</o:TotalTime>
ss<o:Created>2001-02-05T10:18:00Z</o:Created>
ss<o:LastSaved>2001-02-05T10:18:00Z</o:LastSaved>
ss<o:Pages>1</o:Pages>
ss<o:Company>icilalune</o:Company>
ss<o:Lines>1</o:Lines>
ss<o:Paragraphs>1</o:Paragraphs>
ss<o:Version>9.2812</o:Version>
</o:DocumentProperties>
</xml><![endif]--><!--[if gte mso 9]><xml>
<w:WordDocument>
ss<w:HyphenationZone>21</w:HyphenationZone>
</w:WordDocument>
</xml><![endif]-->
<style>
<!--
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:"Times New Roman";}
@page Section1
{size:595.3pt 841.9pt;
margin:70.85pt 70.85pt 70.85pt 70.85pt;
mso-header-margin:35.4pt;
mso-footer-margin:35.4pt;
mso-paper-source:0;}
div.Section1
{page:Section1;}
-->
</style>
</head>
<body lang=FR style='tab-interval:35.4pt'>
<div class=Section1>
<p class=MsoNormal>test</p>
</div>
</body>
</html>
et voici la version après nettoyage automatique avec dreamweaver 3.0 :ss
<html>
<head>
<meta http-equiv=Content-Type content="text/html; charset=windows-1252">
<title>test</title>
<style><!--
.Normal
{font-size:12.0pt;
font-family:"Times New Roman";}
-->
</style>
</head>
<body lang=FR class="Normal" bgcolor="#ffffff">
<p>test</p>
</body>
</html>
Marsh Posté le 05-02-2001 à 14:12:53
Je sais que dreamweaver 3 ou 4 est très efficace !! mais il n'est pas donné non plus ($289) !!!ss
Comment faire autrement ???
Merci à tous ...
Marsh Posté le 09-02-2001 à 01:51:05
Peut-être avec Netscape Composer si c'est pas trop compliqué comme formatage de texte...
Mais je te déconseille Frontpage, qui rajoute pas mal de <p align=center...> qui sont mal compris par Netscape.[g]
Marsh Posté le 09-02-2001 à 02:58:21
1)Tu sauves ton .doc en .rtf
2)Tu ecris en perl un programme rtf-->html
(ou recuperes celui du CPAN)
Et voila
A+,
Marsh Posté le 09-02-2001 à 08:54:36
Merci pour vos réponses .
Mais c quoi CPAN ???
Marsh Posté le 09-02-2001 à 09:01:11
OK... c bon, j'ai trouvé tout seul ce que ca voulait dire... mais comment on exécute un script PERL (scuzez moi je débute...)
Marsh Posté le 02-02-2001 à 16:01:20
Je sais, on peux le faire avec M$ Word, mais le code est carrément crade, pour ne pas dire affreux... les pages qui sont générées font (au moins) 10 fois la taille qu'elles devraient faire...
Alors, quelqu'un sait comment je pourrais faire , voire où trouver un logiciel qui me fait de code HTML propre à partir d'un fichier DOC...
Merci.
---------------
Gourou 2001 : vive le glandage, c ma raison d'être !!!