transformer un fichier PDF en TXT ou HTML(idéalement) [PHP] - PHP - Programmation
Marsh Posté le 21-03-2006 à 13:14:12
je sais qu'il y a des personnes qui savent le faire
juste une piste alors
Marsh Posté le 21-03-2006 à 14:04:42
dans la doc de PHP
je file voir ca alors merci beaucoup
Marsh Posté le 21-03-2006 à 19:01:25
je sais que tu as une lib fpdf qui permet de convertir de l'HTML en pdf, je sais pas si ca fait l'inverse.
http://www.fpdf.org/
Pour un editeur HTML j'utilise tinymce
++
Marsh Posté le 21-03-2006 à 19:50:53
il y a des utilitaires de convertion fournis avec xpdf:
pdffonts: extraction fonts
pdfimages: extraction images
pdfinfo: extraction infos
pdftoppm: conversion en image
pdftops: conversion en fichier imprimante
pdftotext: conversion en fichiers text/html
Ils ne produisent pas toujours de très bon résultats.
http://www.foolabs.com/xpdf/
Marsh Posté le 22-03-2006 à 17:14:29
merci pour l'info, sur [lien=http://fr.php.net/pdf]http://fr.php.net/pdf[/lien] j'ai trouve tous ce dont j'avais besoin.
Merci à vous tous
Marsh Posté le 15-04-2006 à 10:20:47
Bonjour,
Après quelque temps de recherche et de refléxion j'ai finalement opté pour la solution XPDF
qui fonctionne à merveille,
J'ai trouvé ça en PHP qui ne fonctionne pas très bien :
Code :
|
Vola pour le retour sur information.
Marsh Posté le 11-08-2007 à 08:43:53
En effet ce script présente quelques défauts, notamment dans le cas de présence de parenthèses dans le texte.
Pour améliorer le script, on peut ajouter ce code entre la ligne 41 et 42 :
Code :
|
...et d'ajouter en ligne 81 :
Code :
|
...et je trouve que ce script fonctionne plutôt pas mal... On peut ajouter également les lettres accentuées de la langue de Molière dans le tableau $trans, et ça roule...
Marsh Posté le 07-08-2008 à 13:52:34
Bonjour,
Je déterre ce post car je suis également à la recherche d'une fonction de ce genre.
Je viens de tester celle-ci, mais le résultat est très moyen.
En effet, des tas de caractères spéciaux s'affichent parfois entre les paragraphes.
Je pense que c les images du pdf.
Comment avez-vous procéder pour avoir une sortie en texte seulement ?
De plus est-il possible d'utiliser xpdf en php ?
Merci
Marsh Posté le 20-03-2006 à 17:09:02
Bonjour,
je voudrais à partir de fichier PDF les transformer (de préférence à la voler) pour les faire afficher sur mon site en texte uniquement (dans un premier temps, juste pour avoir un appercu du contenu du fichier)
D'autre part, je cherche aussi à réccupérer les vignettes inclus des des fichiers PDF ou sinon pour les créer automatiquement, je sais que ce n'est pas facile
Je cherche à mettre dans mes fichiers d'administration un editeur html (simplier au max) pour insérer du code HTML dans mes pages, par exemple EDITOR-X, je crois qu'il s'appel comme ca, mais après téléchargement et et installation, cela ne fonstionne pas du tous, il me met des erreur javascript dans tout les sens
d'avance, merci à vous
Message édité par stef_dobermann le 20-03-2006 à 17:26:18
---------------
Tout à commencé par un rêve...