RÉCUPÉRATION, TRANSFERT
ET MODIFICATION DE FICHIER


Le transfert et la modification de fichiers provenant de sources différentes est un exercice auquel on est amené à se livrer un jour ou l'autre si on se lance dans la création de pages web. La source est généralement un traitement de texte ou une page de Google Drive (ou équivalent) ou encore une page html classique puisée sur le web. On doit distinguer la récupération simple par copie-collé et la récupération par une exportation préalable du fichier au format html par l'application considérée. Le but est d'utiliser le code récupéré ou le texte brut pour créer sa propre page dont on modifiera le code manuellement selon ses vœux. Si l'on veut récupérer le texte sans la mise en page, un simple copie-collé suffira. Si l'on veut tenter de récupérer certains éléments de mise en page (graissage, italique notamment), il faudra passer par une exportation automatique en html du texte à partir de l'application (traitement de texte, Google Drive...), puis se livrer à une manipulation de la source obtenue dans gedit par exemple.


TRANSFERT PAR COPIE-COLLÉ

Un copie-collé à partir d'un traitement de texte sur un éditeur de texte comme gedit fournit un texte où aucune mise en forme ne sera récupérée, sauf les retours à la ligne \n, mais il nous faut alors leur adjoindre des <br>, ce qui est fastidieux manuellement. Nous préocéderons donc à un remplacement des retours à la ligne grâce aux excellentes performances de gedit:

La procédure est la suivante: cliquer sur le module chercher remplacer et noter:

remplacer \n par \n<br>

Remarque: l'antislashe s'obtient par les touches AltGr (à droite de la barre d'espacement) + touche du 8 sur la première ligne de touches


TRANSFERT APRÈS EXPORTATION POUR UN PAGE DE TRAITEMENT DE TEXTE

Avec Libroffice par exemple, nous disposons d'une exportation en html: Enregistrer sous, tous les formats choisir html. L'ouverture du fichier produit un code présenté clairement et assez facilement modifiable. Les parties de texte se trouvent sous balise <p> avec indication du style, par exemple:

<p style="margin-bottom: 0cm; line-height: 100%"><font face="Courier 10 Pitch"><font size="4" style="font-size: 14pt">mon<br> texte 14px courrier 10 Pitch</font></font> texte 14px courrier 10 Pitch</font></font>

On peut manipuler ce code pour le simplifier avec le module rechercher remplacer de gedit, mais il est loisible de le réutiliser tel qu'il est directement.


TRANSFERT APRÈS EXPORTATION À PARTIR D'UNE PAGE DE GOOGLE DRIVE

Les fichiers Drive natifs sont eux-mêmes en html, mais il s'agit d'une codification automatique entraînant des complications programmatiques pas toujours bienvenues sur une page web ordinaire et compliquant la récupération. Naturellement, cette conception est indispensable pour une utilisation automatique sans codage direct par les utilisateurs sous forme d'application web.

La procédure de récupération est la suivante:

-exportation à partir de Google Drive sous forme de page html brute par Drive (fichier module télécharger au format préciser page web html zippé)

-dézipper le fichier sur votre ordinateur en cliquant dessus

-ouvrir avec gedit

On constate alors que l'ouverture par gedit peut être, selon la longueur du fichier, extrêmement longue. En cas d'impossibilité, il est nécessaire de scinder le fichier initial sur Drive en plusieurs fichiers, puis de récupérer le contenu de chaque fichier par exportation.

Après ouverture avec gedit, le code apparaît d'une seule traite sans aucun retour de ligne (/n), ce qui est la cause du temps d'ouverture démesurément long constaté avec gedit. La première opération à faire est donc d'introduire des retours de ligne à chaque itération de </p>, d'enregistrer et réouvrir le fichier. On constate alors qu'il s'ouvre aisément et que le code apparaît plus clairement.

Celui_ci est généralement constitué de balises, par exemple <p class=c1> introduisant des styles qui ont été préalablement et automatiquement définis sous l'appellation de c0, c1, c2... Une réutilisation de ce code en le simplifiant à coups de rechercher remplacer dans gedit apparaît difficile. On peut néanmoins retrouver au début du fichier les caractéristiques de chaque style, ce qui peut aider à une reconstitution.


RÉCUPÉRATION DU CODE À PARTIR D'UN FICHIER HTML SUR INTERNET

La récupération du code à partir d'une page classique html sur internet peut être réalisée sur le navigateur, par exemple avec Firefox ou Chrome: clic droit code source de la page. Le code obtenu est directement utilisable et modifiable à condition que la page ne reporte pas à des styles inclus dans un fichier css, auquel cas aucun moyen ne permet de récupérer les styles, sinon de les reconstituer à partir de leur rendu sur le navigateur.
Sur le plan de la lourdeur du fichier, par exemple un fichier de 160.000 caractères avec une mise en page très sommaire produit un fichier html épuré de 226 k à partir d'un fichier correspondant Google Drive exporté en html de 260 k, différence qui n'apparaît pas rhédibitoire, mais cela peut dépendre du contenu.


TRANSFERT D'UNE PAGE WEB DANS UN MAIL

Avec gmail notamment, il est facile d'exporter dans un message par copie-collé une page web représentant par exemple une publicité pour une manifestation en vue de diffusion. Pour cela, il faut procéder par copie-collé de la page web elle-même (en aucun cas du code lui-même). Gmail utilise les données du copie-collé pour recréer du code selon ses propres règles avec une facilité et une excellence surprenante. On peut y inclure des boîtes div et toutes sortes de styles. Si on veut obtenir une page de publicité attrayante, cette méthode permet un résultat plus élaboré que l'utilisation des fonctionnalités automatiques proposées par gmail, lesquelles sont toutefois très correctes.


CONCLUSION

Que ce soit par copie-collé ou par exportation en html, l'utilisation et la modification du code (ou de son résultat) sur un éditeur de texte s'avère possible s'il s'agit d'une mise en page simple. Toute complication avec des blocs div, des tableaux... rend très laborieuse, voire impossible, toute possibilité de réutilisation du code, même parfois une utilisation du texte lui-même par copie-collé. C'est un argument de plus incitant à créer des pages simples qui seront plus facilement utilisables et transférables sous différents formats par des tiers (ou soi-même), si toutefois on veut permettre cette opération.


SOMMAIRE    SUITE