Convertire i documenti da Markdown in formato Microsoft Word

Convertire i documenti da Markdown in formato Microsoft Word
Tra le altre attività, la scrittura e la modifica dei documenti di testo appartengono alle azioni più comuni che utilizziamo i nostri computer (desktop) per. Il modo esatto in cui è fatto segue percorsi diversi, dall'uso di un editor di testo nudo come VIM a applicazioni grafiche come Open/Libre Office o Servizi basati su cloud accessibili tramite WebBrowser come Google Docs. A nostro svantaggio, ogni strumento viene fornito con il proprio formato di documenti nativi e la selezione di altri formati di documenti supportati. La qualità della conversione tra questi formati varia ampiamente e può portare a molta frustrazione quando si attraversano i confini del formato.

In questo articolo diamo un'occhiata alla conversione tra Markdown [1] e DOCX - il formato di documento nativo di Microsoft Word che è in uso dal 2007. Potresti chiederti perché un appassionato di Markdown e ASCIIDOC (come me) si occupa di questo caso. Bene, collaborare con un gruppo di altri scrittori può portare a una situazione mentre uno o più partecipanti richiedono DOCX come formato di output. Non deludere nessuno e scoprire quali limitazioni esistono invece, e come possiamo provare a rendere felici tutti i membri del gruppo.

Cos'è Markdown?

Come già sottolineato in "Un'introduzione a Markdown" [2], l'intenzione di Markdown è un semplice testo per la conversione HTML. L'idea alla base era di rendere le pagine Web di scrittura, la documentazione e in particolare le voci di blog facili come scrivere una e-mail. Ad oggi è il di fatto-sinonimo di una classe di lingue di descrizione di markup leggera e l'obiettivo può essere visto come raggiunto.

Markdown utilizza una sintassi di formattazione del testo semplice. Con un approccio simile a HTML, un numero di marcatori indicano titoli, elenchi, immagini e riferimenti nel testo. Le poche righe di seguito illustrano un documento di base che contiene due titoli (1 ° e 2 ° livello) e due paragrafi e un ambiente di elenco.
# Luoghi consigliati da visitare in Europa
## Francia
Questa è una selezione di luoghi:
* Paris (_ile de france_)
* Strasburg (_alsace_)
Per un piano di visita adeguato circa una settimana.

Conversione in docx

Per convertire il documento Markdown in DOCX, utilizzare lo strumento Pandoc [3]. Pandoc è una biblioteca Haskell e si descrive come "il convertitore di documenti universali", o il "coltello dell'esercito svizzero per le conversioni di documenti". È disponibile per una varietà di piattaforme come Linux, Microsoft Windows, Mac OS X e BSD. Pandoc è comunemente incluso come pacchetto per distribuzioni Linux come Debian GNU/Linux, Ubuntu e CentOS.

Una semplice chiamata per una conversione è la seguente:

$ pandoc -o test.Test DOCX.MD

Il primo parametro '-o' si riferisce al file di output, seguito dal nome del file ('test.docx '). L'estensione del file aiuta Pandoc a identificare il formato di output desiderato. Il secondo parametro nomina il file di input - Nel nostro caso è semplicemente 'test.md '.

La versione lunga del comando mostrato sopra contiene i due parametri "-f markdown" e "-t docx". Il primo abbrevia il termine "sapore" e descrive il formato del file di input. Il secondo fa lo stesso per il file di output e abbreviate "-to".

Il comando completo è il seguente:

$ pandoc -o test.Docx -f Markdown -t Test docx.MD

Apertura del file convertito usando i risultati di Microsoft Word nel seguente output:

Per i diversi elementi di testo Pandoc utilizza fogli di stile. Ciò consente di regolare questi elementi in seguito in base alle tue esigenze in tutto il documento. Le versioni più recenti di Pandoc offrono anche il contrario: è possibile convertire un file DOCX in Markdown come segue:

$ pandoc -o test.Test MD.docx

Quindi, il file generato ha il seguente contenuto:

Luoghi consigliati da visitare in Europa
=========================================
Francia
------
Questa è una selezione di luoghi:
- Parigi (*ile de France*)
- Strasburgo (*Alsace*)
Per un piano di visita adeguato circa una settimana.

Opzioni utili della riga di comando

L'elenco delle opzioni Pandoc è piuttosto lungo. I seguenti ti aiutano a produrre risultati migliori e semplifica la vita:

* '-P' (versione lunga '-preserve-tabs'): conservare le schede invece di convertirle in spazi. Questo è utile per i blocchi di codice con righe rientrate che fanno parte del tuo testo.

* '-S' (versione lunga '-smart'): produrre output tipograficamente corretto.

Questa opzione corregge le citazioni, i trattini/trattini e le ellissi ("..."). Ulteriori spazi non di rottura vengono aggiunti dopo alcune abbreviazioni come "MR.".

* '-Track-changes = Value': specifica cosa fare con inserzioni, eliminazioni e commenti prodotti con l'aiuto della funzione Microsoft Word "Traccia modifiche". Il valore può essere accettato, rifiutato o tutto per includere o rimuovere le modifiche apportate nel documento. Il risultato è un file piatto.

Per ulteriori opzioni, dai un'occhiata alla documentazione e alla pagina manuale di Pandoc.

Riepilogo

La conversione tra Markdown e Docx non è più un mistero. È fatto in pochi passaggi e funziona molto bene. Felice hacking 🙂

Collegamenti e riferimenti

* [1] Markdown
* [2] Frank Hofmann: Introduzione a Markdown
* [3] Pandoc

Riconoscimenti

L'autore desidera ringraziare Annette Kalbow per il suo aiuto mentre prepara l'articolo.