LaTeXML konvertuje LaTeX dokumenta u XML, HTML i EPUB.[1][2][3]

Proces rada

uredi

LaTeXML primarni izvorni format je XML reprezentacija (La)TeX's dokument modela. Postprocesor može pretvarati ove XML dokumente u formate poput HTML sa matematičkim formulama kao slikama ili XHTML, HTML5, i EPUB sa formulama kao MathML. U poređenju sa drugim LaTeX-to-XML procesorima, LaTeXML ima za cilj da sačuva semantičke strukture LaTeX oznaka. To ga čini dobrom osnovom za semantičke usluge kao što su Math search.

Konverzija u rasponu 30 milisekunde u jednostavnim formulama (u LaTeXML daemon-u) do minuta za dokument veličine knjige.

Istorija

uredi

LaTeXML je počeo u kontekstu digitalne biblioteke matematičke funkcije u NIST, gde je LaTeX dokumentima potrebno da se pripreme za objavljivanje na vebu. Sistem je bio pod aktivnim razvojem za više od jedne decenije, i privukao mali, ali posvećeni broj programera i korisnika usmereni na Bruce Miller, LaTeXML.

Sadašnja verzija je objavljena kao LaTeXML 0.8.1. To je objavljeno u februaru 2015. godine, ali razvoj je bio aktivan na javnom skladištu od tada.

LaTeXML je korišćen za konvertovanje 90% (60% bez grešaka) od 530.000 dokumenata iz arXiv u XML.[4] Kao rezultat ovih napora, LaTeXML održava veliki raspon LaTeX paketa. ACL 2014 je koristio LaTeXML za konvertovanje pristiglih radova u XML.[5] Ovaj postojeći posao je pokušavao da konvertuje ACL Anthology papire u visokokvalitetnu semantičku oznaku za dalje analize.[6] Od februara 2013. godine, LaTeXML je korišćen da donese veb stranice na matematičke proizvode na sajtu.

Implementacija

uredi

Jezgro LaTeXML je Perl reimplementacija TeX raščlanjivanja i digestije algoritma sa prilagodljivim XML emiterom. Kovertovanje semantičke strukture u LaTeX oznaku, LaTeXML ima XML povezivanje za LaTeX pakete. LaTeXML distribucija trenutno pruža XML povezivanja za preko 200 obično korišćenjem LaTeX paketa kao što su AMSTeX, Babel ili PGF/TikZ (koji ima samo eksperimentalnu podršku).[7] Dodatni (nepotpuni ali korisni) povezi su dobijeni od strane zajednice.

LaTeXML konverzija se sastoji iz dve faze:

  • prvo raščlanjavanje LaTeX i konvertuje LaTeX blizu XML tip dokumenta, i
  • druga (post-procesiranje) stvara iz tog jednog izlaznog formata XHTML, HTML5, HTML sa slikama, EPUB.

LaTeXML 0.8 je dodao daemon funkcionalnost koja je omogućila više konvertobanje i jednostavno uklapanje veb servisa.

Reference

uredi
  1. ^ "Gecko-based EPUB Readers and LaTeXML" Arhivirano na sajtu Wayback Machine (22. avgust 2014).
  2. ^ "Tools for Converting LaTeX to XML".
  3. ^ "Free Techno Blog: LaTeXML" Arhivirano na sajtu Wayback Machine (11. maj 2015).
  4. ^ Stamerjohanns, Heinrich; Kohlhase, Michael; Ginev, Deyan; David, Catalin; Miller, Bruce (2010).
  5. ^ "ACL 2014 Publication - Papers in XML format".
  6. ^ Schäfer, Ulrich; Read, Jonathon; Oepen, Stephan (2012).
  7. ^ "LaTeXML: Localization with Babel".

Spoljašnje veze

uredi