Zpravodaj Československého sdružení uživatelů TEXu, ISSN 1211-6661, eISSN 1213-8185, http://bulletin.cstug.cz/
Issue homepage: http://bulletin.cstug.cz/bul20071.shtml, URL to PDF: http://bulletin.cstug.cz/pdf/bul_071.pdf
Volume 17, Number 1, pages 1220, 2007. BibTEX source; DOI:10.5300/2007-1/12
Published by CSTUG, printed and distributed by Konvoj, s. r. o.
Babel Speaks Hindi (in Czech)
Abstract: Babel provides unified interface for creation of multilingual documents. Unfortunately none of Indic languages is currently supported. Typesetting in Indic languages is based on specialised packages. The most advanced from them is Velthuis Devanagarı for TEX because it already provides Hindi captions as well as a macro for a Europian style date. A language definition file for plugging Hindi into babel has therefore been recently developed.
The second part of the paper explains differences between UNICODE and Velthuis transliteration. This is important for understanding the tool that can convert Hindi and Sanskrit documents from MS Word and OpenOffice.org into TEX via an XSLT 2.0 processor and a Perl script as well as a method of making the PDF files searchable.
Finally the paper discusses some possibilities of further development, mainly the advantages offered by XETEX and by forthcoming integration of LUA into pdfTEX.
Babylón mluví hindsky
Abstrakt: Babel poskytuje jednotné rozhraní pro tvorbu vícejazyčných dokumentů. V současné době není bohužel podporován žádný z indických jazyků. Sazba v indických jazycích je založena na specializovaných balíčcích. Nejpokročilejším z nich je Velthuis Devanagarı for TEX, protože již obsahuje hindské nadpisy i makro pro tisk data v evropském stylu. Definiční soubor pro začlenění hindštiny do babelu byl tedy v současné době vyvinut.
Druhá část článku vysvětluje rozdíl mezi UNICODE a Velthuisovou transliterací. To je důležité pro pochopení nástroje sloužícího ke konverzi hindských a sanskrtských dokumentů z MS Wordu a OpenOffice.org do TEXu pomocí procesoru XSLT 2.0 a perlovského skriptu, jakož i metody, jak lze vytvořit prohledávatelný PDF soubor.
Závěrem článek diskutuje možnosti dalšího vývoje, zejména možnosti, jež nabízí XETEX a integrace jazyka LUA do pdfTEXu. Práce byla prezentována na konferenci TUG 2006 v Marrákéši a zveřejněna v angličtině v TUGboatu [13]. Český překlad je publikován se souhlasem organizátorů konference i redakce TUGboatu.
Acknowledgements
Autor děkuje ostatním vývojářům Velthuis Devanagarı for TEX, protože zmíněný balíček je základem tohoto projektu, jakož i Karlu Píškovi za konverzi indických fontů do formátu Type 1 [9]. Zvláštní poděkování zaslouží Anshuman Pandey za překlad nadpisu do hindštiny a John Smith a Arnošt Štědrý za poskytnutí testovacích souborů vytvořených XETEXem. Autor dále děkuje Alexandru Babičovi za provedení testů v Ubuntu a Petru Tomáškovi za vysvětlení způsobu zobrazení písem v Xorg. Za finanční podporu účasti na konferenci TUG 2006 autor děkuje CSTUGu a TUGu.
Author

Zdeněk Wagner
Ústav chemických procesů AV ČR, v. v. i.
Rozvojová 2/135
CZ-16502 Praha 6-Suchdol
Czech Republic
References
  1. Devanagarı for TEX. http://devnag.sarovar.org/
  2. Joan Aliprand et al. The Unicode Standard, chapter South Asian Scripts. The Unicode Consortium, 2003. http://www.unicode.org/faq/indic.html#5
  3. Hans Hagen. LuaTEX: Howling to the moon. TUGboat, 26(2):152–157, 2005. http://www.tug.org/TUGboat/Contents/contents26-2.html
  4. International components for Unicode. http://icu.sourceforge.net/
  5. Michael Kay. Saxon, the XSLT and XQuery processor. http://saxon.sourceforge.net/
  6. Petr Olšák. encTEX. http://www.olsak.net/enctex.html
  7. xml editor. http://www.oxygenxml.com/
  8. Pango. http://www.pango.org/
  9. Karel Píška. Indic Type 1 fonts for TEX. CTAN:fonts/ps-type1/indic
  10. Transliteration pages. http://homepage.ntlworld.com/stone-catend/translit.htm
  11. Zdeněk Wagner. Můj volně šiřitelný software. http://icebearsoft.euweb.cz/sw.php
  12. Zdeněk Wagner. Prohledávatelné pdf s dévanágarskými texty. http://icebearsoft.euweb.cz/dvngpdf/
  13. Zdeněk Wagner. Babel speaks Hindi. TUGboat, 27(2):176–180, 2006.
  14. The XETEX typesetting system. http://scripts.sil.org/xetex
Cited-by CrossRef


Webpage prepared by editors of the journal.