Zpravodaj Československého sdružení uživatelů TEXu,
ISSN 1211-6661,
eISSN 1213-8185, http://bulletin.cstug.cz/
Issue homepage: http://bulletin.cstug.cz/bul20071.shtml, URL to PDF: http://bulletin.cstug.cz/pdf/bul_071.pdf
Volume 17,
Number 1,
pages 12–20,
2007.
BibTEX source;
DOI:10.5300/2007-1/12
Published by CSTUG, printed and distributed by Konvoj, s. r. o.
Babel Speaks Hindi (in Czech)
Abstract:
Babel provides unified interface for creation of multilingual documents. Unfortunately
none of Indic languages is currently supported. Typesetting in Indic
languages is based on specialised packages. The most advanced from them is
Velthuis Devanagarı for TEX because it already provides Hindi captions as well
as a macro for a Europian style date. A language definition file for plugging
Hindi into babel has therefore been recently developed.
The second part of the paper explains differences between UNICODE and
Velthuis transliteration. This is important for understanding the tool that can
convert Hindi and Sanskrit documents from MS Word and OpenOffice.org into
TEX via an XSLT 2.0 processor and a Perl script as well as a method of making
the PDF files searchable.
Finally the paper discusses some possibilities of further development, mainly
the advantages offered by XETEX and by forthcoming integration of LUA into
pdfTEX.
Babylón mluví hindsky
Abstrakt:
Babel poskytuje jednotné rozhraní pro tvorbu vícejazyčných dokumentů. V současné
době není bohužel podporován žádný z indických jazyků. Sazba v indických
jazycích je založena na specializovaných balíčcích. Nejpokročilejším z nich
je Velthuis Devanagarı for TEX, protože již obsahuje hindské nadpisy i makro
pro tisk data v evropském stylu. Definiční soubor pro začlenění hindštiny do
babelu byl tedy v současné době vyvinut.
Druhá část článku vysvětluje rozdíl mezi UNICODE a Velthuisovou transliterací.
To je důležité pro pochopení nástroje sloužícího ke konverzi hindských
a sanskrtských dokumentů z MS Wordu a OpenOffice.org do TEXu pomocí
procesoru XSLT 2.0 a perlovského skriptu, jakož i metody, jak lze vytvořit
prohledávatelný PDF soubor.
Závěrem článek diskutuje možnosti dalšího vývoje, zejména možnosti, jež
nabízí XETEX a integrace jazyka LUA do pdfTEXu.
Práce byla prezentována na konferenci TUG 2006 v Marrákéši a zveřejněna
v angličtině v TUGboatu [13]. Český překlad je publikován se souhlasem
organizátorů konference i redakce TUGboatu.
Acknowledgements
Autor děkuje ostatním vývojářům Velthuis Devanagarı for TEX, protože zmíněný
balíček je základem tohoto projektu, jakož i Karlu Píškovi za konverzi indických
fontů do formátu Type 1 [9]. Zvláštní poděkování zaslouží Anshuman Pandey za
překlad nadpisu do hindštiny a John Smith a Arnošt Štědrý za poskytnutí testovacích
souborů vytvořených XETEXem. Autor dále děkuje Alexandru Babičovi
za provedení testů v Ubuntu a Petru Tomáškovi za vysvětlení způsobu zobrazení
písem v Xorg. Za finanční podporu účasti na konferenci TUG 2006 autor děkuje
CSTUGu a TUGu.
Author
Zdeněk
Wagner
Ústav chemických procesů AV ČR, v. v. i.
Rozvojová 2/135
CZ-16502 Praha 6-Suchdol
Czech Republic
References
- Devanagarı for TEX. http://devnag.sarovar.org/
- Joan Aliprand et al. The Unicode Standard, chapter South Asian Scripts.
The Unicode Consortium, 2003. http://www.unicode.org/faq/indic.html#5
- Hans Hagen. LuaTEX: Howling to the moon. TUGboat, 26(2):152–157,
2005. http://www.tug.org/TUGboat/Contents/contents26-2.html
- International components for Unicode. http://icu.sourceforge.net/
- Michael Kay. Saxon, the XSLT and XQuery processor.
http://saxon.sourceforge.net/
- Petr Olšák. encTEX. http://www.olsak.net/enctex.html
- xml editor. http://www.oxygenxml.com/
- Pango. http://www.pango.org/
- Karel Píška. Indic Type 1 fonts for TEX. CTAN:fonts/ps-type1/indic
- Transliteration pages.
http://homepage.ntlworld.com/stone-catend/translit.htm
- Zdeněk Wagner. Můj volně šiřitelný software.
http://icebearsoft.euweb.cz/sw.php
- Zdeněk Wagner. Prohledávatelné pdf s dévanágarskými texty.
http://icebearsoft.euweb.cz/dvngpdf/
- Zdeněk Wagner. Babel speaks Hindi. TUGboat, 27(2):176–180, 2006.
- The XETEX typesetting system. http://scripts.sil.org/xetex
Cited-by CrossRef
Webpage prepared by editors of the journal.
