Title: Generování vzorů pomocí knihovny PatLib a programu OPatGen (Czech)
Title: Pattern Generation using PatLib Library and Program OPatGen (English)
Author: Antoš, David
Author: Sojka, Petr
Language: Czech
Journal: Zpravodaj Československého sdružení uživatelů TeXu
ISSN: 1211-6661 (print)
ISSN: 1213-8185 (online)
Volume: 12
Issue: 1
Year: 2002
Pages: 3-12
Summary lang: Czech
Category: informatics
Summary: Článek popisuje techniku generování vzorů jako prostředek pro získávání informace z rozsáhlých dat. Typickou aplikací této techniky je vytvoření časově i prostorově velmi efektivního algoritmu dělení slov ze seznamu již rozdělených slov. Doposud chyběl generátor vzorů dělení pro UNICODE (pro systémΩ) a rozšíření dosud užívaného programu PatGen, omezeného osmibitovým ASCII, nebylo již nadále únosné. Proto vyvíjíme knihovnu PatLib pro obecnou manipulaci se vzory a na ní postavený generátor vzorů dělení slov OPatGen. Popíšeme architekturu tohoto systému. Vzory lze použít i pro rozpoznávání hranic složených slov, proto zmíníme návrhy na rozšíření následníků TeXu o klasifikované dělení s více typy dělicích bodů a o automatické potlačování ligatur na švech složených slov. (Czech)
Summary: Paper describes technique of competing patterns as a method for data mining and effective storage. Development of time- and space-effective hyphenation algorithm from already hyphenated word list is a typical application. The program PatGen, being nearly twenty years old, doesn't suit today's needs (limitation to eight-bit encodings, monolithic, hard to maintain code, etc.). A new pattern generator, OPatGen, suitable for system Ω, has been designed and implemented from scratch in object-oriented manner. An architecture of OPatGen is outlined. It is based on genericlibrary PatLib for pattern handling. Possible applications of the pattern technology are listed (multi-level and compound word hyphenation, Thai segmentation, optical character recognition . (English)
DOI: 10.5300/2002-1/3
Date available: 2022-04-13T09:38:40Z
Last updated: 2024-12-15
Stable URL:
Files Size Format View
ZpravodajCSTUG_012-2002-1_2.pdf 219.5Kb application/pdf View/Open
