программ. Кроме того, сам по себе XML является достаточно громоздким, из-за чего порой трудно найти данные среди всей разметки.
Одной прикладной областью, в которой XML, безусловно, выигрывает, являются форматы разметки для файлов документов (подробнее данная тема освещается в главе 18). Плотность разметки в таких документах небольшая по сравнению с большими блоками простого текста, поэтому традиционные средства Unix довольно хорошо справляются с простыми операциями поиска и трансформации текста.
<?xml version='1.0'?>
<kprintfilter name='imagetops'>
<filtercommand data='imagetops %filterargs %filterinput %filteroutput' />
<filterargs>
<filterarg name='center' description='Image centering'
format='-nocenter' type='bool' default='true'>
<value name='true' description='Yes' />
<value name='false' description='No' />
</filterarg>
<filterarg name='turn'
description='Image rotation' format='-%value' type='list' default='auto'>
<value name='auto' description='Automatic' />
<value name='noturn' description='None' />
<value name='turn' description='90 deg' />
</filterarg>
<filterarg name='scale'
description='Image scale' format='-scale %value' type='float'
min='0.0' max='1.0' default='1.000' />
<filterarg name='dpi'
description='Image resolution' format='-dpi %value'
type='int' min='72' max='1200' default='300' />
</filterargs>
<filterinput>
<filterarg name='file' format='%in' />
<filterarg name='pipe' format='' />
</filterinput>
<filteroutput>
<filterarg name='file' format='> %out' />
<filterarg name='file' format='' />
</filteroutput>
</kprintfilter>
Своеобразным мостом между этими мирами является формат PYX — строчно-ориентированное преобразование XML, которое можно обработать с помощью традиционных строчных текстовых средств Unix, а затем без потерь перевести обратно в XML. Web-поиск по ключевому слову 'Pyxie' позволит найти ссылки на соответствующие ресурсы. Инструментальный набор xmltk движется в противоположном направлении, предоставляя потоковые средства, аналогичные
XML может упрощать или, напротив, усложнять конструкцию. Он окружен активной рекламой, однако не стоит становиться жертвой моды, безоговорочно принимая или отвергая данный формат. Выбирать следует осторожно, руководствуясь принципом KISS.
5.2.6. Формат Windows INI
Многие программы в Microsoft Windows используют текстовый формат данных, подобный фрагменту, приведенному в примере 5.6. В данном примере необязательные ресурсы с именами account
, directory
, numeric_id
и developer
связываются с именованными проектами python
, sng
, fetchmail
и py-howto
. В записи DEFAULT указаны значения, которые используются в случае, если они не предоставляются именованными записями.
[DEFAULT]
account = esr
[python]
directory = /home/esr/cvs/python/
developer = 1
[sng]
directory = /home/esr/WWW/sng/
numeric_id = 1012
developer = 1
[fetchmail]
numeric_id = 18364
[py-howto]
account = eric
directory = /home/esr/cvs/py-howto/
developer = 1
Такой стиль формата файлов данных не характерен для операционной системы Unix, однако некоторые Linux-программы (особенно Samba, пакет средств доступа к Windows-файлам из Linux) под влиянием Windows поддерживают его. Данный формат является четким и неплохо спроектированным, однако, как и в случае XML,
.INI-формат целесообразно использовать, если данные естественным образом соответствуют его двухуровневой организации пар 'имя-атрибут', собранных в группы в именованных записях или секциях. Он плохо подходит для данных с полностью рекурсивной древовидной структурой (для этого лучше подходит XML), и является избыточным для простого списка связей 'имя-значение' (в этом случае лучше использовать DSV).
5.2.7. Unix-соглашения по текстовым файловым форматам
Существуют давние традиции Unix, определяющие вид текстовых форматов данных. Большинство из них происходит от одного или нескольких описанных выше стандартных метаформатов Unix. Разумно следовать данным соглашениям, если нет весомых и специфических причин поступать иначе.
В главе 10 рассматривается другой набор соглашений, применяемых для файлов конфигурации программ, однако, следует заметить, что в нем используются некоторые из описанных выше правил