программ. Кроме того, сам по себе XML является достаточно громоздким, из-за чего порой трудно найти данные среди всей разметки.

Одной прикладной областью, в которой XML, безусловно, выигрывает, являются форматы разметки для файлов документов (подробнее данная тема освещается в главе 18). Плотность разметки в таких документах небольшая по сравнению с большими блоками простого текста, поэтому традиционные средства Unix довольно хорошо справляются с простыми операциями поиска и трансформации текста.

Пример 5.5. XML-формат

<?xml version='1.0'?>

<kprintfilter name='imagetops'>

 <filtercommand data='imagetops %filterargs %filterinput %filteroutput' />

 <filterargs>

  <filterarg name='center' description='Image centering'

   format='-nocenter' type='bool' default='true'>

   <value name='true' description='Yes' />

   <value name='false' description='No' />

  </filterarg>

  <filterarg name='turn'

   description='Image rotation' format='-%value' type='list' default='auto'>

   <value name='auto' description='Automatic' />

   <value name='noturn' description='None' />

   <value name='turn' description='90 deg' />

  </filterarg>

  <filterarg name='scale'

   description='Image scale' format='-scale %value' type='float'

   min='0.0' max='1.0' default='1.000' />

  <filterarg name='dpi'

   description='Image resolution' format='-dpi %value'

   type='int' min='72' max='1200' default='300' />

 </filterargs>

 <filterinput>

  <filterarg name='file' format='%in' />

  <filterarg name='pipe' format='' />

 </filterinput>

 <filteroutput>

  <filterarg name='file' format='> %out' />

  <filterarg name='file' format='' />

 </filteroutput>

</kprintfilter>

Своеобразным мостом между этими мирами является формат PYX — строчно-ориентированное преобразование XML, которое можно обработать с помощью традиционных строчных текстовых средств Unix, а затем без потерь перевести обратно в XML. Web-поиск по ключевому слову 'Pyxie' позволит найти ссылки на соответствующие ресурсы. Инструментальный набор xmltk движется в противоположном направлении, предоставляя потоковые средства, аналогичные grep(1) и sort(1), для фильтрации XML-документов. Поиск по слову 'xmltk' в Web поможет найти данный инструментарий.

XML может упрощать или, напротив, усложнять конструкцию. Он окружен активной рекламой, однако не стоит становиться жертвой моды, безоговорочно принимая или отвергая данный формат. Выбирать следует осторожно, руководствуясь принципом KISS.

5.2.6. Формат Windows INI

Многие программы в Microsoft Windows используют текстовый формат данных, подобный фрагменту, приведенному в примере 5.6. В данном примере необязательные ресурсы с именами account, directory, numeric_id и developer связываются с именованными проектами python, sng, fetchmail и py-howto. В записи DEFAULT указаны значения, которые используются в случае, если они не предоставляются именованными записями.

Пример 5.6. Формат Windows INI

[DEFAULT]

account = esr

[python]

directory = /home/esr/cvs/python/

developer = 1

[sng]

directory = /home/esr/WWW/sng/

numeric_id = 1012

developer = 1

[fetchmail]

numeric_id = 18364

[py-howto]

account = eric

directory = /home/esr/cvs/py-howto/

developer = 1

Такой стиль формата файлов данных не характерен для операционной системы Unix, однако некоторые Linux-программы (особенно Samba, пакет средств доступа к Windows-файлам из Linux) под влиянием Windows поддерживают его. Данный формат является четким и неплохо спроектированным, однако, как и в случае XML, grep(1) или традиционные средства сценариев Unix не обрабатывают его должным образом.

.INI-формат целесообразно использовать, если данные естественным образом соответствуют его двухуровневой организации пар 'имя-атрибут', собранных в группы в именованных записях или секциях. Он плохо подходит для данных с полностью рекурсивной древовидной структурой (для этого лучше подходит XML), и является избыточным для простого списка связей 'имя-значение' (в этом случае лучше использовать DSV).

5.2.7. Unix-соглашения по текстовым файловым форматам

Существуют давние традиции Unix, определяющие вид текстовых форматов данных. Большинство из них происходит от одного или нескольких описанных выше стандартных метаформатов Unix. Разумно следовать данным соглашениям, если нет весомых и специфических причин поступать иначе.

В главе 10 рассматривается другой набор соглашений, применяемых для файлов конфигурации программ, однако, следует заметить, что в нем используются некоторые из описанных выше правил

Добавить отзыв
ВСЕ ОТЗЫВЫ О КНИГЕ В ИЗБРАННОЕ

0

Вы можете отметить интересные вам фрагменты текста, которые будут доступны по уникальной ссылке в адресной строке браузера.

Отметить Добавить цитату