Структура и оформление текстового документа на примере языка разметки В.В. Лебедев Понимание структуры документа дает возможность не только передать его смысл, но и грамотно его оформить и, без труда, переформатировать в случае необходимости. Любой, даже самый простой, документ состоит из разделов (как минимум из одного), обязательным свойством которого является название раздела. Под разделом мы понимаем часть текста, представляющую собой некоторую законченную мысль. Разделы, в свою очередь, могут делиться на подразделы (разделы более низкого уровня) и так далее. Примечание. Название раздела n-го уровня называют заголовком n-го уровня. Текст внутри раздела наименьшего уровня также не однороден. Он разбивается на абзацы, которые, в свою очередь, также могут нести различную функциональную нагрузку. Например, абзац может являться определением, цитатой, примечанием, обычным текстом. Внутри абзаца встречаются слова с определенным функциональным смыслом. Пример: главные слова, определения, цитаты, новые слова. Таким образом, различают три типа структурных элементов текста: разделы, абзацные элементы и символьные элементы. Определение структурных элементов обеспечивает структуризацию документа, что позволяет более адекватно воспринимать его читателем. Каждый создатель текстового документа имеет право оформлять те или иные структурные элементы так, как считает нужным, как он привык или как ему удобно. Однако восприятие данного документа другими людьми отличается от восприятия автора, и они тоже имеют право читать данный документ в той форме, которая для них более удобна. Помимо этого существуют ряд требований по оформлению официальных документов (например, ГОСТы), независящих от вкусов конкретного человека. Каким образом можно одновременно предоставить максимальную свободу по оформлению документов его создателю, и одновременно с этим сделать его удобным для читателя, или удовлетворить формальным требованиям? Для этого необходимо разделить процесс структуризации и процесс оформления документа. Для понимания процесса структуризации текста удобно использовать языки разметки, в частности HTML, а для оформления размеченного текста, так называемые, таблицы стилей. Наиболее распространенными таблицами стилей, совместимыми с HTML являются XSL (Extensible Stylesheet Language, расширяемый язык таблицы стилей) и CSS (Cascading Style Sheet, каскадные таблицы стилей). Смысл данных таблиц в том, что каждому из структурных элементов ставится в соответствие свой набор визуальных свойств текста. Соответственно, для символьных структурных элементов – только символьные свойства (шрифт, размер, цвет, начертание и так далее), а для абзацных структурных элементов – как символьные, так и абзацные свойства (выравнивание, интерльяж, абзацный отступ, трекинг и так далее). Для структурных элементов типа “раздел” используют такие свойства, как отступы (поля), цвет фона и так далее. Таким образом, каждый пользователь имеет возможность создавать таблицы стилей, которые ему кажутся удобными (или которые от него требуют формальные правила), применять их к чужому (но, структурированному) документу, и получать на выходе документ оформленный в соответствии с собственными требованиями. Несмотря на то, что HTML обладает определенными возможностями оформления текста, он не способен связать набор свойств со структурным элементом, это может сделать только создатель документа. Но при попытке грамотно оформить большой документ, во-первых возникает большая вероятность ошибки (во всех абзацах основного текста указано правое выравнивание, а в одном – нет), а во-вторых, модификация такого документа становится весьма затруднительна (ведь необходимо исправить свойства у всех одинаковых структурных элементов). Поэтому, рассматривая HTML, удобнее не пользоваться тегами (и другими возможностями) оформления, а использовать этот язык только для разметки структуры документа, оставив все оформление за CSS (так как он проще и более распространен, чем XSL).