Три домена в структуре контента

13.08.2015

Статья входит в цикл «Понимание и применение структурированного писательства».

Настоящая статья Марка Бейкера по структурированному писательству рассказывает, каким образом три домена контента работают на структурный контент. Ознакомьтесь с его первой статьёй, если хотите узнать больше о том, как Марк определяет структурированное писательство.

От идеи к точкам

Процесс создания и распространения контента состоит из преобразования идей (то, что кто-то придумал или знает) в конкретную физическую форму, которую можно прочитать (точки чернил или пиксели на странице или экране). Процесс написания и опубликования касается всего, где мы, отталкиваясь от идей, достигаем точек на странице.

В самом простом случае автор записывает свои идеи с помощью ручки и бумаги. Полное преобразование идей в точки происходит в голове автора. Контент записывается напрямую в окончательной физической форме.

Запись контента напрямую в физическую форму редко встречается в наши дни. В большинстве случаев контент записывается сначала в процесс, и программа берёт его из места, где он записывается, для заключительного отображения на бумаге или экране.

Текстовый процессор и настольная издательская система, а также различные подходы к структурированному писательству, — все эти компоненты имеют своё место в этом процессе перехода от идей к точкам, где контент будет записан автором, а затем предоставляют алгоритмы для завершения процесса перехода к точкам на странице. Отличия между ними заключаются в том, как и где в этом процессе осуществляется запись контента, и в типе алгоритмов, которые предоставляются для его обработки после этого этапа.

Когда вы используете текстовый процессор, то записываете контент с помощью абстрактных структур документа — списков, таблиц, параграфов. Отдельно вы можете определить стили, которые затем применяются к контенту перед тем, как он отправляется на принтер, чтобы преобразиться в чернила на бумаге.

Примечательно в этом процессе то, что контент и стили определяются отдельно. Автор создаёт два различных типа данных: контент и инструкции по стилю. Эти два потока затем передаются в программу для получения заключительного отображения.

Эта комбинация множества потоков данных и инструкций — обычная функция любой системы, которая записывает контент до стадии точек. Весь контент должен быть в конечном итоге отображён в виде точек, и способ, с помощью которого вы воспринимаете контент, не определяющий расположение точек, требует инструкции — алгоритмы — для преобразования записанного формата в точные расположения точек на бумаге или экране.

В современных текстовых процессорах программа может взять контент и инструкции по стилю и скомпоновать их на лету, чтобы обеспечить WYSIWYG-отображение, создавая иллюзию того, что автор создаёт окончательный вывод напрямую. Как мы увидим, чем раньше мы записываем контент, тем более сложным это становится.

То, что мы обычно называем «структурированным писательством» — это просто процесс перемещения записи контента на ещё более раннюю позицию в процессе перехода от идеи к точкам. Здесь подразумевается, конечно, что обработка текста WYSIWYG не является противоположностью структурированного писательства. На самом деле это всего лишь точка в континууме структурированного писательства: точка, расположенная совсем рядом к точкам на странице.

Другие подходы к структурированному контенту просто перемещают момент, в который записывается контент, ближе к концу «идеи в голове» на шкале.

Конечно, текст сам по себе всегда передаёт идеи автора, по крайней мере, так же хорошо, как автор способен их выразить. Спорный момент заключается в том, какая часть программы играет свою роль в процессе, посредством которого идеи в голове автора совершают путешествие к точкам на странице. Эта роль может просто позволять различным точкам переноситься на различные поверхности из одних и тех же исходных файлов, а может играть активную роль в формировании и организации текста.

Три домена

Мы можем разделить это путешествие от идей к точкам на три домена: домен объекта, домен документа и домен носителя.

Предположим, автор пишет рецепт куриной лапши. Он начинает с идеи супа с курицей и лапшой. Это идея о сущности объекта, и ещё не касается формы контента.

Затем он решает дать блюду название «Куриная лапша». В отличие от супа как такового, имя — это контент. Однако это ещё не часть документа. Это часть данных в домене объекта.

Затем автор решает записать рецепт Куриной лапши. Он, возможно, использует имя блюда в качестве заголовка рецепта. Заголовок — это объект в домене документа. Документы содержат заголовки. Это специфическая часть документа, однако это — рецепт. Так как рецепт — это тип документа, это тип документа с сильной связью с доменом объекта — объекта блюд и их приготовления.

Когда процесс продолжается, выбирается формат для публикации рецепта. Это может быть HTML. HTML — это язык разметки в домене документа. Т.е. он содержит разметку для типизированных структур документа, таких как заголовок, абзацы и списки. Чтобы представить заголовок рецепта в HTML, мы переведём декларацию заголовка рецепта в декларацию об уровне заголовка HTML:

Сделав это, мы существенно ослабили ассоциацию с доменом объекта. На этой стадии мы знаем, что «Куриная лапша» — это заголовок веб-страниц, а не то, что это заголовок рецепта и не название блюда. Однако мы также сделали более специализированным тип документа: веб-страница.

Решив, что это веб-страница, мы также начали понемногу устанавливать домен носителя. HTML ни в коем случае не ограничивается единственным носителем. Его можно использовать для создания веб-страниц, справочных платформ, мобильных приложений и даже распечатанных страниц. В то же время он содержит множество предположений о домене носителя, в котором будет отображаться документ.

Однако если вы придерживаетесь современных методов, ваш HTML не должен содержать какой-либо специфической информации о том, как будет интерпретироваться ваш документ — какие будут использованы шрифты, насколько большими будут поля и т.д. Мы перемещаем контент ещё дальше к домену носителя, создавая таблицу стилей CSS, которая определяет эти параметры. (Это один из тех случаев, когда два потока информации сближаются, о чём я упоминал вначале).

Добавление CSS перемещает весь комплект дальше к домену носителя. Однако обратите внимание, что в этом случае все домены информации документа в HTML-формате сохраняются. Перемещение от домена объекта через домен документа в домен носителя не должно означать, что информация из более раннего домена должна быть выкинута, когда вы добавляете информацию из более поздних доменов. Например, микроформаты HTML5 позволяют сохранить информацию домена объекта на всём пути к браузеру пользователя. Традиционные техники публикации имеют склонность отбрасывать информацию из домена объекта по мере продвижения процесса. Сегодня же эта информация чаще всего остаётся так долго, как это возможно. (Один из смыслов термина «умный контент»).

Когда конечная страница загружается в браузер, точки рисуются на экране должным образом.

Этот процесс приводит к переводу информации из доменов документа и носителя в HTML и CSS к графическим элементам платформы, в которой отображается контент — по сути, к подсветке точек на экране или распечатке точек на бумаге. Последний шаг разрушит всю информацию из доменов документа и объекта, но пока браузер хранит HTML-источник, любая информация, достигшая этой точки, доступна для запуска кода в браузере.

Декларатив против императива

По мере продвижения от домена объекта через домен документа к домену носителя мы обнаружим, что двигаемся от декларатива к императиву. Формулировка декларатива просто говорит, чем является что-то. Формулировка императива даёт инструкцию. Идеи домена объекта — исключительно декларатив. Точки создают исключительно императивные инструкции для программы.

Поэтому по мере следования из домена объекта к домену носителя мы непрерывно конвертируем декларативы в императивы. Например, CSS-правило:

h1 { font: italic 24pt Comic Sans}

превращает более декларативный HTML-тэг <H1>, который просто декларирует, что часть контента является первым уровнем заголовка, в специфический набор инструкций о шрифтах.

По мере следования от идей к точкам контент содержит меньше деклараций о сути объекта и больше деклараций о структуре документа, а затем немного меньше о структуре документа и немного больше инструкций о процессе интерпретации. К тому времени мы достигаем стадии HTML, у нас больше нет никаких деклараций, связывающих слова с супом (если мы не используем микроформаты). Только структура документа (это — главный заголовок, это — список), которая затем становится более конкретной на каждой из последующих стадий, пока не превращается просто в инструкции для размещения точек на поверхности.

Когда мы посмотрим на форматы, использованные для записи контента на каждой из этих стадий, то увидим, что в домене объекта формат полностью декларативный. В домене документа мы обычно обнаруживаем смесь декларативных и императивных документов. В домене носителя у нас только императивы (хотя некоторые императивы могут быть в форме декларативов).

Следствием этого является то, что, передвигая точки записи на более ранние стадии процесса, мы на самом деле поступаем ровно наоборот: мы убираем императивы и замещаем декларативами. Мы превращаем инструкции о том, как должен выглядеть документ, в декларации о том, как документ организован или о чём этот документ.

Одно из классических определений структурированного писательства — «отделение контента от форматирования». О том, как мы отделяем контент от форматирования, заменяя инструкции о том, как форматировать контент, на декларации о структуре или сути предмета контента. Если вам интересно, как конкретно контент отделяется от форматирования и как это выглядит на практике, приведённый пример прояснит, каким образом каждое движение в сторону от домена носителя по направлению к домену документа или от домена документа по направлению к домену объекта всё больше отделяет контент от форматирования. И необходимо подчеркнуть, что процесс может выглядеть очень по-разному в зависимости, откуда вы начинаете и к чему двигаетесь.

Почему так важно переместить точку создания контента обратно из домена носителя в домен документа или в домен объекта, от декларатива к императиву? На то есть несколько причин:

Декларативы дают вам выбор. Декларация о структуре документа или объекте высказывания не склоняет вас к его отображению определённым способом. Императив, с другой стороны, является инструкцией, которой необходимо подчиняться. Перемещение от декларатива к императиву — процесс выбора. Передвижение от императива к декларативу — процесс ухода от выбора.
Декларативы могут быть ограничивающими. Мы определили структурированное писательство как акт создания контента с определёнными ограничениями. Декларативы могут быть ограничены гораздо проще и с куда большей точностью, чем императивы. Декларативы могут быть также проверяться и утверждаться с большей точностью, чем императивы.
Декларативы писать легче. Для автора, создающего декларативы, необходимо только знать суть объекта и формат деклараций. Для автора, создающего императивы, необходимо понимание языка и эффект от инструкций. В случае встроенных алгоритмов требуется, чтобы пользователь понимал язык этих алгоритмов.

В следующей статье мы рассмотрим эти преимущества и множество различных алгоритмов обработки контента, которые вы можете использовать в более декларативных структурах контента.

Источник: The Three Domains of Content Structure

Тэги: HTML, HTML5, Марк Бейкер, структурированное писательство, теория документирования

< Вернуться к списку публикаций

Три домена в структуре контента

От идеи к точкам

Три домена

Декларатив против императива

Облако тегов