Публикации
Алгоритмы связывания и структурированное писательство
Статья входит в цикл «Понимание и применение структурированного писательства».
Редко кто из читателей читает контент последовательно. Пока контент не будет идеально совпадать с их опытом и их целями, они доходят до тех мест, где им необходимо больше информации, тех, где необходимо меньше, или тех, где они решают, что им необходимо нечто совершенно другое. Это точки отклонений от контента, точки, в которых читатель может решить пойти далее нелинейно. Это может означать отклонение к другому контенту или к другому способу поиска информации, например, вопрос другу или публикация вопроса на форуме. Так что давайте тщательно рассмотрим отклонения и то, как алгоритмы связывания поддерживают их в структурированном писательстве.
Отклонения — естественная часть информационного поиска или то, что также известно как фуражирование информации. Читатель в погоне за своими индивидуальными целями будет направляться туда, куда ведёт запах информации и это не всегда будет следующий абзац текущего текста.
Писатели знают, что не могут удовлетворять каждый раз потребности каждого идеально, так что они используют ссылки и другие механизмы, чтобы помочь читателям отклониться, когда им это требуется. Например, если у вас есть Модель А, делайте это. Если у вас Модель Б, делайте это. Поддержка отклонений помогает читателям достигать их целей и помогает удержать читателя в собственном контенте автора или другом предпочтительном контенте вместо отклонения куда-то в другое место. Читать дальше…
Алгоритмы структурированного писательства в процессе публикации
Статья входит в цикл «Понимание и применение структурированного писательства».
Всё структурированное писательство в конечном итоге должно быть опубликовано. Публикация структурированного контента — это преобразование его из домена, в котором оно было создано (домен объекта, домен документа или абстрактная часть домена носителя), в наиболее определённую часть спектра домена носителя: точки на бумаге или на экране.
Почти во всех инструментах структурированного писательства этот процесс совершается в несколько шагов. Использование нескольких шагов упрощает написание и поддержку кода, а также повторное использование кода для множества целей.
В этой статье я определяю публикацию как процесс, состоящий из четырёх основных алгоритмов, которые я упоминал мимоходом в предыдущих статьях: алгоритмы синтеза, представления, форматирования и кодирования. Это модель процесса публикации. Все процессы в этой модели должны где-то совершаться в каждом реальном процессе публикации, но организация этих процессов может подразделяться или иметь последовательность отличную от этой модели. Я формализовал эти четыре этапа в архитектуре SPFE (о которой подробнее расскажу позже), но думаю, что они являются достоверным представлением того, что происходит в большинстве цепочек инструментов для публикации. Чтобы понять требования каждого этапа и влияние на структурированное писательство, давайте посмотрим на процесс от финального вывода обратно к созданию и синтезу. Читать дальше…
Алгоритм повторного использования
Статья входит в цикл «Понимание и применение структурированного писательства».
Продолжаем публиковать серию статей Марка Бейкера о структурированном писательстве. В сегодняшней статье подробно рассматривается актуальный и очень интересный своей практичностью вопрос – как именно писать контент таким, чтобы он подходил для повторного использования. Также описаны проблемы, связанные с технологией единого источника. Предупреждён – значит вооружён, поэтому, если вы решаете вопрос с внедрением единого источника в вашей компании, ознакомьтесь особо внимательно!
Повторное использование контента в различных контекстах становится одним из основных драйверов структурированного писательства, особенно в виде широко распространённого применения DITA. Основные мотивы для повторного использования контента — снижение затрат (уход от создания одного и того же контента множество раз и гарантия связности или соответствие нормам (посредством непременного применения контента из подтверждённого источника).
Повторное использование контента — это не один метод, а коллекция из множества методов. Поэтому существует несколько алгоритмов повторного использования, каждый из которых требует особых структур контента в доменах объекта и документа.
Самый простой метод повторного использования контента — вырезать и вставить контент из одного источника в другой. Этот подход быстр и лёгок в применении, но приводит к куче проблем управления. Так что когда люди говорят о повторном использовании контента, они обычно имеют в виду любое и каждое из значений повторного использования контента, кроме вырезки и вставки. Читать дальше…
Алгоритм единого источника
Статья входит в цикл «Понимание и применение структурированного писательства».
Марк Бейкер продолжает свою серию статей, посвящённую структурированному писательству. В данной статье рассматривается единый источник в смысле представления одного документа на различных носителях. В публикации рассматриваются практические проблемы, возникающие при применении единого источника и способы их решения.
Единый источник был одной из первых мотиваций к структурированному писательству. Однако термин «единый источник» по привычке означает различные вещи, каждая из которых связана так или иначе с единым источником, но их используют разные подходы, что приводит к разным результатам. Чтобы упростить себе жизнь, я разделяю следующие три основных значения единого источника:
- Единый источник: Представление одного документа на различных носителях.
- Повторное использование контента: Использование одного контента для создания различных документов.
- Единый источник правды: Гарантия того, что каждая часть информации записана только единожды.
В этой статье мы рассмотрим единый источник так, как это определено выше. Читать дальше…
Алгоритмы в структурированном писательстве: Обработка структурированного текста
Статья входит в цикл «Понимание и применение структурированного писательства».
Марк Бейкер продолжает серию своих статей о структурированном писательстве. В очередной статье об алгоритмах, применяемых при использовании структурированного писательства, речь идёт о генерации выходных файлов для вывода на печать или на электронные устройства из структурированного представления, удобного для работы технических писателей.
Структурированное писательство включает в себя отделение контента от форматирования, так как мы выносим контент из домена носителя. Но для того, чтобы опубликовать контент, нам необходимо вернуть его обратно в домен носителя, собрав снова контент с форматированием. Чтобы это сделать, мы обрабатываем структурированный текст с помощью алгоритмов.
Одно из применений структурированного писательства — публикация различных комбинаций контента на различных носителях. Для этого нам могут потребоваться различные алгоритмы создания различных комбинаций контента и различных целевых носителей. Понимание основ этих алгоритмов важно для овладения структурированным писательством, даже если вы планируете программировать эти алгоритмы самостоятельно. Читать дальше…
Алгоритмы: Отделение контента от форматирования
Статья входит в цикл «Понимание и применение структурированного писательства».
Марк Бейкер в своей серии статей переходит от описания общих принципов структурирования писательства к описанию алгоритмов. Очередная статья посвящена вопросам отделения контента от форматирования, что позволяет писателям сосредоточиться на контенте, меньше уделяя внимание форматированию, а в перспективе и поведению текста на различных устройствах.
На этой стадии этой серии статей я собираюсь начать рассматривать алгоритмы структурированного писательства. Алгоритм — это формализованный метод для выполнения задачи. Мы часто связываем алгоритмы с компьютерами, т.к. для того, чтобы заставить компьютер что-либо сделать, мы должны формализовать алгоритм и представить его в виде программы. Но люди так же могут исполнять алгоритмы. Это одна из причин, почему мы обращаемся к структурированному писательству, с тем, чтобы передать трудоёмкие и обременительные алгоритмы писательства и публикации машинам. Читать дальше…
Качество в структурированном писательстве
Статья входит в цикл «Понимание и применение структурированного писательства».
В очередном выпуске своей серии публикаций о структурированном писательстве Марк Бейкер изучает качество с точки зрения роботов, которые читают, а также реальную роль машины по отношению к писателю.
Когда я говорю программистам о том, чем занимаюсь, они часто спрашивают меня, чем же так важно структурированное писательство. У машин так хорошо получается читать человеческий язык, утверждают они, что семантическая разметка в качестве помощи машине стремительно становится бессмысленной. Но структурированное писательство — оно не в помощь машине. Оно для привлечения машины в помощь писателю. И больше всего писателю требуется помощь с качеством.
Роботы, которые читают
Машины действительно всё лучше и лучше понимают человеческий язык. Подход, который называется Глубинным обучением, всё больше становится основной технологией для таких компаний как Facebook, Google и Baidu как для понимания языка, так и для распознавания речи. Читать дальше…
Структурированное писательство: Внедрение домена управления
Статья входит в цикл «Понимание и применение структурированного писательства».
В очередной статье серии о структурированном писательстве Марк Бейкер рассказывает о домене управления, который может быть реализован в рамках других основных доменов, через которые проходит контент, но при этом является обособленным доменом, который можно использовать для автоматизации работы с контентом. При этом необходимо не забывать о том, что излишне сложное управление контентом может привести к возвращению недостатков, которых позволяет избежать переход на структурированное писательство.
До сих пор я говорил о трёх доменах, через которые проходит контент и в которых он может быть записан: домен носителя, домен документа и домен объекта. Но существует четвёртый домен, который внедряется в эту картину структурированного писательства: домен управления.
Почему я называю домен управления навязанным? Потому что домены объекта, документа и носителя — о записи контента как такового, а домен управления — не о контенте, а о процессе управления им. Читать дальше…
Структурированное писательство: Работа в домене объекта
Статья входит в цикл «Понимание и применение структурированного писательства».
Марк Бейкер исследует домен объекта в очередной статье из продолжающейся серии о структурированном писательстве. В данной статье рассказываются преимущества и недостатки написания документации в домене объекта. Такой подход к документированию может стать новой вехой его развития, но, скорее всего, будет сочетаться с уже имеющимися инструментами для создания публикаций для носителей любого типа. Также сохранение информации в домене объекта позволяет лучше подготовить контент к изменениям в области документирования, — сейчас это важная задача, т.к. каждый год появляются новые форматы и стандарты документирования, и поддержка информации, её преобразование становится достаточно затратной составляющей в процессе поддержки имеющейся базы текстов.
При изучении домена документа мы увидели, что, как существуют типы документов, которые не зависят от какого-либо конкретного объекта, например, руководство пользователя, статья или отчёт, так существует и множество типов документов, которые относятся к конкретным объектам. Например, рецепт — тип документов, относящийся к приготовлению отдельных блюд. Читать дальше…
Структурированное писательство: Соскальзывание в домен носителя
Статья входит в цикл «Понимание и применение структурированного писательства».
Марк Бейкер завершает свой рассказ о работе в домене документа взглядом на то, как происходит «соскальзывание» в домен носителя и как выбрать язык домена документа, который удовлетворит вашим требованиям. Перед чтением этой статьи ознакомьтесь с введением о работе в домене документа, которое изложено в предыдущей статье.
В последней статье мы рассмотрели, как вы можете переместить свою работу из домена носителя в домен документа. Перемещение в домен документа может вам позволить выделить множество ваших ограничений домена документа, достичь лучшей связности при меньших затратах, а также предоставляет целый спектр возможностей автоматизации и контроля для вашего контента. Но авторы слишком легко соскальзывают в документ носителя, нивелируя все эти преимущества. Эта статья проливает свет на то, почему это происходит и что мы можем сделать, чтобы это предотвратить. Читать дальше…