Википедия:Вики-конференция 2007/Программа/Доклады/Колодин М.Ю. Применение гипертекста в научных исследованиях

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Колодин М. Ю. Применение гипертекста в научных исследованиях

[править код]

Михаил Юрьевич Колодин, Санкт-Петербургский институт информатики и автоматизации Российской Академии наук, myke@mail.ru

Аннотация

[править код]

В данной работе рассмотрены направления и способы применения гипертекстов в научных исследованиях, их нынешнее состояние и перспективы.

Kolodin M.Y. Using hypertext in scientific research.

The paper studies directions and ways of using documents in hypertext formats for scientific research, their current state and perspectives.

Гипертексты могут и должны широко использоваться в науке:

  1. для планирования и организации работы и исследований,
  2. для формулирования промежуточных и окончательных результатов,
  3. для обмена информацией, мнениями, организации обсуждений, рецензирования статей и т. п. между учёными,
  4. для представления результатов работы в сетевом и печатном виде.

Отметим, что исторически нынешний веб — побочный (инструментальный) продукт научного исследования (Тим Бернерс-Ли в CERNе), что неслучайно, поскольку человеку вообще свойственно организовывать своё мышление как поэтапное преобразование системы взаимосвязанных наборов информации, то есть фактически гипертекстово, точнее, гипермедийно; для науки это тем более актуально.

Туманные перспективы проектов типа SemanticWeb хотя и дают некоторую надежду, но ждать от них практической пользы в ближайшее время, по-видимому, не приходится.

Скорее всего, технологии, основанные на CMS типа Drupal, движках типа MediaWiki, могли бы существенно помочь как в индивидуальной работе, так и в обмене научными знаниями.

Очень важно найти средства для более-менее универсального представления научной информации, с тем, чтобы, единожды введённая, она могла быть многократно и многоформатно используема в разных целях.

Эксперименты, поиски адекватных, в том числе новых, средств продолжаются, но пока что нет единого удобного инструмента или формата.

  1. Для внутреннего представления универсально хорош и правилен XML,
  2. для вывода в сети — сейчас и в обозримом будущем будет (X)HTML,
  3. для печати — PDF, MSO Word, OOO Writer, графика, и т. п.,
  4. для передачи информации между пользователями (потребителями, конечными пользователями)
    1. в неизменном виде — PDF,
    2. а в редактируемом виде — wiki, plain text, MSO Word, OOO Writer, HTML, XML*,

и т. п.

Отдельный вопрос — работа с библиографией. Форматы BibTeX, специальные библиографические форматы для хранения и протоколы для передачи по сети библиографических данных арзного типа хорошо известны, но работы далеки от благополучного завершения, особенно в России.

Проблема современности — авторские права. Для определённых материалов нужно обеспечить неизменность, защиту прав автора и пользователей. предположительно для этого можно пользоваться ЭЦП, контрольными суммами, шифрованием, документами с встроенной защитой.

Ещё один вопрос — представление формульного материала, особенно сложного, с собственными обозначениями, которые в обычной математической работе в ТеХе выполняются с помощью макросов, иногда весьма сложных. Есть проблемы с переносом этого материала в неТеХовскую печать, интернет-представления. Возможным компромиссом было бы (само)ограничение тем подмножеством, которое поддерживается движком MediaWiki, плюс работы по расширению возможностей этого движка.

Представление данных исследований. Исходные, экспериментальные данные: таблицы, графики, цитаты, пр. Решения могут быть различными, но основной вариант — это XML, а также упрощённые табличные форматы, возможно, на основе XML (с шапкой, содержащей описание документа, и блоком данных без многословной XML-разметки).

Оформление научных работ должно быть выполнено в едином стиле, для чего стоит использовать специально разработанные шаблоны, стили, макросы, пр.

Выход работ должен быть направлен на их немедленное нпосредственное применение, в том числе в дальнейших публикациях, а также в производстве, то есть должен быть оформлен в соответствии с обязательными и рекомендательными российскими и международными стандартами. До сих пор в этом направлении сильные провалы, таких стилей, вообще говоря, нет. Несомненно, все государственные стандарты должны быть открыты, бесплатны, представлены в удобных переносимых форматах. На их основе с учётом современных технических возможностей должны быть разработаны преобразователи между форматами с обеспечением соответствия стандартам.

Важнейшая часть гипертекста — установление ссылок между единицами (блоками) текста. В общем случае сслыки (связи) могут быть различного типа, да и сами информационные единицы могут быть не только простыми текстовыми, но иметь структурную и стилевую разметку (оформление, в том числе цвет, шрифтовые и нешрифтовые выделения, в том числе отчерки, примечания на полях, внизу страницы, в конце главы (раздела), в конце документа, пр., автоматически формируемые индексы (справочники, алфавитные и т. п. указатели), и многое другое), графическими изображениями (различного типа), структурными и т. п. диаграммами, видео, звуком, и т. п., таким образом, можно говорить о гипермедиа.

Здесь нужно иметь в виду, что, как правило, современные документы — это согласованные системы из многих вложенных документов, и их преобразования также должны быть согласованными.

Многоязычность создаёт свои проблемы. Нужно найти средства для параллелизации языковых представлений, частичного автоперевода.

Нужно подумать и реализовать средства для коллективной, в том числе как поочерёдной, так и совместной, интерактивной работы многих участников на гипертекстах.

Мета-представление информации — важная составляющая этого процесса. Сейчас можно использовать такой компромисс. Для первичного ввода и ручного редактирования информации можно использовать упрощённые форматы (типа wiki), а для дальнейшего использования полезно переводить полученную информацию в формат XML, с попутной проверкой и корректировкой, а из него получать документы в остальных форматах.

В любом случае именно гипермедийное представление информации будет главным в современной науке, и нужно работать с ним адекватными средствами.