Википедия:Вики-конференция 2007/Программа/Доклады/Колодин М.Ю. Применение гипертекста в научных исследованиях
Колодин М. Ю. Применение гипертекста в научных исследованиях
[править код]Михаил Юрьевич Колодин, Санкт-Петербургский институт информатики и автоматизации Российской Академии наук, myke@mail.ru
Аннотация
[править код]В данной работе рассмотрены направления и способы применения гипертекстов в научных исследованиях, их нынешнее состояние и перспективы.
In English
[править код]Kolodin M.Y. Using hypertext in scientific research.
The paper studies directions and ways of using documents in hypertext formats for scientific research, their current state and perspectives.
Текст
[править код]Гипертексты могут и должны широко использоваться в науке:
- для планирования и организации работы и исследований,
- для формулирования промежуточных и окончательных результатов,
- для обмена информацией, мнениями, организации обсуждений, рецензирования статей и т. п. между учёными,
- для представления результатов работы в сетевом и печатном виде.
Отметим, что исторически нынешний веб — побочный (инструментальный) продукт научного исследования (Тим Бернерс-Ли в CERNе), что неслучайно, поскольку человеку вообще свойственно организовывать своё мышление как поэтапное преобразование системы взаимосвязанных наборов информации, то есть фактически гипертекстово, точнее, гипермедийно; для науки это тем более актуально.
Туманные перспективы проектов типа SemanticWeb хотя и дают некоторую надежду, но ждать от них практической пользы в ближайшее время, по-видимому, не приходится.
Скорее всего, технологии, основанные на CMS типа Drupal, движках типа MediaWiki, могли бы существенно помочь как в индивидуальной работе, так и в обмене научными знаниями.
Очень важно найти средства для более-менее универсального представления научной информации, с тем, чтобы, единожды введённая, она могла быть многократно и многоформатно используема в разных целях.
Эксперименты, поиски адекватных, в том числе новых, средств продолжаются, но пока что нет единого удобного инструмента или формата.
- Для внутреннего представления универсально хорош и правилен XML,
- для вывода в сети — сейчас и в обозримом будущем будет (X)HTML,
- для печати — PDF, MSO Word, OOO Writer, графика, и т. п.,
- для передачи информации между пользователями (потребителями, конечными пользователями)
- в неизменном виде — PDF,
- а в редактируемом виде — wiki, plain text, MSO Word, OOO Writer, HTML, XML*,
и т. п.
Отдельный вопрос — работа с библиографией. Форматы BibTeX, специальные библиографические форматы для хранения и протоколы для передачи по сети библиографических данных арзного типа хорошо известны, но работы далеки от благополучного завершения, особенно в России.
Проблема современности — авторские права. Для определённых материалов нужно обеспечить неизменность, защиту прав автора и пользователей. предположительно для этого можно пользоваться ЭЦП, контрольными суммами, шифрованием, документами с встроенной защитой.
Ещё один вопрос — представление формульного материала, особенно сложного, с собственными обозначениями, которые в обычной математической работе в ТеХе выполняются с помощью макросов, иногда весьма сложных. Есть проблемы с переносом этого материала в неТеХовскую печать, интернет-представления. Возможным компромиссом было бы (само)ограничение тем подмножеством, которое поддерживается движком MediaWiki, плюс работы по расширению возможностей этого движка.
Представление данных исследований. Исходные, экспериментальные данные: таблицы, графики, цитаты, пр. Решения могут быть различными, но основной вариант — это XML, а также упрощённые табличные форматы, возможно, на основе XML (с шапкой, содержащей описание документа, и блоком данных без многословной XML-разметки).
Оформление научных работ должно быть выполнено в едином стиле, для чего стоит использовать специально разработанные шаблоны, стили, макросы, пр.
Выход работ должен быть направлен на их немедленное нпосредственное применение, в том числе в дальнейших публикациях, а также в производстве, то есть должен быть оформлен в соответствии с обязательными и рекомендательными российскими и международными стандартами. До сих пор в этом направлении сильные провалы, таких стилей, вообще говоря, нет. Несомненно, все государственные стандарты должны быть открыты, бесплатны, представлены в удобных переносимых форматах. На их основе с учётом современных технических возможностей должны быть разработаны преобразователи между форматами с обеспечением соответствия стандартам.
Важнейшая часть гипертекста — установление ссылок между единицами (блоками) текста. В общем случае сслыки (связи) могут быть различного типа, да и сами информационные единицы могут быть не только простыми текстовыми, но иметь структурную и стилевую разметку (оформление, в том числе цвет, шрифтовые и нешрифтовые выделения, в том числе отчерки, примечания на полях, внизу страницы, в конце главы (раздела), в конце документа, пр., автоматически формируемые индексы (справочники, алфавитные и т. п. указатели), и многое другое), графическими изображениями (различного типа), структурными и т. п. диаграммами, видео, звуком, и т. п., таким образом, можно говорить о гипермедиа.
Здесь нужно иметь в виду, что, как правило, современные документы — это согласованные системы из многих вложенных документов, и их преобразования также должны быть согласованными.
Многоязычность создаёт свои проблемы. Нужно найти средства для параллелизации языковых представлений, частичного автоперевода.
Нужно подумать и реализовать средства для коллективной, в том числе как поочерёдной, так и совместной, интерактивной работы многих участников на гипертекстах.
Мета-представление информации — важная составляющая этого процесса. Сейчас можно использовать такой компромисс. Для первичного ввода и ручного редактирования информации можно использовать упрощённые форматы (типа wiki), а для дальнейшего использования полезно переводить полученную информацию в формат XML, с попутной проверкой и корректировкой, а из него получать документы в остальных форматах.
В любом случае именно гипермедийное представление информации будет главным в современной науке, и нужно работать с ним адекватными средствами.