Обсуждение проекта:Систематизация категорий/Архив/2008

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

Уважаемые коллеги! Перед тем, как начинать правки в категоризации хочу изложить здесь свою позицию, чтобы не быть недопонятым. Итак, используя тезис о транзитивности (см. Википедия:Категоризация#Для подкатегорий) в применении к категориям "Населённые пункты ..." следует все включения категорий нас. пунктов заменить на сами статьи. Пример: в категорию "Населённые пункты Калужской области" должна входить статья Калуга вместо Категория:Калуга. В противном случае оказывается, что, скажем, умерший в Калуге Циолковский автоматически (по существующему дереву категорий) является населённым пунктом, что очевидный нонсенс. Если есть возражения, прошу высказаться. ≈gruzd 11:57, 11 ноября 2008 (UTC)[ответить]

C таким же успехом Циолковский автоматически (по существующему дереву категорий) является 19 сентября и 1935 годом. И никого это не смущает --Butko 14:19, 13 ноября 2008 (UTC)[ответить]
Я аналогичную работу уже делала. Согласно ВП:ПС и круглому столу о категоризации на конференции — это можно и нужно. Львова Анастасия 12:04, 11 ноября 2008 (UTC)[ответить]
Ну и ладушки. ≈gruzd 12:15, 11 ноября 2008 (UTC)[ответить]
Продублирую здесь. Получается, вы хотите коренным образом пересмотреть всю систему категоризации, которая действовала до этого. Это ведь не только населенных пунктов касается, а вообще всего! Я, в общем, не против, только нужна единообразность, и запись в правилах (кстати, Википедия:Категоризация пока правилом не является). А вот этому [1] положению принятых правил это будет противоречить (цитата: "В случае, если существует категория, одноимённая с некоторой статьёй, например Категория:Россия и статья «Россия», то такая статья, как правило, относится только к этой категории (исключение см. ниже): в нашем примере у статьи «Россия» будет единственная категория Категория:Россия."). Сначала надо менять правила... --lite
Этот пересмотр идёт давно, просто неорганизованно пока. Нашли неединообразность — привели к ней, как то сделано было уже с языками по странам, народами по странам, и т. д. Опять же, правила по категоризации — не приняты, приняты к использованию лишь общие принципы, одним из которых является транзитивность. Львова Анастасия 13:16, 11 ноября 2008 (UTC)[ответить]
Википедия:правила и указания являются правилами! Они приняты, и там насчет таких случаев прописано четко. --lite 09:58, 12 ноября 2008 (UTC)[ответить]
Нет никакого коренного пересмотра. Я процитирую:

Иногда кроме основных категорий есть вспомогательные, так, для городов вспомогательная категория — Категория:Переименованные города, а для людей — категории по годам и датам рождения и смерти. Принадлежность к таким категориям лучше устанавливать не в одноимённой со статьёй категории, а в самой статье,...

Мы имеем как раз описанный случай: в данном случае вспомогательная категория - "нас. пункты такой-то области". ≈gruzd 13:34, 11 ноября 2008 (UTC)[ответить]
Почему вспомогательная? Мне кажется, что не вспомогательная. А категория "Города России" точно не вспомогательная - исходя из примера, приведенного в правилах и указаниях - "например Категория:Страны, Категория:Содружество Независимых Государств, Категория:Республики, должны включать в себя не статью «Россия», а категорию Категория:Россия." --lite 09:58, 12 ноября 2008 (UTC)[ответить]
Пожалуй, не соглашусь. Мы не говорим же, что Цилоковский яаляется «городом» (Калугой) или «городом России» (куда так или иначе входит Калуга), почему же говорим что он является населенным пунктом?--Gosh 15:04, 11 ноября 2008 (UTC)[ответить]
Ну так а я о чём! Категории не должны помещать Циолковского в подобные категории: ни в города, ни в нас. пункты. ≈gruzd 15:21, 11 ноября 2008 (UTC)[ответить]
А я наоборот. Должны. :). Иначе как вообще категоризовать персоналии?--Gosh 15:43, 11 ноября 2008 (UTC)[ответить]
Персоналии все остаются категоризованными: Категория:Персоналии:Калуга. Не понимаю, в чём вопрос? ≈gruzd 15:52, 11 ноября 2008 (UTC)[ответить]
Не сочтите за дерзость, просто довожу до обсурда :). Если, по Вашей логике из начального абзаца, Циолковский становится населённым пунктом, то аналогично "Персоналии:Калуга" становятся Калугой. Ошибка рассуждения считаю в том, что категоризация (приписывание некоторых свойств, в данном случае "Калужность", "Пунктность") неявно заменилась тождеством. На истинность/неистинность выводов это не влияет (все персоналии так или иначе как-то связаны с населенными пунктами). --Gosh 16:06, 11 ноября 2008 (UTC)[ответить]
У вас какие-то конкретные предложения или просто нравится доводить до абсурда? ≈gruzd 16:28, 11 ноября 2008 (UTC)[ответить]
Тема меня интересует. Столкивался с подобным, в частности, в при работе с подкатегориями категории "Лауреаты". Подумаю денёк. Существенна нижеследующая ссылка на предложения--Gosh 16:34, 11 ноября 2008 (UTC)[ответить]
  • Дерева категорий избежать не удастся.

«оказывается, что, скажем, умерший в Калуге Циолковский автоматически (по существующему дереву категорий) является населённым пунктом, что очевидный нонсенс»

Категория Учёные России всё равно попадёт в Россия и по вышеприведенной логике Циолковский окажется хоть и не городом, но страной (и если продолжать двигаться дальше, то и естественной наукой и обществом и т.п.) --Butko 10:22, 12 ноября 2008 (UTC)[ответить]
Это обсуждалось на круглом столе по категориям. Есть несколько предложений, что делать с этой проблемой глобально, но мне кажется очевидным, что её надо решать, а не отказываться от транзитивности потому, что это сложная задача. Львова Анастасия 10:45, 12 ноября 2008 (UTC)[ответить]
Это проблема с категорией Россия — по моему предложению, нужно включить в Страны саму статью Россия. Koterpillar 10:47, 12 ноября 2008 (UTC)[ответить]
Поддерживаю. И аналогично — по всем странам. Львова Анастасия 10:52, 12 ноября 2008 (UTC)[ответить]
А куда тогда включать категорию «Россия»? Koterpillar 12:48, 12 ноября 2008 (UTC)[ответить]
  • Насколько я понимаю, если исправить «транзитивность» полностью, следуя описанной логике, то у нас появится множество некатегоризированных категорий. Или я не прав? Как можно сделать географическую привязку человека/события не помещая его в географическую категорию? Хотелось бы увидеть весь замысел полностью перед тем как предпринимать такие масштабные изменения. --Butko 12:30, 13 ноября 2008 (UTC)[ответить]
    Такую географическую привязку с соблюдением транзитивности можно сделать категоризацией Всё -> Статьи -> Люди по географическому положению -> (далее). То есть расширением верхней части дерева, что, вообще, хорошо. Да, переделывать нужно будет многое, и делать проще было сходу правильно, но работаем с тем, что есть; сложности не являются поводом не улучшать, не так ли? Львова Анастасия 13:39, 13 ноября 2008 (UTC)[ответить]
    Мне кажется, что наоборот, идёт ухудшение и будет не «дерево», а сплошные «столбы». Т.к. люди по географическому положению будут отдельно от самого «положения», отдельно будут история, культура и т.п., так как это тоже на само «положение». Это приведёт к ухудшению поиска. Лучше отказаться от мысли, что все статьи, к которым можно рекурсивно добраться из категории «города» - это и есть сами города, а понять, что это статьи на разные темы связанные с городами. Тогда всё станет на свои места. Мне не понятно, как можно организовывать категоризацию, чтобы «История России» была в категории «Россия» и при этом не попала рекурсивно ни в одну из географических категорий или не была нарушена какая-нибудь другая «транзитивность». Только в единственном случае, если категория «Россия» будет только подкатегорией категории «Всё» и не будет включена ни в какую другую --Butko 14:00, 13 ноября 2008 (UTC)[ответить]
    Полностью согласен. Известный пример: Если 3 и 4<5, а 5<6, то все они входят в подмножество "<6", но не все они четные как 6, так как четность не более чем одно из свойств числа 6, и к указаноой операции отношения не имеет. Иначе ( вышестоящий пример)если "Цилоковский" входит в "Родившиеся в Калуге", которая входит в "Калуга", которая входит в "Населенный пункт", то "Циолковский" имеет некоторое отношение к "Населенный пункт" (как, собственно все персоналии, включая всех нас :) ), но не более того. Транзитивность, естественно, не нарушена. --Gosh 19:11, 13 ноября 2008 (UTC)[ответить]
    Ваш пример корректен лишь отчасти, поскольку операция "имеет отношение" обладает коммутативностью (Москва "имеет отношение" к Кремлю, Кремль "имеет отношение" у Москве), тогда как для нормального построения дерева необходимо определить операцию частичного порядка (например, операция "объект A «находиться на территории» объекта B" удовлетворяет такому критерию, и позволяет организовать нормальное дерево категорий). ≈gruzd 19:58, 13 ноября 2008 (UTC)[ответить]
    Определить операцию можно, но реальность она отражает слабо, искусственно.--Gosh 15:26, 14 ноября 2008 (UTC)[ответить]

Общий случай[править код]

Давайте попробуем в общем понять, а что нам нужно от категорий? И что они должны собой представлять? (Как уже было сказано) это иерархия по родово-видовому признаку? Или каждая подкатегория - частный случай? Или надкатегория - это нечто объединяющее всё находящееся в ней, общая тема? Вопросы пока смутные, ибо и сам не очень понимаю. infovarius 10:49, 12 ноября 2008 (UTC)[ответить]

Это иерархия, да. От общего к частному. Львова Анастасия 10:52, 12 ноября 2008 (UTC)[ответить]
Мы имеем дело с несколькими принципами категоризации.
1. Поскольку любое территориально-административное образование входит в состав более крупного образования и может содержать несколько более мелких единиц, логично иметь такую же, древовидную, структуру категорий. Пример. Страна Россия состоит из округов и областей, каждая область состоит из городов, прочих населённых пунктов. В городе выделяются районы:
  • Россия
    • Центральный федеральный округ Российской Федерации
      • Воронежская область
        • Воронеж
          • Ленинский район Воронежа
2. Другим принципом может стать группирование объектов по принципу подобия, т.е. имеющих некий общий признак («город», «район», «страна»). Пример. Ленинский район Воронежа вместе с другими входит в состав категории Районы Воронежа.
Группы подобия могут, в свою очередь, выстраиваться в древовидную структуру (города состоят их районов, страна - из населённых пунктов). Пример. Воронеж входит в Города России. Города и другие населённые пункты входят в Населённые пункты России. Далее, населённые пункты разных стран составляют категорию Населённые пункты по странам:
  • Страны
    • Населённые пункты
      • Районы
Замечание. Обратите внимание, что в п.1 названия элементов дерева - имена собственные в ед.ч., а в п.2 все элементы имеют множественное число.
Видимо, в первое дерево должны входить категории, а во второе - статьи. ≈gruzd 10:58, 12 ноября 2008 (UTC)[ответить]
Тот же вопрос: в какую категорию будет входить категория «Районы Воронежа»? «Районы по городам»? Koterpillar 12:49, 12 ноября 2008 (UTC)[ответить]
Вовсе нет, «Районы Воронежа» будут входить в категорию "Воронеж". ≈gruzd 07:08, 13 ноября 2008 (UTC)[ответить]
А сама категория «Воронеж» куда входить будет? --Butko 08:47, 13 ноября 2008 (UTC)[ответить]
А Воронеж - в Категории городов России. ≈gruzd 19:25, 13 ноября 2008 (UTC)[ответить]
В таком случае, те же самые персоналии из Воронежа, следуя вышеописанной логике, будут являться не «населённым пунктом», а «категорией населённого пункта». Просто смена одного названия на другое, а того, что планировалось избежать не избежали. Категории городов России в свою очередь нужно куда-то включать, если включить в Россия, а ту в свою очередь в Страны, то персоналии окажутся «страной». Опять же только географической привязкой дело не ограничивается. Мне кажется, что изначально берётся неверная предпосылка - Butko 20:21, 13 ноября 2008 (UTC)[ответить]
Но ведь насколько удобнее пользоваться общей категорией "города России"...--Gosh 19:39, 13 ноября 2008 (UTC)[ответить]
Рискну заметить, что опрос об "удобстве пользования" ещё никто не проводил, так что это пока лишь ваше личное мнение. И потом, а чем по удобству отличаются города России и Категории городов России? ≈gruzd 20:02, 13 ноября 2008 (UTC)[ответить]

Согласен с Butko. Если следовать транзитивности, то дерево выродится в несколько независимых (почти, т.е. соединяющихся где-то около Всё) "кустиков" и от этого пострадает удобство пользования категориями (точнее - поиска нужных объектов). Поэтому согласен и с Gosh. Думаю, надо принять волевое решение и отказаться от транзитивности (по крайней мере такой, как некоторые участники понимают). Или в качестве отношения частичного порядка выбрать что-то типа "имеет отношение и в чём-то меньше". infovarius 20:48, 13 ноября 2008 (UTC)[ответить]

  • Поддерживаю Butko и infovarius. Вполне возможно, что в теории понятие транзитивности действительно так уж замечательно, однако категории, прежде всего, являются «удобным способом организации и поиска информации». Поэтому подобный вопрос следует вынести на обсуждение сообществом. --ariely 21:33, 13 ноября 2008 (UTC)[ответить]
  • И я, соответственно, поддерживаю Butko. С самого начала у меня сомнения появились насчет всей этой истории. Если делать "транзитивно", может быть, все будет очень красиво, но менее удобно и менее логично --lite 23:24, 13 ноября 2008 (UTC)[ответить]
  • Если будет несколько параллельных деревьев, они будут связаны между собой практически везде статьями. Допустим, я читаю про Циолковского и хочу посмотреть список районов Калужской области. Вместо ЦиолковскийКатегория:Персоналии:Калуга — (вот здесь переход, нарушающий транзитивность) — Категория:КалугаКатегория:Калужская областьКатегория:Районы Калужской области нужно будет пройти так: ЦиолковскийКатегория:Персоналии:Калугастатья КалугаКатегория:Калужская областьКатегория:Районы Калужской области. Удобство не страдает. Я упускаю какой-то ещё пример? Koterpillar 06:20, 14 ноября 2008 (UTC)[ответить]
  • Удобство ещё как страдает. Во-первых, в Вашем примере статья о городе Калуга не может находится в категории Персоналии:Калуга. Во-вторых, даже если это и так, по Вашим словам, требуется, по-крайней мере, дважды грузить промежуточные страницы. Возьмём, в качестве примера, категорию Израиль и город Иерусалим. Статья Израиль в данный момент весит 311 килобайт (!), а Иерусалим - 73 (думаю, что это не предел). По Вашим словам, каждый раз я должен буду ждать, пока они загрузятся. Наконец, я уже не говорю о нетривиальности подобных действий для обычного посетителя Википедии. К слову говоря, я прочитал en:Wikipedia:Categorization#Categories do not form a tree - они в этом не видят никакой проблемы. --ariely 07:33, 14 ноября 2008 (UTC)[ответить]
В категории Персоналии:Калуга будет просто текстом написано: «Это люди, биографии которых связаны с Калугой». Это единственный раз, когда нужно будет грузить страницу статьи. Нетривиальными такие действия назвать нельзя — пользователь уже один раз нажал на ссылку Категория:Персоналии:Калуга, заодно понял, чем категории от статей отличаются. Наконец, в английском правиле написано совсем не про это, а про то, что категории — просто не дерево (транзитивность здесь ни при чём). Koterpillar 08:29, 14 ноября 2008 (UTC)[ответить]
Вообще-то, если есть циклы (как у них), то транзитивности также нет. P.S. Я против того, что для перехода к нужной категории придётся грузить статью. infovarius 15:04, 14 ноября 2008 (UTC)[ответить]

Извините, но все-таки непонятно, какая практическая польза читателю(или редактору) от предлагаемых преобразований? --Gosh 15:23, 14 ноября 2008 (UTC)[ответить]

  • Рассуждая об удобстве перехода по категориям или ссылкам не забывайте, что дело не ограничивается только движком Википедии. Есть ещё другие средства работы с категориями. Например, CategoryIntersect, AutoWikiBrowser, FIST, Suggest articles from interwikis, Articles without interwikis, Missing topics. Все они умеют рекурсивно формировать список по дереву категорий. Они не умеют формировать список, перемещаясь по ссылкам, как предлагается выше. Это очень хорошие инструменты и их использование улучшает поиск по Википедии и работу над определённой тематикой. Если разобщить категории, то этими инструментами нельзя будет пользоваться полноценно --Butko 15:55, 14 ноября 2008 (UTC)[ответить]
Так и сейчас Missing Topics найдёт для той же категории Санкт-Петербург через, скажем, Пушкина ерунду. См. например, Портал:Китай/Красные ссылки, где через категорию об олимпийских играх подключились, кажется, все спортсмены мира. Koterpillar 20:09, 14 ноября 2008 (UTC)[ответить]

Присоединяюсь к тем, кто является противником полной транзитивности. Всего лишь потому, что у нас (людей) нету однозначной и гармоничной системы категоризации всего. Таких систем много. Однако, я хотел бы проконсультироваться с людьми, которые разбираются в движке категорий - можно ли изменить механизм так, чтобы стало возможным ставить уточнение - (статья или категория) включается в (категорию) или (статья или категория) относится к (категории)? С разделением их, например, цветом. (как сыр и en:cheese)?
Carn !? 12:22, 16 ноября 2008 (UTC)[ответить]

Если на уровне движка разделятся отношения «является элементом» и «является частью» — цветом ли, шрифтом — будет полное счастье. Сейчас, имхо, такой возможности в движке нет. Koterpillar 15:06, 16 ноября 2008 (UTC)[ответить]
Нет, я другое имел ввиду. «Является частью или элементом» и «относится к области». Или: «полностью включается в» и «может частично быть включён в». Например: если поэт творил в каком-то городе, то частичка поэта навсегда осталась с этим городом, пока их помнят.
Carn !? 16:59, 16 ноября 2008 (UTC)[ответить]
Такое «относится к области» вообще не является основанием для категоризации, мне кажется. Это именно то спорное отношение, что сейчас присутствует между Персоналии:Москва и Москва. Но если в движке сделают различие между IsA и InstanceOf, то добавить третье — дело нехитрое. Koterpillar 17:20, 16 ноября 2008 (UTC)[ответить]
А, понял о чём вы говорите. Меня смущает что IsA — «является» и InstanceOf — «является объектом данного класса» - почти одно и то же. Москва
Москва IsA Город, InstanceOf Города России, APartOf Россия, со Всемирным наследием вообще непонятнов категорию Всемирное наследие она вообще входить не должна (а должен Московский кремль). Разница в том, что это означает для объекта, входящего в категорию Москва. Из этих трёх можно сказать, что он должен входить лишь в категорию Россия. Koterpillar 18:32, 16 ноября 2008 (UTC)[ответить]
категорию «Города России» можно рассматривать не только как класс, а также как множество городов, тогда она не будут отличаться от категории «Россия». Давайте возьмём другие статьи, чтоб провентелировать как можно больше вариантов включения: например статья свет
  • IsA категория «Электромагнитное излучение» (через категорию «Свет»); (Свет суть излучение)
  • APartOf OR InstanceOf категория «Базовые понятия физики»; Свет есть часть базовых понятий физики
  • PartiallyIsAPartOf категория «Цвет» (Свет порождает Цвет, частично Свет есть Цвет)
  • APartOf OR IsInstanceOf категория «Оптика». Свет - не есть Оптика. Нет отношения IsA. Но Свет - важная часть Оптики. тут в один класс объединяются разнородные объекты.
Чернобыльская авария
Вот, комментируйте, так это или не так, чтоб мы нашли шероховатости.
Carn !? 19:49, 16 ноября 2008 (UTC)[ответить]
Откуда Вы такие имена отношений взяли? Я-то придерживаюсь трёх базовых из Семантическая сеть#Семантические отношения. Koterpillar 06:22, 17 ноября 2008 (UTC)[ответить]
Да ладно! Где там InstanceOf? Если это AKO, то оно только к отношениям «категория ► категория» может относиться. Я думал вам лаконичность англ. языка потребовалась. Я из википедийной практики взял. Сейчас прокомментировал - должно быть понятно.
Carn !? 09:39, 17 ноября 2008 (UTC)[ответить]
Прошу прощения, InstanceOf там называется IsA, а IsA — AKO. Предлагаю IsA не использовать. Koterpillar 10:59, 17 ноября 2008 (UTC)[ответить]
Давайте по-русски говорить ;) Вы так и не прокомментировали мои примеры, предлагаю ответить сразу по выделяемым мною типам отношений в #Примеры отношений с категориями - допишите там, как вы понимаете, хоть по-русски, хоть по английски, что чем является.
Carn !? 15:02, 17 ноября 2008 (UTC)[ответить]
Разделение цветом нам мало чем поможет - учитывая, что для новичков и читателей цветовая дифференциация может показаться непонятной и запутывающей. Добавление технической возможности рассортировывать статьи по двум группам - «является частью или элементом» и «относится к области» маловероятно еще и по той причине, что это потребует каких-то новых элементов редактирования на странице (например, чекбокса с галочкой, как с патрулированием) - дополнительное усложнение логики редактирования с малой практической пользой. ≈gruzd 18:38, 16 ноября 2008 (UTC)[ответить]
Можно завести новое пространство имён: Часть:Москва, Экземпляр:Москва. Но с объяснением всё равно будут будут проблемы. Koterpillar 19:17, 16 ноября 2008 (UTC)[ответить]
Действительно, я даже не подумал об этом! Интересно, например, что уже сейчас некоторые задачи могут решать такие категории, как категория «Города:Все». Мне кажется реальным следующий план действий: нужно определиться со всеми типами связей «статья ► категория» и «категория ► категория» и выработать рекомендации по тому, как эти связи отражать в существующих технических условиях. В процессе использования данных рекомендаций можно набрать уже материал для составления правил.
Carn !? 19:58, 16 ноября 2008 (UTC)[ответить]
Написать пояснения — и новички разберутся, прочитав правила. По поводу второго - я бы делал это при помощи параметров: [[Категория:Носки| {{{PAGENAME}}}| IsA]]
Carn !? 18:43, 16 ноября 2008 (UTC)[ответить]
Так делать нельзя, потому что сломается сортировка страниц по алфавиту на странице категории. Koterpillar 19:17, 16 ноября 2008 (UTC)[ответить]
Разве? Для статьи Москва это будет выглядеть как [[Категория:Город|Москва|IsA]] мне казалось что именно по выделенной цветом строке она и будет сортироваться.
Carn !? 19:58, 16 ноября 2008 (UTC)[ответить]
Да, Вы правы, так действительно можно. Koterpillar 10:59, 17 ноября 2008 (UTC)[ответить]

Семантический подход[править код]

  • Сейчас в Википедии есть единственное семантическое отношение — «связан». Иногда его можно уточнить до «является частью», «является экземпляром» или «является видом», но то, что выделено выше как PartiallyIsAPartOf — это именно «связан» и ничего больше. Отношение «связан» не транзитивно, несмотря на неявное предположение CategoryIntersect и MissingTopics. Моё исходное предложение было таким: вычистить все связи, кроме «является экземпляром» для статей и «является частью» и «является видом» для категорий. Однако при этом потерялось бы удобство перехода по отношению «связан». А до тех пор, пока движок не в состоянии будет различать эти четыре отношения, бессмысленно спорить о семантической чистоте включения категории или статьи в родительскую. Koterpillar 10:59, 17 ноября 2008 (UTC)[ответить]
Браво! Выразили то что я не смог.
Carn !? 15:03, 17 ноября 2008 (UTC)[ответить]
Для чего вносить путаницу? Существует теоретико-множественный подход: есть множество, есть его элементы. Есть класс, есть его элементы (множества). Fractaler 14:26, 25 ноября 2008 (UTC)[ответить]

ООП,Теоретико-множественный подход[править код]

По поводу первого обзаца раздела - применяя ООП подход, т.е., когда категория (понятие,термин) = класс (программирование), множество, класс (теория множеств), а статья (смысл/наполнение/расшифровка/раскрытие понятия) = объект (программирование), элемент множества (объектом может быть другая категория), получаем: в категорию "Населённые пункты Калужской области" должна входить категория Категория:Калуга (т.к. есть такое понятие). Наполнение этого (категория Категория:Калуга) понятия, элемент множества - статья (объект) Калуга. В понятии Категория:Калуга должны быть связанные с ним понятия, напр., - Категория:Знаменитости Калуги (как вариант - Категория:Калужские знаменитости), Категория:Умершие в Калуге. Как наполнение данных понятий, элементом этих множеств и будет статья Циолковский. --Fractaler 09:12, 21 ноября 2008 (UTC)[ответить]

Похоже, в конце концов придём к понятиям ООП - класс (программирование) - категория, объект (программирование) - статья Fractaler 21:11, 16 ноября 2008 (UTC)[ответить]

Слишком узко. Не думаю что можно описать отношения категорий лишь наследованием и агрегацией. см. сверху про то как учёный превращается в город при таком програмистском подходе
Carn !? 21:39, 16 ноября 2008 (UTC)[ответить]
Это не ООП, это Семантическая сеть#Семантические отношения. Koterpillar 06:22, 17 ноября 2008 (UTC)[ответить]
  • ООП - имеется в виду не приемы для избегания переписывания исходника (т.к. пакетом уже пользуются), а реализация в понятии объект (программирование) его данных и методов их обработки. Пока из таких методов объекта Википедия есть только метод поиска. Элементарного вывести оглавление других ссылочных страниц на текущей странице (в Java - аналог - функция getClass - список методов объекта) отсутствует. У нас стоит задача не описать отношения категорий, а решить проблему создания (группировки) классификации, как я понимаю. Гёдель давно предупреждал, что как, ребята не содитесь, все равно выше головы не пригнешь - при категоризация, т.е., в 1мерной системе, выйти за её ограничения ну никак не получится. В математике (логике) тоже долго пытались эти брадобрейные проблемы решить. Пришлось вводить понятия из другой системы отсчёта - классы (как в программировании). В ВП уже есть кое-какой инструмент следующеё размерности - шаблоны и порталы, но они не доделаны (нет автоматического подхвата-включений, как для категорий). Поэтому, здесь будет та же проблема,как с расчёсыванием сферы - как не причеши, место столкновений двух воздушных масс (ураганов-потоков-векторов) всегда будет. Т.о., в пределах категорий бесполезно решать поставленную задачу. Примерно разрулить, конечно, можно, но не решить. На форуме спрашивал, будут ли хоть какие-то расширения возможностей ВП для работы с шаблонами, списками, категориями, списками (типа DynamicPageList), пока не ответили.
Шаблоны и порталы — просто другой тип связей между страницами. Никакой «следующей размерности» я в них не вижу. Koterpillar 10:59, 17 ноября 2008 (UTC)[ответить]
Попробуйте при помощи категориального дерева (1D) организовать граф другого типа (>1D). При помощи шаблона (таблицы) 2D реализация понятия, попадающего в 2 разные категории уже возможно. Для последующих размерностей придётся вводить шаблоны размерности более 2D (типа многомерный многоугольник). Fractaler 17:36, 18 ноября 2008 (UTC)[ответить]
Категории образуют ациклический граф, а не дерево. Приведите, пожалуйста, пример такого 2D(?)-шаблона, кажется, я не понимаю, что это такое. Koterpillar 10:37, 19 ноября 2008 (UTC)[ответить]
Речь идёт о связанных категориях, а не о лесных массивах, которые ждут своей очереди. По поводу ХD шаблонов - когда понятие находится в нескольких (многомерных) понятийных простанствах (системах отсчёта, множествах), тогда и не нет возможности реализовать это (т.к. получается сетевая структура, множественность связей) в виде существующих шаблонов (небольшая размерность). Думаю, с течением времени в ВП, всё-таки, постепенно будут даны формальные определения абстрактных понятий (типа Время, событие, [[множество], расстояние, Система отсчёта и т.п.), на основе которых можно будет понизить размерность существующих понятий и сделать единое дерево. Fractaler 14:53, 25 ноября 2008 (UTC)[ответить]
  • Семантическая сеть#Семантические отношения - модель, реализованная в ООП. Существуют примеры, Семантическая сеть#семантических отношений, которые нельзя реализовать в ООП? Fractaler 07:58, 17 ноября 2008 (UTC)[ответить]
    • Есть пример. В начале этой дискуссии. Который ни тем, ни тем не реализуется. Учёный всю жизнь жил в городе. Он - персона этого города. Персоны этого города принадлежат этому городу. Но при этом сам учёный как объект не должен наследоваться или агрегироваться с категорией "Города" (хотя он городской учёный - он - не город, а лишь малая его часть). Вы вот много букв написали, а примеров не привели. Давайте обсуждать на примерах, чтобы было чётко понятно, где какое отношение, а то может я не рассекаю чего-то важного. А мы должны друг друга понять, так как вместе мы можем сделать больше и лучше, чем по-отдельности.
      Carn !? 09:39, 17 ноября 2008 (UTC)[ответить]
При введении категории Знаменитости города Х идет попадание в категорию Знаменитости, ни наследований, ни агрегирования с категорией "Города" нет. Fractaler 17:36, 18 ноября 2008 (UTC)[ответить]
Вы хотите сказать что категория "Знаменитости города Х" не связывается с категорией "Город Х"?
Carn !? 19:30, 19 ноября 2008 (UTC)[ответить]
Да, понятие Знаменитость (чего-либо) - это существительное и дополнение. Делать дополнение как категорию, думаю, и приводит к недоразумениям типа попадания учёного в категорию город. Для связи со своим городом ,конечно, должна быть ссылка, но не относящая учёного в города, а помогающая перейти к городу учёного. Fractaler 23:38, 19 ноября 2008 (UTC)[ответить]
Давайте уже примем как данность, что такое включение (знаменитости города Х в категорию город Х) будет оставаться.
Carn !? 09:49, 20 ноября 2008 (UTC)[ответить]
Понятие (статья, элемент множества) Учёный города Х попадает в категории (множества) Знаменитости города Х и Знаменитости. Элемент Знаменитости города Х попадает во множества Города и Знаменитости. А проблема в чём? Fractaler 23:10, 20 ноября 2008 (UTC)[ответить]
Есть простой пример: A InstanceOf B, B InstanceOf C, C InstanceOf D. Если AKindOf — наследование, то C — уже конкретный экземпляр класса D, а что делать с A и B? Koterpillar 10:59, 17 ноября 2008 (UTC)[ответить]
Экземпляр=статья или подкатегория? Если я правильно перевёл на язык категорий, КатегорияА входит в КатегорияВ, та - в КатегорияС, та - в КатегорияD, то что делать статье/подкатегории в КатегорияА и КатегорияВ, если есть статья/подкатегория в КатегорияD? Fractaler 17:36, 18 ноября 2008 (UTC)[ответить]
Тогда отношение «входит в категорию» не транзитивно: Страны — Россия — Города России — Калуга. Koterpillar 10:37, 19 ноября 2008 (UTC)[ответить]
Конечно, если делать такую иерархию категорий. Можно другой вариант, напр., Калуга - Города России - Населённые пункты Fractaler 23:38, 19 ноября 2008 (UTC)[ответить]
То есть это просто если какой-то конкретный объект - то агрегация, а если абстрактный - то наследование? Т.е. конкретная берёза агрегируется со всеми деревьями, а абстрактно любая берёза наследует свойства класса деревьев - например горит?
Carn !? 15:08, 17 ноября 2008 (UTC)[ответить]
См. пример с городами выше. «У каждой страны есть президент» — «У Калуги есть президент». Koterpillar 10:37, 19 ноября 2008 (UTC)[ответить]
Всё зависит от выбранной надкатегории. Fractaler 23:38, 19 ноября 2008 (UTC)[ответить]

Тут, наверно, нужно учитывать использование модели дерева и сети. Дерево категориями можно реализовать. Сеть - следующими по размерности типами данных Википедии - шаблон (пересечение понятий 2-х разных категорий), портал и др. Только всё равно сетевая структура, думаю будет временной, т.к. (судя по эволюции биоматерии) при нахождении подходящей абстракции она превращается в дерево. Fractaler

С пересечением категорий всё в порядке, когда точно ясно, какого типа связь имеется в виду (Родившиеся в Москве + Родившиеся 17 сентября — Родившиеся в Москве 17 сентября не вносит никаких проблем, кроме абсурдности). Koterpillar 10:37, 19 ноября 2008 (UTC)[ответить]
Объединять нужно по общим критериям Fractaler 23:38, 19 ноября 2008 (UTC)[ответить]

Ненаучный подход[править код]

Почитал предложения, рискну дополнить. Лично у меня несколько иной подход к категоризации, который можно было бы назвать "ненаучным" или, например, "интуитивным" - просто стараюсь, чтобы статьи и категории помещались в максимально необходимый и минимально достаточный набор родительских категорий. Система категорий как направленный граф отношений между объектами без различия семантики этих отношений конечно неидеальна. Было бы здорово, если бы существовала возможность указывать типы отношений, но сейчас её нет, и я против того, чтобы ради транзитивности удалять важные связи. MaxiMaxiMax 12:43, 17 ноября 2008 (UTC)[ответить]

Частные случаи[править код]

В правилах есть пункт о том, что второстепенные категории всё же не должны замещать статью в родительских. Предлагаю выработать список правил, описывающих, какие категории являются для статей второстепенными. Например: географическая категория для события, которое в ней имело место — второстепенна. Koterpillar 20:15, 14 ноября 2008 (UTC)[ответить]

Да, это было бы полезно. ≈gruzd 20:48, 14 ноября 2008 (UTC)[ответить]
Я не очень понимаю "второстепенности" категорий. Правильно ли я понимаю, что в "первостепенную" категорию статья включается (является её частью), а к "второстепенной" просто относится (как наркоторговля к наркотикам)? — Эта реплика добавлена участником Carn (ов) 12:27, 16 ноября 2008 (UTC)[ответить]
См. ВП:ПУ#Категории статей. Семантика тут, на мой взгляд, такая: категория-одноимённая-со-статьёй является частью основной родительской категории, но только входит во второстепенные или относится к ним. Koterpillar 15:13, 16 ноября 2008 (UTC)[ответить]
Нигде там в тексте не нашёл даже части слова - "второстепен". Просьба определиться с терминами, а то мы никогда не поймём друг друга.
Carn !? 09:42, 17 ноября 2008 (UTC)[ответить]
«Вспомогательные». Koterpillar 11:12, 17 ноября 2008 (UTC)[ответить]
Нужно чёткое определение. "Второстепенная категория - это категория, которая ...". ≈gruzd 11:31, 17 ноября 2008 (UTC)[ответить]
Так я и предлагаю его ввести, но не знаю, как сделать определение достаточно общим. Частное предложение см. выше. Koterpillar 10:38, 19 ноября 2008 (UTC)[ответить]

Примеры отношений с категориями[править код]

(в этот раздел можете добавлять качественно новые типы отношений, решений: менять список; а комментируйте ниже)
  1. Статья и одноимённая ей категория (обзорные статьи)
    а) И статья и категория дублируются в родительской категории
    б) Если в родительской категории тесно — статья входит одноимённую, а уже она — в родительскую
  2. Объект статьи и категория, отражающая суть объекта статьи (заяц есть млекопитающее, свет есть ЭМ-излучение)
    Прямое включение в родительскую категорию, или в категорию «Виды …» напр. Виды млекопитающих.
  3. Множество и его подмножество (зайцеобразные — часть множества плацентарных)
    Этот случай похож на предыдущий, только здесь отношение между множествами, а там — между типичными объектами таких множеств.
  4. Объект и множество объектов, в которые он входит (чернобыльская авария — часть множества техногенных аварий)
    Прямое включение в родительскую категорию, или в категорию «:Все», например Категория:Поэты:Все
  5. Объект и неоднородный класс, включающий в себя разнородные объекты (напр наркотики) (свет и оптика)
    Прямое включение в родительскую категорию, при разрастании выделение отдельных подкатегорий, например выделение статьи свет в категорию:Понятия оптики
  6. Отношения между объектом и множеством, когда объект не полностью, а лишь в значительной своей части относится к множеству.
    Самый слабый и всегда присутствующий тип отношений, подразумевающий наличие связи. Общие рекомендации — участвовать в обсуждениях и соблюдать консенсус.

Комментарии[править код]

Зачастую объект(статья или подкатегория) и категория находятся сразу в нескольких типах отношений - в случае с обзорной статьёй это одновременно 1 и 2, в случае с зайцем и млекопитающим - это одновременно 2 и 3, в случае со светом и оптикой - это одновременно 4 и 5. Да, список этот - просто рыба для дальнейшей проработки и правки, правьте смело.
Carn !? 09:58, 17 ноября 2008 (UTC)[ответить]

Думаю в текущем виде можно вставить в редактируемые правила.
Carn !? 16:21, 17 ноября 2008 (UTC)[ответить]
Разделены два разных случая. Koterpillar 10:43, 19 ноября 2008 (UTC)[ответить]
Спасибо
Carn !? 19:28, 19 ноября 2008 (UTC)[ответить]

Цели и задачи[править код]

Коллеги, я хотел бы для начала определиться с тем, какую задачу мы сейчас решаем. Ибо есть две принципиально разные задачи:

  1. Решить «математическую» задачу о том, как должна выглядеть идеальная категоризация всего, чтобы, например, подать запрос разработчикам MediaWiki.
  2. Понять, как можно обеспечить транзитивность (или максимально приблизиться к ней) с использованием существующих технических средств.

Это разные задачи, и я не уверен, что их надо решать совместно. Кстати, второй вопрос на ВК-2008 пытался обсуждаться. Kv75 11:05, 17 ноября 2008 (UTC)[ответить]

Мне кажется, что (2) не решится без потери удобства, поэтому (1), конечно. Koterpillar 11:15, 17 ноября 2008 (UTC)[ответить]
На мой взгляд, (2) частично (или почти полностью) решается двумя механизмами:
  • использованием метакатегорий для объединения однородных объектов и удобства навигации (например, Категория:Россия — Категория:Россия по регионам — Категория:Калужская область, но Категория:Россия — Категория:Регионы России — Калужская область (статья)), это тут уже обсуждалось;
  • использованием ссылок См. также в описании категорий для ссылок на «родственные» категории из параллельных деревьев. Kv75 11:27, 17 ноября 2008 (UTC)[ответить]
  • Неужели вся цель — сделать категоризацию математически правильной, красивой? А зачем и, во вторую очередь, ценой каких потерь? Что это дает читателю? Я, как читатель (а читаю и ищу в Википедии достаточно много), мало интересуюсь тем, что кто-то персоналию перепутает с населенным пунктом. Я и знакомые мне читатели этого не сделают. Такие преобразования имели бы смысл при некторой автоматической обработке категорий (например, при подборе статей на заданную тему), но реально это маловероятно. А путаться, скажем, между "Категория:Категории городов Нижегородской области" и "Категория:Города Нижегородской области" не хотелось бы.--Gosh 16:21, 17 ноября 2008 (UTC)[ответить]
    Действительно, мне ближе цель номер один, даже номер ноль - понять какие основы категоризации примет большинство, и уже исходя из этого делать потихоньку 2 - но без фанатизма, а так, подчищая то, что не ухудшает удобство читателя. (это пока 1 будет длиться - процесс то небыстрый)
    Carn !? 16:33, 17 ноября 2008 (UTC)[ответить]
    Полностью согласен с таким подходом. Kv75 16:38, 17 ноября 2008 (UTC)[ответить]

Примеры[править код]

Давайте примеры, над которыми надо подумать, складывать сюда (а обсуждать в других разделах)? infovarius 14:13, 17 ноября 2008 (UTC)[ответить]

Это для посмеяться или для починить?
Carn !? 16:19, 17 ноября 2008 (UTC)[ответить]
Предлагать другим в качестве головоломки: как можно логичным образом Рэперов включить в Физику. :) Kv75 16:22, 17 ноября 2008 (UTC)[ответить]
См. #Семантический подход - тут не включение. Можете прокомментировать разные типы связей?
Carn !? 16:26, 17 ноября 2008 (UTC)[ответить]
Я не вполне согласен с такой трактовкой. Отношение «связан», насколько я понимаю по здравому смыслу, симметрично. В случае категорий наблюдается антисимметричность (или, по крайней мере, мы стремимся к ней, чтобы не было направленных циклов длины 2). Kv75 16:37, 17 ноября 2008 (UTC)[ответить]
Если Вася входит в категорию "Безнадёжно любящие Машу парни", то этим он связан с ней? Или сразу в Участники по убеждениям? Как ни крути, а всё-таки много в категоризации wiki от «ключевых слов».
Carn !? 16:53, 17 ноября 2008 (UTC)[ответить]
Слишком длинные цепочки включений не имеет смысла рассматривать, всё равно будет так, что чернила включены в общественные науки, а трущобы в Искусство. Надо разумно ограничивать длину для анализа включений, как правило есть лишь 1-2 спорных включения из всей цепочки. Animist обс. 10:32, 28 марта 2009 (UTC)[ответить]

Из моего опыта проблемы с категоризацией возникают преимущественно из-за недостаточной детализированности категорий и как результат из-за использования слишком общих категорий, таких как Жидкости, Управление, Процессы, Вещества, Звук и множество других. В них находится такой зоопарк статей и категорий, что неудивительно, что возникают очень странные связи. Я пытаюсь вести список таких нежелательных (с моей точки зрения) категорий, если нахожу такую категорию (и силы на кропотливую работу) - раскидываю содержимое по более конкретным категориям. Animist обс. 10:32, 28 марта 2009 (UTC)[ответить]

Абстракции[править код]

Берём к-нибудь абстрактное понятие, которое будет попадать в разные категории. Например, Событие - "то, что имеет место, происходит, наступает в произвольной точке пространства-времени; значительное происшествие, явление или иная деятельность как факт общественной или личной жизни; множество исходов эксперимента" попадает в категорию События, которая имеет надкатегории История, Общество, Время. Получается, они - базовые? Появление общества - событие? А к какой категории отнести - к Общество или Событие? И потом, ама категория Время не определяется событиями - фиксацией начала и конца пройденного расстояния эталоном постоянства скорости во Вселенной (света)? Fractaler 17:57, 18 ноября 2008 (UTC)[ответить]

Нерешённые проблемы категоризации[править код]

Перенесено со страницы Википедия:Форум/Общий.
  1. Нарушение транзитивности
    • Причина — связи «статья ► категория» и «категория ► категория» при всём своём многообразии выражаются одним техническим приёмом.
  2. До сих пор возникают споры по поводу взаимопроникновения деревьев категорий (с разными принципами категоризации).
  3. Не подвергались широкому обсуждению (а потому нераскрыты) темы категоризации перенаправлений и многозначных терминов.
    • Для поиска медицинских препаратов в категориях удобно, когда перенаправление включается в категорию как синоним лекарственного средства. Но при этом они сами не являются равнозначными со статьям объектами и обычно не категоризируются.
  4. Участники расходятся во мнениях — включать ли обзорные статьи типа Свет только в одноимённые категории, или одновременно и в родительские.
  5. и прочее, просьба поучаствовать =)
    Carn !? 20:21, 16 ноября 2008 (UTC)[ответить]
  • Раз уж по теме категоризации. Может кто-нибудь внятно ответит на мой вопрос

У нас предусмотрен единый способ категоризации для журналистов радио и телевидения, а также теле- и радиопрограмм?

И как должны назваться категории? «Журналисты…» не подходит, так как не все работают официально, «Ведущие…» не подходит в тех случаях, когда человек работал на важной должности, но его не показывали, а «Сотрудники…» уж тем более.

В англовики, например, в en:Category:CNN помещают людей, а в en:Category:CNN shows передачи. Хотя бы определиться что во что включать. Категория «Эхо Москвы» с журналистами и подкатегорией «программы Эха» или наоборот (то есть как сейчас, но это противоречит практике англовики)?

-- Искренне Ваш TarzanASG  00:30, 17 ноября 2008 (UTC)[ответить]
Не смотрите на англовики в данном случае. "Сотрудники" - вполне себе хорошее слово. Потрудились вместе - разбежались. (конечно это должно быть упомянуто в статье) "Гости" - тоже хорошее слово, правда в данном случае имеет смысл категоризация, только если в статье написано что-то об этом.
Carn !? 14:40, 17 ноября 2008 (UTC)[ответить]

Где находится определение словосочетания "Систематизация категорий", которое вынесено в заголовок статьи? Т.е., что является предметом разговора, какое понятие? Fractaler 11:09, 11 декабря 2008 (UTC)[ответить]

Систематизация категорий. От того, что слова вместе составили, смысла нового не появилось. Koterpillar 14:40, 11 декабря 2008 (UTC)[ответить]
Т.е., когда объединяем, напр., систематизация+животные=систематизация животных (таксономия) - смыла не прибавилось? Что есть смысл? Когда берём H, O, соединяем и получаем воду - смыл появляется? Fractaler 22:49, 15 июня 2009 (UTC)[ответить]