Проект:Разделы Википедии на региональных языках России/Сортировка

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Сводная таблица алфавитов народов России с указанием на нормативную сортировку и реальную ситуацию, реализованную в MediaWiki/CLDR.

Общая процедура[править код]

Если в вашем языковом разделе есть (или ожидается) проблема с сортировкой в категориях, то для её исправления нужно сделать следующие шаги:

  1. Создать на этой странице раздел для своего языка и описать в нём проблему (по образцу других языков)
  2. Заполнить строчку для своего языка в сводной таблице
  3. Отсканировать свой алфавит с авторитетного академического источника
  4. Поместить ссылку на этот скан и выходные данные источника в своём разделе на этой странице и в сводной таблице проекта
  5. Подать заявку в Фабрикаторе (по образцу башкирских коллег - см. таблицу)

Для исправления сортировки в таблицах ока что применяется половинчатое решение: можно настроить для своего языка специальный параметр в Common.js, вот по . Более общее решение находится в процессе обсуждения (см. также phab:T32674).

Сортировка в аварской Википедии (av)[править код]

Проблема выделения диграфов в самостоятельные подзаголовки
Текущая сортировка не учитывает буквы-диграфы (гъ гь гӏ къ кь кӏ лъ тӏ хъ хь хӏ цӏ чӏ), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы)
Ё должно идти за E
в таблицах сейчас пр прямой сортировке Ё идёт после Е, а вот при обратной - перед Е
в категориях сейчас Ё стоит вначале, перед А.

Сортировка в башкирской Википедии (ba)[править код]

Пишет Рөстәм Нурыев ([1]):

Много лет в Башкирской Википедии была проблема некорректной сортировки по алфавиту. Сортировалось сперва по русскому алфавиту, после по башкирским буквам. Благодаря содействию Олега Абарникова и Амира Ауарони наконец удалось решить эту проблему. Была подана заявка в https://phabricator.wikimedia.org/T162823 и создана специальная сортировка. Как пишет Амир, башкиры первопроходцы:

Всё готово! Я проверил в качестве примера категории "Хәрефтәр" и "Рәсәй субъекттары баш ҡалалары", и кажется, что всё выглядит правильно! Благодарю за терпение, и кроме того, должен вновь отметить, что я очень и очень впечатлён тем, что вы не равнодушны к тому, как работает ваш язык в Википедии. Ваш язык — первый, для которого сделана целая специальная сортировка, так что вы истинные первопроходцы! --Әмир Э. Аһарони (әңгәмә) 13:39, 12 июнь 2017 (UTC)

Тем не менее, в таблицах сейчас сортировка по-прежнему неверная:

  1. при прямой сортировке Ё идёт после Е, а вот при обратной - перед Е
  2. символы Ғ Ҙ Ҡ Ң Ҫ Ү Һ Ә Ө оказываются в конце/начале списка

--Kaganer (обс.) 22:14, 21 июня 2017 (UTC)[ответить]

Я пока что для сортировки в таблицах настроил 'tableSorterCollation'. Это корректно работает для прямой сортировки (от А к Я), но не для обратной. То есть теперь для всех проблемных символов поведение такое же, ка для "Ё". Полумера, конечно, но лучше, чем было. --Kaganer (обс.) 12:56, 26 июня 2017 (UTC)[ответить]

Сортировка в кабардино-черкесской Википедии (kbd)[править код]

Проблема выделения диграфов (а также три- и тетраграфов) в самостоятельные подзаголовки
Текущая сортировка не учитывает буквы-диграфы (а также три- и тетраграфы), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы)
Ё должно идти за E (сейчас после Я)
в таблицах сейчас Ё после Я

Сортировка в осетинской Википедии (os)[править код]

Проблема выделения диграфов в самостоятельные подзаголовки
Текущая сортировка не учитывает буквы-диграфы (дж, дз, къ, хъ и др.), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы)
Ё должно идти за E
Сейчас в таблицах Ё в конце, после Я, а в категориях - наоборот, вначале.
Ӕ должно идти за А
(тут есть ещё проблема предпочтения в употреблении буквы с латинским кодом для Æ; графически они идентичны).

Порядок букв в алфавите описан, например, в грамматике осетинского языка Н. К. Багаева (учебник для вузов), в первом томе на с. 68], также в осетинско-русских словарях. Дело нельзя назвать срочным, в разделе упадок активности, но решать надо. Amikeco (обс.) 20:43, 19 июня 2017 (UTC)[ответить]

Проблему латинской/кириллической графемы Æ нужно решать скриптами: заменять эту букву, если она встречается в слове с кириллицей - либо гаджетом, сразу при сохранении, либо регулярно ботом сканируя весь раздел. --Kaganer (обс.) 18:43, 20 июня 2017 (UTC)[ответить]
У вас там, кстати, кириллическая вообще не используется - ни в статьях, ни в категориях (только в статье об этой самой букве), см. os:Сæрмагонд:РазæфтуантыИндекс/Ӕ. --Kaganer (обс.) 19:31, 20 июня 2017 (UTC)[ответить]
Она мало у кого используется — её только линуксы ставят как «осетинскую» клавиатуру, и так она попадает немножко в интернет. Кажется, где-то в описании уникода было про синонимичные символы — вот бы эту штуку реализовали тоже, а то достала «идеологическая» необходимость пользоваться кодом абсолютно такого же «кириллического» символа, который поддерживается в шрифтах гораздо хуже. Лично я, конечно, борьбе за код, не видя практической пользы, посвящать себя не стану, более того — я против :) Amikeco (обс.) 19:14, 21 июня 2017 (UTC)[ответить]
"Синонимичные символы" - очень нетривиальная штука, очень коварная. Не думаю, что удастся это использовать. --Kaganer (обс.) 21:44, 21 июня 2017 (UTC)[ответить]

Сортировка в Википедии на языке саха (sah)[править код]

Проблема выделения диграфов в самостоятельные подзаголовки
Текущая сортировка не учитывает буквы-диграфы (дь, нь), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы.
Ё должно идти за E
Ҕ должно идти за Г
Ҥ должно идти за Н
Ү должно идти за У
Һ должно идти за С
Ө должно идти за О

Сортировка в таблицах при этом сейчас правильная, см. пример

Сортировка в татарской Википедии (tt)[править код]

...

Сортировка в чеченской Википедии (ce)[править код]

Проблема выделения диграфов в самостоятельные подзаголовки
Текущая сортировка не учитывает буквы-диграфы (кх, къ, кӀ, пӀ, тӀ, уь, хь, хӀ, цӀ, чӀ, юь, яь), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы.

Замечание: в связи с проводимой сейчас реформой чеченского языка из алфавита могут исчезнуть 4 буквы и 2 диграфа (ё, щ, я, яь, ю, юь). --Kaganer (обс.) 21:38, 21 июня 2017 (UTC)[ответить]

Сортировка в чувашской Википедии (cv)[править код]

Ё должно идти за E
Сейчас в категориях Ё находится вначале, перед А, а в таблицах - в конце, после Я
Ҫ должно идти за С
Ӑ должно идти за А
Ӗ должно идти за Ё
Ӳ должно идти за У