Проект:Разделы Википедии на региональных языках России/Сортировка
Сводная таблица алфавитов народов России с указанием на нормативную сортировку и реальную ситуацию, реализованную в MediaWiki/CLDR.
Общая процедура[править код]
Если в вашем языковом разделе есть (или ожидается) проблема с сортировкой в категориях, то для её исправления нужно сделать следующие шаги:
- Создать на этой странице раздел для своего языка и описать в нём проблему (по образцу других языков)
- Заполнить строчку для своего языка в сводной таблице
- Отсканировать свой алфавит с авторитетного академического источника
- Поместить ссылку на этот скан и выходные данные источника в своём разделе на этой странице и в сводной таблице проекта
- Подать заявку в Фабрикаторе (по образцу башкирских коллег - см. таблицу)
Для исправления сортировки в таблицах ока что применяется половинчатое решение: можно настроить для своего языка специальный параметр в Common.js, вот по . Более общее решение находится в процессе обсуждения (см. также phab:T32674).
Сортировка в аварской Википедии (av)[править код]
- Проблема выделения диграфов в самостоятельные подзаголовки
- Текущая сортировка не учитывает буквы-диграфы (гъ гь гӏ къ кь кӏ лъ тӏ хъ хь хӏ цӏ чӏ), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы)
- Ё должно идти за E
- в таблицах сейчас пр прямой сортировке Ё идёт после Е, а вот при обратной - перед Е
- в категориях сейчас Ё стоит вначале, перед А.
Сортировка в башкирской Википедии (ba)[править код]
Пишет Рөстәм Нурыев ([1]):
Много лет в Башкирской Википедии была проблема некорректной сортировки по алфавиту. Сортировалось сперва по русскому алфавиту, после по башкирским буквам. Благодаря содействию Олега Абарникова и Амира Ауарони наконец удалось решить эту проблему. Была подана заявка в https://phabricator.wikimedia.org/T162823 и создана специальная сортировка. Как пишет Амир, башкиры первопроходцы:
Всё готово! Я проверил в качестве примера категории "Хәрефтәр" и "Рәсәй субъекттары баш ҡалалары", и кажется, что всё выглядит правильно! Благодарю за терпение, и кроме того, должен вновь отметить, что я очень и очень впечатлён тем, что вы не равнодушны к тому, как работает ваш язык в Википедии. Ваш язык — первый, для которого сделана целая специальная сортировка, так что вы истинные первопроходцы! --Әмир Э. Аһарони (әңгәмә) 13:39, 12 июнь 2017 (UTC)
Тем не менее, в таблицах сейчас сортировка по-прежнему неверная:
- при прямой сортировке Ё идёт после Е, а вот при обратной - перед Е
- символы Ғ Ҙ Ҡ Ң Ҫ Ү Һ Ә Ө оказываются в конце/начале списка
--Kaganer (обс.) 22:14, 21 июня 2017 (UTC)
- Я пока что для сортировки в таблицах настроил 'tableSorterCollation'. Это корректно работает для прямой сортировки (от А к Я), но не для обратной. То есть теперь для всех проблемных символов поведение такое же, ка для "Ё". Полумера, конечно, но лучше, чем было. --Kaganer (обс.) 12:56, 26 июня 2017 (UTC)
Сортировка в кабардино-черкесской Википедии (kbd)[править код]
- Проблема выделения диграфов (а также три- и тетраграфов) в самостоятельные подзаголовки
- Текущая сортировка не учитывает буквы-диграфы (а также три- и тетраграфы), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы)
- Ё должно идти за E (сейчас после Я)
- в таблицах сейчас Ё после Я
Сортировка в осетинской Википедии (os)[править код]
- Проблема выделения диграфов в самостоятельные подзаголовки
- Текущая сортировка не учитывает буквы-диграфы (дж, дз, къ, хъ и др.), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы)
- Ё должно идти за E
- Сейчас в таблицах Ё в конце, после Я, а в категориях - наоборот, вначале.
- Ӕ должно идти за А
- (тут есть ещё проблема предпочтения в употреблении буквы с латинским кодом для Æ; графически они идентичны).
Порядок букв в алфавите описан, например, в грамматике осетинского языка Н. К. Багаева (учебник для вузов), в первом томе на с. 68], также в осетинско-русских словарях. Дело нельзя назвать срочным, в разделе упадок активности, но решать надо. Amikeco (обс.) 20:43, 19 июня 2017 (UTC)
- Проблему латинской/кириллической графемы Æ нужно решать скриптами: заменять эту букву, если она встречается в слове с кириллицей - либо гаджетом, сразу при сохранении, либо регулярно ботом сканируя весь раздел. --Kaganer (обс.) 18:43, 20 июня 2017 (UTC)
- У вас там, кстати, кириллическая вообще не используется - ни в статьях, ни в категориях (только в статье об этой самой букве), см. os:Сæрмагонд:РазæфтуантыИндекс/Ӕ. --Kaganer (обс.) 19:31, 20 июня 2017 (UTC)
- Она мало у кого используется — её только линуксы ставят как «осетинскую» клавиатуру, и так она попадает немножко в интернет. Кажется, где-то в описании уникода было про синонимичные символы — вот бы эту штуку реализовали тоже, а то достала «идеологическая» необходимость пользоваться кодом абсолютно такого же «кириллического» символа, который поддерживается в шрифтах гораздо хуже. Лично я, конечно, борьбе за код, не видя практической пользы, посвящать себя не стану, более того — я против :) Amikeco (обс.) 19:14, 21 июня 2017 (UTC)
- "Синонимичные символы" - очень нетривиальная штука, очень коварная. Не думаю, что удастся это использовать. --Kaganer (обс.) 21:44, 21 июня 2017 (UTC)
- Она мало у кого используется — её только линуксы ставят как «осетинскую» клавиатуру, и так она попадает немножко в интернет. Кажется, где-то в описании уникода было про синонимичные символы — вот бы эту штуку реализовали тоже, а то достала «идеологическая» необходимость пользоваться кодом абсолютно такого же «кириллического» символа, который поддерживается в шрифтах гораздо хуже. Лично я, конечно, борьбе за код, не видя практической пользы, посвящать себя не стану, более того — я против :) Amikeco (обс.) 19:14, 21 июня 2017 (UTC)
Сортировка в Википедии на языке саха (sah)[править код]
- Проблема выделения диграфов в самостоятельные подзаголовки
- Текущая сортировка не учитывает буквы-диграфы (дь, нь), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы.
- Ё должно идти за E
- Ҕ должно идти за Г
- Ҥ должно идти за Н
- Ү должно идти за У
- Һ должно идти за С
- Ө должно идти за О
Сортировка в таблицах при этом сейчас правильная, см. пример
Сортировка в татарской Википедии (tt)[править код]
...
Сортировка в чеченской Википедии (ce)[править код]
- Проблема выделения диграфов в самостоятельные подзаголовки
- Текущая сортировка не учитывает буквы-диграфы (кх, къ, кӀ, пӀ, тӀ, уь, хь, хӀ, цӀ, чӀ, юь, яь), которые должны выноситься отдельно в подзаголовки. Это можно делать кое-где навигационным шаблоном, но не в автоматических списках внутри категорий; собственно в сортировке с ними нет проблемы.
Замечание: в связи с проводимой сейчас реформой чеченского языка из алфавита могут исчезнуть 4 буквы и 2 диграфа (ё, щ, я, яь, ю, юь). --Kaganer (обс.) 21:38, 21 июня 2017 (UTC)