Для того чтобы воспользоваться данной функцией,
необходимо войти или зарегистрироваться.

Закрыть

Войти или зарегистрироваться

Логин:
Пароль:
Забыли свой пароль?
Войти как пользователь:
Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:

Автор: Полозов Андрей Анатольевич

Глава 1. Рейтинг вчера

У каждой истории есть своя предыстория. Проблема рейтинга существовала всегда в спорте и всегда имела какое-то решение. Если посмотреть на эти решения внимательно, то можно найти много аналогичных вариантов интерпретации спортивных результатов. Однако при общем сходстве построения шкалы рейтинга различий намного больше. Нет ни одной классификации, в которой были бы даны ответы на все поставленные вопросы. Главное, что нам следует извлечь из прошлого, — это ключевые проблемы рейтинга, принципы его работы. Дописать под выявленные принципы формулы сможет любой студент. Поэтому самой трудной частью исследования было сравнение разных подходов и выявление различий.


1.1. Предыстория вопроса

Проблема рейтинга, несомненно, является первой, с которой сталкивается любой тренер, преподаватель, специалист. Как интерпретировать полученные результаты? Как прогнозировать, исходя из них, дальнейшие успехи? На эти вопросы должен пытаться ответить любой специалист. Поэтому предпринимается очень большое количество попыток освоить данную проблему. С одной стороны, не существует более часто используемого слова, чем «рейтинг», а с другой — множество работ по этой тематике пока не привело всю совокупность мнений к единому знаменателю в виде универсальной шкалы рейтинга.

Попытки создания подобных систем предпринимались еще в 1930-х гг., но не получили распространения. Нынешняя система шахматных коэффициентов была разработана более 40 лет назад венгерским физиком Арпадом Эло, эмигрировавшим в США и ставшим одним из основателей Американской шахматной федерации в 1939 г. Теоретическая база системы изложена автором в книге «The Rating of Chess players. Past & Present* Arpad E. Elo (Batsford Ltd, London, 1978; second ed. — Arco Publishing, Inc., 1986). Именно эта работа, собственно, открыла тему рейтинга на научной основе. В ней впервые рейтинг имеет обратную связь с результатами игр. А. Эло дал оптимальное решение. В ней предполагается, что соотношение набранных (M) и потерянных (N) очков находится в степенной зависимости от разности в рейтингах соперников. Исходя из полученной разницы, по специальной таблице находят число очков, которые должен набрать данный участник в этом турнире, чтобы подтвердить свой рейтинг. Пересчет осуществляется из сопоставления ожидаемой и полученной разницы результатов, при которой за каждое избыточное или недобранное очко изменяют значение рейтинга на 10 пунктов. Для участия в квалификации, по Эло, необходимо, чтобы две трети участников турнира обладали рейтингами. Достоинства такого способа столь очевидны, а сама система столь удобна, что появилось множество работ, пытающихся улучшить предлагаемое. Недостатки системы Эло:

  1. Неопределенность в отношении задаваемых магических чисел.
  2. Средний рейтинг всех шахматистов, как и 2000 лет назад, был 2200 пунктов, как и сегодня.
  3. Если в результате турнира определить рейтинги участников и потом снова пересчитать результаты по этим же данным заново, то решения обычно не совпадают. Система Эло дает приблизительное решение, а не единственное.

Метод Атари-АТП используется с 1979 г. в профессиональном теннисе. Международная теннисная классификация является сугубо коммерческой. В ней нет математики. По сути дела, речь идет о внедрении системы бонуса как спортивной классификации, используемой обычно в коммерции. Изначально каждый игрок оценивается количеством набранных очков, деленным на число сыгранных им турниров. Эти очки зависят от призового фонда турнира и состава участников. Самый богатый «урожай» собирают в соревнованиях «Большого шлема». Победитель такого турнира получает 750 очков, финалист — 557, полуфиналист — 325, и так далее по нисходящей. Чемпион Кубка Кремля получает 230 очков. Кроме того, теннисист может получить и так называемые бонусы. Обыграв первую ракетку мира, он получит дополнительно 50 очков. За победу над соперниками, имеющими 2—5-й результаты, присуждают 45 очков. А вот за победу над 150—200-м игроком в классификации можно получить только очко. Всякий участник квалификационного турнира, попавший после его окончания в основную сетку, получает одно очко. За победу в классификационном турнире над каждым из первых 150 в классификации соперников ему присуждают еще одно очко. Однако сумма очков по завершении классификационного турнира не может быть больше трех. Премиальные очки в турнире-сателлите начисляются, вне зависимости от категории, только финалистам. Теннисист может играть сколько угодно, но в зачет ему пойдут результаты, показанные в 14 самых удачных для него соревнованиях за последние 52 недели. Очки сохраняются год. Поэтому, когда Е. Кафельников не играл три месяца в начале 1997 г., его рейтинг никак не ухудшился. Отметим систему рейтинга Атари-АТП как попытку «сложить» рейтинг участника по совокупности экспертно определяемых величин компенсаций различных факторов.
 

1.2. Как определяют понятие рейтинга в разных классификациях?


Рейтинг — индивидуальный числовой коэффициент (Эло А., 1963), (Пушков С., 2004. Преферанс).

«Индивидуальный коэффициент (ИК) шахматиста является показателем его практической силы, выраженной в числовой форме» (Шахматы (заочно). Положение*, 2003).
«Рейтинг — условный числовой коэффициент» (Садовский Л.Е., 1986).

Рейтинг — результат в тотальном макротурнире

«Рейтинг — смещенный в область целых положительных чисел результат участника всеобщего гипотетического кругового годичного макротурнира» (Полозов А.А., 1995).

Рейтинг — это сила игры, мастерство

«Рейтинг игрока настольного тенниса (далее — рейтинг) — численное выражение силы игры в настольный теннис (большее значение рейтинга означает более сильную игру в настольный теннис)» (Настольный теннис. Положение, 2003).
«Рейтинг является единой, всероссийской системой оценки мастерства спортсменов-планеристов». (Планерный спорт. Положение, 2003).
«Индивидуальный коэффициент шахматиста является показателем его практической силы, выраженной в числовой форме» (Шахматы. Положение. 2004).
«Рейтинг по ледолазанию устанавливается с целью определения порядка распределения спортсменов России по уровню их мастерства» (Ледолазание. Положение, 2001).
«Вы можете соглашаться со мной или нет, но, по моему мнению, самым большим очарованием для игроков шахматных турниров или соперников в других видах спорта является измерение их игровой силы» (Гликман М., 1998).

Рейтинг — это общественное признание

«Рейтинг — как инструмент оценки одного фигуранта относительно другого — применяется во многих отраслях и направлениях деятельности». (Бахарева Э.Л., 2003).
«Сложный показатель, отражающий прежде всего инвестиционную привлекательность банка через элементы его функциональных операций с умением приносить прибыль для своих учредителей и клиентов — вот что такое сегодняшний рейтинг банковской деятельности» (Букин С.О., 2004).
«Рейтинг... — оценка общественного признания деловой состоятельности» (Малыгин А., 2003).

Рейтинг — это усредненная оценка группы экспертов

«Рейтинг — это термин, происходящий из теории вероятностей и математической статистики. Дословно «рейтинг» (rating) означает «оценка». Что же «оценивает» рейтинг? Во многих сферах человеческой деятельности встречаются величины (признаки, параметры), имеющие предположительно численную природу, но конкретные значения этих величин, однако, не поддаются прямому физическому измерению. Многовековая практика выработала для таких величин так называемые методы экспертных оценок, когда группа лиц — «экспертов» дает заключение о характере распределения величины по некоторой, достаточно условной в большинстве случаев, шкале числовых значений. Примерами могут быть рейтинги популярности политиков, отдельных артистов и творческих коллективов, оценки успеваемости в образовании, оценки спортсменов при выступлении на соревнованиях в таких видах спорта, как художественная и спортивная гимнастика, фигурное катание на коньках, прыжки в воду, фристайл, и т.п. Применяют рейтинги и в некоторых командных видах спорта, например футбольные рейтинги европейских стран или рейтинги ФИФА» (Павлов СВ., 2004).

«Итоговый рейтинг представляет собой общую оценку политического влияния регионального лидера, в равной мере учитывающую все аспекты его влияния. При расчетах сначала определялась средняя для всех экспертов оценка влияния каждого регионального лидера по каждому из трех показателей. Затем для каждого регионального лидера был вычислен итоговый рейтинг, представляющий собой среднее арифметическое для трех указанных выше оценок влияния» (Туровский Р., 2004).

Рейтинг — это доля завоеванного информационного пространства

Рейтинг ТВ-программы — это процентное отношение аудитории данной программы к общей численности телевизионной аудитории в данный момент времени.

Рейтинг — это количество затраченного труда

«Рейтинг (в переводе с англ. — оценка, разряд, номинальное значение какого-либо параметра) представляет собой кумулятивный показатель поэтапной объективной оценки знаний студентов. Рейтинг определяет качество учебной работы студента по всем дисциплинам, считая их равноправными по значимости при подготовке специалиста в соответствии с образовательно-профессиональной программой и квалификационной».

Рейтинг — это стимул

«В основу Р-Рейтинга положен принцип: «Не фиксировать успехи или неудачи команд в прошедших соревнованиях, а стимулировать повышение класса команд в текущих соревнованиях».
В бадминтоне определяется место участника в ранг-листе «для оказания содействия организаторам соревнований при составлении таблиц, проведении жеребьевок, определении порядка номеров в командах, стимулирования спортсменов к участию в соревнованиях и повышению мастерства». (См. гл. 5).

Рейтинг — место, занимаемое спортсменом

«Рейтинг — это расположение спортсменов по ранжиру в соответствии с уровнем показанных спортивных результатов» (Красильников В.В., 1998).
«Рейтинг по ледолазанию устанавливается с целью определения порядка распределения спортсменов России по уровню их мастерства, отдельно на трудность и скорость» (Положение, 2004).
«Рейтинг игрока настольного тенниса (далее — рейтинг) — численное выражение силы игры в настольный теннис. Большее значение рейтинга означает более сильную игру в настольный теннис» (Положение, 2003).
«Рейтинг должен отражать достижения команд не за последние месяц или год, а по крайней мере за несколько лет» (Божков А.В., 2004).

Рейтинг — выявление сильнейших для сборной

«Задачей рейтинга является определение группы сильнейших спортсменов России по итогам соревнований по спортивному ориентированию бегом».

Все вместе

«Рейтинг — это и показатель спортивной формы, и инструмент самооценки, и ориентир в планах повышения спортивного мастерства. С другой стороны, для тренеров и специалистов рейтинг (не только в го, но и в других видах спорта) дает объективный критерий отбора игроков в различные сборные команды, или же кандидатов на поездку на престижные турниры. Для организаторов турниров рейтинг помогает правильно сформировать начальные группы по силе игры, проводить жеребьевку в турнирах и вообще — создать максимально равные условия выступления для всех участников, тем самым повышая качество судейства и организации турниров в целом. Ну и еще рейтинг помогает всем — и специалистам, и участникам, и зрителям — прогнозировать результаты выступления игроков в соревнованиях» (Павлов С.В., 2004).
Рейтинг — «внутренний порядок»

«Зачем нужен нам рейтинг? В первую очередь он нам нужен для установления некоторого внутреннего порядка. А порядок всегда устанавливался и поддерживался некоторой авторитарной властью. Таким образом, рейтинг — это в некотором смысле атрибут власти. Очевидно, что игрок А с рейтингом 2398 вряд ли считает, что он играет слабее игрока Б с рейтингом 2403. Но если решением власти какие-либо льготы оканчиваются на цифре 2400 и эта же власть определяет по заранее определенным правилам, что у А рейтинг 2398, а у Б — 2403, то А может только посетовать на удачу, на себя в конце концов, но должен смириться с тем, что так оно и будет. И это все при том, что все — и А, и Б, и власть — понимают, что рейтинг — это вещь довольно-таки неточная и быть абсолютно точной в принципе не может. Но рейтинг-система (РС) даже со всеми ее минусами в сочетании с, еще раз подчеркиваю, авторитарной властью обеспечивает этот порядок». (Корсак В., Го, 2004).

 

ПОДВЕДЕМ ИТОГИ

Определение должно сформировать главный, ключевой смысл слова «рейтинг» и тем самым предопределить направление развития темы. Определение понятия «рейтинг» однозначно должно выводить нас на информационный ориентир и поэтому не должно быть загадочным. Все приведенные определения так или иначе рейтинг характеризуют. Однако большинство из них выглядят капитуляцией перед решением проблемы. Рейтинг не должен быть мнением экспертов. Их спрашивают тогда, когда не знают, как решить проблему. Рейтинг не может быть неким неизвестным индивидуальным числовым коэффициентом. Это не решение проблемы, а бегство от нее. Рейтинг — это, разумеется, общественное признание. Но сначала надо получить рейтинг, а признание будет уже следствием. Аналогично можно сказать и о рейтинге как завоевании некоего информационного поля. Рейтинг может быть стимулом, но для этого его надо как-то определить. Рейтинг не может ни в коей мере представлять собой место, занимаемое спортсменами. Место определяют по рейтингу, но не рейтинг по месту. Рейтинг — некая помощь в подборе состава сборной? Но это ведь тоже следствие. Рейтинг — это «внутренний порядок»? Больше похоже на заклинание. Теперь нужно уточнить, что такое порядок, дать его определение. Все вышеперечисленные представления о рейтинге никак не приближают к разгадке его феномена. А без точного представления о том, что это такое, мы будем тонуть в фантазиях различных авторов. Пожалуй, более приемлемым можно считать мнение о том, что рейтинг — сила игры, мастерство. Однако это определение ничего конструктивного нам не дает. По сути верное, оно не определяет конструктивных особенностей этого самого мастерства. У кого мастерства больше: у того, кто больше забил, или у того, кто меньше пропустил? Определение рейтинга через силу игры, мастерство — это верное направление для дальнейших размышлений, но никак не итог их. Просто некий промежуточный этап.

Определение рейтинга как результата участника тотального макротурнира обобщает все вышеприведенные мнения. Это и сила игры, и признание, и состав сборной, занимаемое место и т.д. В то же время применение слова «макротурнир» дает возможность использовать имеющиеся знания на основе локальных турниров. Поле для дальнейшего творчества остается широким — макротурнир можно себе представлять по-разному. Однако поле поиска возможных вариантов ответа значительно сужается.

 

1.3. Изменение представлений о рейтинге. Виды классификаций

Виды классификаций:

1.  Рейтинг — мнение группы экспертов. Под каждое мероприятие собираются эксперты и «взвешивают» его участников.
«...2. Подсчет индекса цитируемости. Фактически то, что приводим в списках, есть „грязный индекс": полное количество ссылок на работы, где данный человек фигурирует в качестве автора или соавтора» (Штерн Б., 2002).

«Для каждого боксера рейтинговый коэффициент вычисляется как отношение суммы всех побед, одержанных побежденными им противниками, к сумме всех поражений тех же побежденных боксером противников» («Телебокс», 2004).

Коротко охарактеризовать такие классификации можно словами «дядя сказал». Разница только в том, что «дядей» могут быть не только нейтральные судьи, но и реальные оппоненты. Мнение группы экспертов используется там, где алгоритм решения задачи даже не просматривается. Субъективное мнение судей используется в гимнастике, фигурном катании и других видах.

2.  Информационная смесь («куча-мала»-рейтинг). Вся имеющаяся информация об объекте сваливается в одну общую массу, и у кого она окажется больше, тот и будет иметь приоритет. Обычно выбор такой информации и удельных весов конкретных параметров осуществляет группа экспертов.

«Количество очков N, полученных командой за матч, рассчитывается по формуле

N = Mх Pх R+ B,

где: М — количество очков за результат матча (за победу или ничью в гостях — это число со знаком плюс, за проигрыш или ничью дома — это число со знаком минус), P— коэффициент, учитывающий, где игрался матч (дома, в гостях, на нейтральном поле), R— коэффициент, учитывающий разность мячей, B— бонусные очки, учитывающие уровень турнира и раунд (финал, полуфинал, и т.д.)» (Божков А.В., 2004).

«Формула подсчета рейтинговых очков за регату P=RхFxQх х Y, где P— премиальные очки, R— это очки за место в регате. За первое место начисляется 100 очков, за второе — 99 и так далее» (Парусный спорт. Положение, 2003).

Основная проблема таких классификаций — рейтинг не имеет физического смысла и составные ингредиенты нелинейно взаимодействуют между собой, выбрасывая наверх то одних, то других. В 1998 г. Институт истории и статистики ФРГ поставил на первое место среди футбольных клубов испанскую «Барселону», которая в тот год проиграла киевскому «Динамо» (0:3; 0:4), проиграла почти все игры в Лиге чемпионов.

3. Бонусные классификации рейтинга. За каждое занимаемое место в конкурсе начисляются очки, которые в конце года складываются. Так формируется итоговый рейтинг.

В таблице 1 приводится система начисления очков в боулинге (Украина).

Таблица 1
Система начисления очков в боулинге

Женщины Мужчины
Место Очки Место Очки
1 20 1 40
2 19 2 39
3 18 3 38
4 14 4 31
5 13 5 30
6 12 6 29
7 8 7 28
8 7 8 27
9 6 9 26
10 5 10 25
11 4 11 24
12 3 12 23
13 0 13 16
14 0 14 15
15 0 15 14
16 0 16 13

Результаты выступлений скалолазов (Скалолазание. Положение, 2004) оцениваются по таблице 2.

Таблица 2
Система оценки выступлений скалолазов

Место Балл Место Балл Место Балл Место Балл Место Балл Место Балл
1 100 6 47 11 31 16 20 21 10 26 5
2 80 7 43 12 28 17 18 22 9 27 4
3 65 8 40 13 26 18 16 23 8 28 3
4 55 9 37 14 24 19 14 24 7 29 2
5 51 10 34 15 22 20 12 25 6 30 1



Речь идет о трансформации очковой системы в бонусную. Это более дифференцированный подход. Основная его беда в том, что место должно определяться по рейтингу, а здесь наоборот — рейтинг определяется по занимаемому месту. С другой стороны, такие классификации только для узкого круга, элиты. Остальные участники вовсе остаются без рейтинга.

4. Рейтинг как итог формулы успеха. Берутся показатели успешной деятельности и обобщаются в магической формуле. Любой начинающий исследователь всегда держит в голове свой вариант такой формулы. Если вы работаете в вузе, то понимаете, что необходимо публиковаться, защищаться, выступать на конференциях. «Формулы успеха» отличаются от информационной смеси тем, что обычно создаются на математической основе как уравнение множественной регрессии из параметров, коррелирующих с общим успехом. Правда, эти формулы не имеют возможности меняться, и постепенно их эффективность падает.

В российском баскетболе ведется протокол встречи, где фиксируются следующие параметры: набранные очки (с коэффициентом 1), атакующие передачи (1), перехваты (1,4), блок-шоты (1,2), подборы на своем щите (1,2), подборы на чужом щите (1,4), фолы соперников (0,5), число неточных двухочковых бросков (—1), число неточных трехочковых бросков (—1,5), число неточных штрафных бросков (—0,8), потери при передаче (—1,4), потери технические (—1), фолы (—1). В скобках указаны коэффициенты, с которыми учитываются данные параметры в итоговом уравнении. Полученное число делят на проведенное игроком на поле время, оценивая полезность игрока КПИ за каждую минуту пребывания на поле.

«В 1997 г. были апробированы различные подходы (шесть вариантов) по начислению очков в различных возрастных группах и дистанциях. В основе этих шести вариантов лежат два направления. В первом используется формула начисления очков, как и у взрослых в элите (1), с ее корректировкой в сторону уменьшения путем умножения на коэффициент группы (2).

Оуч = 1000 × Кгр ×(2 × Тпоб / Туч — 1),

где Оуч — очки участника; Кгр — коэффициент возрастной группы, равен: К21 — 1, К18 — 0,8, К16 — 0,65, К14 — 0,55, К12 — 0,4.
Во втором направлении было предложено оценивать спортивные результаты в соответствии со скоростью прохождения дистанции (3):

Оуч = Кмест × Кдист ×Дл / Туч,

где Дл — длина дистанции, Туч — результат участника, Кдист — коэффициент дистанции, Кмест — коэффициент местности (Красильников В.В., 2000).

«Формулы успеха» могут работать только в той сфере, где долгое время ничего не меняется, поскольку они не имеют обратной связи с этими изменениями.

5. Последовательный пересчет рейтинга в направлении наибольшего равновесия рейтинга спортсмена и его результатов. Это Элоподобные классификации, в неявном виде использующие решение системы линейных уравнений. Предложение А. Эло, сделанное в 1963 г. через журнал «Chess'slife» представляет собой способ решения системы линейных уравнений методом последовательных приближений или пересчетов. Исследователи рейтинга всегда забывают, что, последовательно выписывая уравнения для участников, они используют систему линейных уравнений, которая может иметь или не иметь решений. Мой коллега, председатель комиссии по рейтингу федерации го С.В. Павлов смог усовершенствовать предложение А. Эло в сторону еще большей сходимости результатов.

«Для пересчета рейтинга используется обобщенная формула Эло:

РК = РКнач + SUM( Ki×(Ri— Pi)),

где Ri— результат i-той партии (1 или 0), Рi — вероятность победы в той же партии, К — коэффициент динамичности для данной партии» (Павлов С.В., 2003).

«Проблема системы Эло, которую исправляет система Глико, — это достоверность рейтинга игрока» (Гликман М., 1998).
Приведем в качестве примера расчета рейтинга так называемый «народный» рейтинг (Потемкин Е.Л., 2004).

«Народный — потому что для его вычисления надо знать только два действия арифметики — сложение и вычитание. Еще и зачеркивать последнюю значащую цифру у рейтинга, чтобы определить ставку на игру. На старте чемпионата все команды имеют по 100 очков. Это их стартовый рейтинг или сила. На каждую игру команды делают ставки в размере одной десятой своей силы.
8  первом туре все рейтинги равны и ставки тоже. От 100 очков рейтинга команда делает ставку в 10 очков. Победитель забирает ставку побежденного. После первого тура все выигравшие команды будут иметь по 110 очков, а все проигравшие — по 90. Во втором туре вчерашние победители ставят уже по 11 очков, а неудачники только по 9. При ничьей команды обмениваются ставками. Например, во втором туре встречаются две команды — победившая и проигравшая в предыдущем туре. Первая имеет рейтинг 110 баллов и делает ставку 11. Рейтинг второй — 90 и ставка всего 9 баллов.

Рассмотрим возможные варианты результатов во втором туре. При победе первой команды она получит ставку проигравшей (9) и ее сила будет оцениваться в 119 баллов (110 + 9). Вторая команда теряет свою ставку, и ее сила после второго поражения будет оцениваться в 81 балл (90 — 9). Если побеждает вторая команда, то рейтинги команд почти выравниваются. Первая команда теряет свою ставку, и ее сила оценивается в 99 баллов (110 — 11). Вторая команда, забирая ставку соперника, оценивается теперь в 101 балл (90 + 11). Команды после двух туров имеют одинаковое количество побед и поражений — по одному и по традиционной очковой системе оценивались бы одинаково по три очка. А народный рейтинг оценивает команду, одержавшую последнюю победу, выше — 101 против 99 у команды, проигравшей последнюю игру. Разница незначительная, но все же больше соответствующая реальной ситуации. Команда, одержавшая победу, испытывает подъем.

В случае ничьей первая команда отдает сопернику свои 11 баллов и получает взамен ставку соперника — 9 баллов. В итоге немного теряет. После ничьей рейтинг первой команды 108 баллов (110 — 11 + 9), а рейтинг второй команды — 92 балла (90 — 9+ 11). Стоит отметить, что при серии ничьих рейтинг команд выравнивается. И это тоже отражает реальную жизнь. Если команда мастеров долго будет играть с победителем районного первенства, то в конце концов их силы выравняются. Но самое главное — ничья становится невыгодной для команды, имеющей более высокий рейтинг. А это если не красный, то хотя бы и не зеленый свет на пути любителей сыграть в ничью.

Таблица 3
Пропорциональный рейтинг футбольного сезона 2003 г.


Фактически занятое место по итогам 2003 г.
Команда В Н П М О «Народный рейтинг»
4 Локомотив 15 7 8 54-33 52 170
1 ЦСКА 17 8 5 56-32 59 157
2 Зенит 16 8 6 48-32 56 153
3 Рубин 15 8 7 44-29 53 146
8 Торпедо 11 10 9 42-38 43 121
5 Шинник 12 11 7 43-34 47 117
6 Динамо 12 10 8 42-29 46 95
7 Сатурн-REN 12 9 9 40-37 45 87
10 Спартак 10 6 14 38-48 36 83
9 Крылья Советов 11 9 10 38-33 42 81
13 Спартак-Ал. 9 4 17 23-43 31 80
11 Ростов 8 10 12 30-42 34 74
14 Торпедо-Мет. 8 5 17 25-39 29 72
12 Ротор 9 5 16 33-44 32 67
15 Уралан 6 10 14 23-47 28 59
16 Черноморец 6 6 18 30-49 24 38


Посмотрим, как завершился бы чемпионат страны по футболу в соответствии с пропорциональным рейтингом в 2003 г. (см. табл. 3). По итогам сезона народный (пропорциональный) рейтинг на первую ступеньку поставил «Локомотив». Это отражает только то, что «Локомотив» играл в последних турах здорово, просто доказывая себе и своим болельщикам, что команда заслуживает большего, чем официальное четвертое место, которое определялось очками. Что же касается армейцев, то они выполнили свою задачу, и просто несправедливо требовать от них игры с полной отдачей после того, как цель достигнута» (Потемкин Е.Л., 2004).

Такого рода классификации стремятся «улучшить», «усовершенствовать формулу А. Эло. В итоге они представляют собой состоящую из заплаток «хижину дяди Тома». Все хотят ремонтировать. А кто будет строить?

6. Рейтинг — результат участника гипотетического глобального хаотичного макротурнира, который определяется через явное решение системы линейных уравнений (далее — СЛУ), где участнику компенсируют все факторы, создающие неравенство условий. Хаотичный макротурнир состоит из множества далеко не всегда взаимосвязанных микротурниров (кубок, регулярный чемпионат, международные турниры). В таких встречах часто одна из команд имеет преимущество. Например, фактор поля. Если вы выступаете в гостях, то ваши результаты объективно хуже. Корректировка таких параметров в итоговой оценке позволяет выявить реальную расстановку сил. Мой коллега, к. ф-м. н. Е.Л. Потемкин приходил к этой системе из релятивистских соображений.

Профессор Гликман, чья классификация используется в рендзю, дает нелинейное решение для макротурнира. Мы долгое время переписывались с г-ном А. Суховым, который является автором рейтинговой классификации в настольном теннисе. Он вместо СЛУ использовал теорию графов. Наши совместные исследования выявили расхождения в решениях в аналогичных ситуациях не более 3—5%. В то же время теорию графов знают от силы 10% населения, тогда как решение СЛУ знают все, кто заканчивал школу.

«Е-Рейтинг требует решения системы линейных уравнений. Отметим, что с решением такой системы нас знакомили в четвертом классе. Полная формула (Потемкин Е. Л., 2004):

Ri ×(Wi ×W + Li ×L) = Sum [Rj ×(Wji ×W + Lji ×L)]

Ai ×(Wi ×L + Li ×W) = Sum [Ai ×(Wji ×L + Lji ×L)]

 Приведенные примеры представляют собой попытку свести задачу к линейной модели. Большое число вариантов составления системы линейных уравнений не привело к наполнению понятия рейтинга конкретным физическим смыслом.

7. Реальный глобальный макротурнир, результаты которого представлены в виде рейтинга. Прообразом такого глобального макротурнира является швейцарская система. В глобальном макротурнире все со всеми в круг играть не могут. Слишком много участников. Тогда нужна модель рейтинга, которая по части результатов макротурнира воспроизвела бы уровень игры (рейтинг) его участников. Из разницы этих рейтингов можно было бы получить результаты всех сыгранных и несыгранных встреч. Разница полученных рейтингов двух участников соответствует результату их личной встречи. Реальный глобальный макротурнир состоится, только если будет обеспечена сходимость предполагаемых и фактических результатов. Если из разности рейтингов следует, что вы обыграете оппонента 2:1, и вы его действительно обыгрываете с этим счетом, то возникает вопрос: зачем было играть? Сходимость позволяет не играть часть встреч макротурнира и благодаря этому сделать его реальным. Предложенная мною рейтинг-формула изложена в главе 3. Она похожа на швейцарскую систему. Однако в ней на следующем этапе между собой встречаются не просто наиболее близкие по силам участники, а происходят парные встречи всех участников двух до этого момента изолированных микротурниров. При этом в командных видах спорта можно посчитать рейтинги всех игроков.

Теперь давайте посмотрим, какие виды классификаций используются в вузе. Здесь представлено сразу несколько классификационных систем. Ученые степени присваиваются решением диссертационных советов — то есть группой экспертов.

Такая классификация отнесена нами к первому уровню. По научной работе отчитываются количеством публикаций, числом дипломников, соискателей и прочее — 2-й уровень. К этому же уровню следует отнести сегодняшний рейтинг вузов. Цитируемость можно отнести к бонусным классификациям третьего уровня, поскольку она зависит, например, от тиража журнала и т.п. Как правило, рейтинги студентов также носят бонусный характер. Выигрыш гранта вполне уместно отнести к классификации на основании формулы успеха (4-й уровень).

 

1.4. Основные противоречия современных классификаций

1.4.1. Что принять в качестве информационной основы рейтинга?

 Соотношение времени прохождения дистанции со временем победителя

«У нас в стране по мужской и женской элите в основе подсчета рейтинга используется формула (1) (предложена тренером Му-рашко А.Н., Минск):

Оуч = 1000 × (2 × Тпоб / Туч — 1),

где Оуч — очки участника по рейтингу, Тпоб — время победителя, Туч — результат участника» (Красильников В.В. Ориентирование, 2004).

Бонусные баллы

В бадминтоне — баллы спортсмена определяются в каждом соревновании, принимаемом к зачету в рейтинг, согласно категории соревнований:
1-я категория — чемпионат России, национальный этап Кубка мира.
2-я категория — этапы Кубка России, субъектов Федерации, города Москвы.
3-я категория — все прочие соревнования, в том числе не указанные в «Календаре».

В теннисе — «количество очков N, полученных теннисистом за турнир, складывается из очков за каждый матч Mи бонусных очков Bза турнир в целом (N= M+ B). Количество бонусных очков Bопределяется уровнем турнира и количеством выигранных в турнире матчей. Количество очков M, получаемых теннисистом за отдельный матч, определяется соотношением рейтингов двух теннисистов, участвующих в матче. За победу над более сильным соперником теннисист получает больше очков, чем за победу над слабым соперником. И наоборот — за проигрыш более сильному сопернику теннисист теряет меньше очков, чем за проигрыш слабому сопернику. За победу в матче количество очков M— это число со знаком плюс, за проигрыш — это число со знаком минус (Божков А.В., 2004).

Занимаемое место

«Отклонение фактически занятого места от ожидаемого ведет к понижению или повышению рейтинга спортсмена» (Чебышев Н. Конный спорт, 2003).

Соотношение побед и поражений в парах участников (Е-рейтинг. Потемкин Е.Л., 2004).

Число набранных очков.

«Методика подсчета КМ-рейтинга не учитывает ни возраст спортсмена, ни показанный им на дистанции результат (время).

Начисленные за дистанцию рейтинговые очки зависят исключительно от количества принявших участие (финишировавших) на данной дистанции спортсменов и занятого самим спортсменом места. При этом за 1-е место начисляется количество очков, равное количеству финишировавших на дистанции спортсменов. За каждое последующее место начисляется на 1 очко меньше. Таким образом, последний спортсмен на дистанции получает 1 очко». (Легкая атлетика. Положение, 2003).

Баланс забитых и пропущенных мячей, шайб, выигранных и проигранных партий, соотношение нанесенных и пропущенных ударов в боксе или фехтовании, других реализованных действий (Полозов А.А., 1994).

 

ПОДВЕДЕМ ИТОГИ

В качестве информационной основы рейтинга разные авторы предлагают использовать множество промежуточных параметров. Что такое набранные очки? Это самая простая система рейтинга. Она состоит из одного арифметического действия. Зачем использовать посредника в виде очков? Ведь тогда на одну систему рейтинга накручивается уже другая система, зависимость становится сложной, нелинейной. Начисление бонусных баллов — это уже тройная «накрутка». Сначала один спортсмен выигрывает у другого. Затем он получает очки. По очкам он получает место. За место дают бонусные очки. Бонусные очки формируют собственно рейтинг. Не намного лучше сложение фактически набранных очков с бонусными. Это ничего не меняет. Занимаемое место не может быть информационной основой рейтинга, поскольку рейтинг должен определять место, а не наоборот. Рейтинг, который определяется по месту, больше похож на больного, вынужденного опираться на костыли. Для того чтобы определить информационную основу рейтинга, необходимо просто заглянуть в правила. Если задачи обеих команд — забивать голы, то именно баланс голов должен быть информационной основой. Если в качестве задачи провозглашается количество нанесенных уколов, сбитых кеглей, время движения по дистанции, количество выполненных приемов и других реализованных действий, то именно их баланс должен быть принят в качестве информационной основы.

 

1.4.2. Масштаб работы шкалы рейтинга: каждое набранное очко, гейм, сет, партия, матч, турнир...

«Победа в круговом турнире MastersCup— 20 очков, выход в финал — 40, победа в финале — 50, не проигравший на турнире ни одного матча — 150 очков» (Теннис, система АТП).

«Классификационные очки начисляются игроку за: 1) занятые места в турнирах РТТ; 2) продемонстрированную в матчах с другими теннисистами силу игры.

При этом на количество начисленных игроку очков влияют показатели силы игры соперников и классификационные номера побежденных теннисистов, категория турнира и состав участников турнира» (Теннис. Положение, 2004).

 

ПОДВЕДЕМ ИТОГИ

Основной тенденцией развития современного спорта является повышение плотности результатов. Желание учесть просто факт победы (как в теннисе) неизбежно ведет к огрублению оценки, потери основной части информации — как выиграл, с каким преимуществом. Есть разница — с каким преимуществом выиграли. За желание работать в упрощенном варианте придется платить большим числом играемых встреч. Чем дальше, тем большее число участников будет располагаться на одном уровне из-за недостаточной дифференцированности результатов. И, чтобы «развести» их по сетке, нужно будет играть больше. То есть, с одной стороны, часть информации сбрасывается при подсчете рейтинга, а с другой стороны, ее нехватка требует все большего числа игр.

 

1.4.3. Какой период соревнований оценивается рейтингом — месяц, год, два, десять лет?

Весь период участия в соревнованиях спортсмена или команды.

«Рейтинг должен отражать достижения команд не за последние год или два, а по крайней мере за несколько лет, чтобы отдельные удачные или неудачные периоды не приводили к резкому перемещению команды в рейтинге, поэтому рейтинг ведется непрерывно начиная с 1950 г., так что сумма очков каждой команды получается добавлением или вычитанием очков, полученных в очередном матче» (Божков А.В., 2004).

«Строится 2 вида рейтинга:

  • текущий рейтинг (чемпионская гонка по итогам текущего года);
  • кумулятивный рейтинг (с учетом текущих рейтингов за прошлые годы)», (Армрестлинг. Положение, 2004).

Неопределенный период, значение которого спрятано в формулу пересчета рейтинга

Инициатором такого направления выступает Арпад Эло (1963). Коэффициент 10 при пороговой разнице в рейтингах 200 косвенно указывает на то, что рейтинг соответствует результатам последних 20 партий. Это значит, что если участник сыграл 40 партий, то в зачет пойдут только последние 20. Если участник сыграл в этом году 10 партий и в прошлом году тоже 10, то его рейтинг соответствует среднему значению за интервал в два года. При этом рейтинги его оппонентов менялись, и вся эта сложная картина наблюдается в колебаниях рейтинга. Таким образом, использование формул, аналогичных А. Эло, неизбежно предполагает свой временной интервал оценки для каждого из участников.

Три года

«Величина рейтинга для спортсмена на текущий год определяется результатами, показанными им во всех зачетных полетах, в которых он участвовал за три предшествующие года». (Планерный спорт. Положение 1997).

Четыре года

«Традиционный волейбольный рейтинг составляется по результатам выступлений команд на крупнейших международных соревнованиях за последние четыре года. Причем количество набранных очков на Олимпиадах и чемпионатах мира ежегодно сокращается на 25%, на соревнованиях, проводимых раз в два года, на 50% и на проводящихся каждый год «Гран-при» и Мировой лиге — на 100%».

52 недели

(Теннис. Положение, 2004).

Один год

«В сумму рейтинга любителя бега включаются очки 6 лучших результатов сезона». (Бег. Положение, 2003).
«Назовем рейтингом смещенный в область целых положительных чисел результат участника всеобщего гипотетического кругового годичного макротурнира» (Полозов А.А., 1995).

 

 ПОДВЕДЕМ ИТОГИ

Спектр мнений чрезвычайно широк — от одного месяца до всего периода спортивных соревнований. Обе крайности неприемлемы. Зачем любителю спорта, посетившему соревнования сегодня, знать итоговый за последние 25 лет результат? Будет ли тренер, выбирающий игрока в команду, руководствоваться его достижениями 10-летней давности? В некоторых случаях подводят результаты за четыре года, имея в виду Олимпийские игры, чемпионаты мира в некоторых видах спорта. В этом вопросе необходимо принять решение, которое бы не исключало возможности получения рейтинговой оценки за любой период. Однако приоритет следует оставить за наиболее устоявшимся периодом оценки. Мы привыкли к тому, что чемпионом страны за такой-то год стал такой-то.

За другой год — кто-то другой. Подавляющее число соревнований во всех странах имеют период их проведения один год. Никогда не приходилось слышать о чемпионах 2001—2003 гг. А вот о чемпионах 2001, 2002 и 2003 гг. приходится слышать постоянно. Нужно уважать сложившиеся в обществе традиции. Для этого периодом работы рейтинга следует признать календарный год или сезон. Тогда из рейтингов за каждый год четырехлетия можно получить средний рейтинг за четыре года. И вообще — можно получить рейтинг за любой период. В то же время рейтинг за период в 1 месяц недостоверен, поскольку невозможно за этот период провести столь масштабные соревнования и оценить соотношение сил. Рейтинг за столь малый период неизбежно будет вынужден опираться на результаты за значительно более долгий срок. Вопрос о выборе периода работы рейтинга — это вопрос уважения к сложившимся в обществе традициям и удобства обобщения рейтинга на любой период противостояния.

 

1.4.4. Какими свойствами должна обладать выбранная для подсчета рейтинга функция?

Непрерывность, монотонность. «Естественно потребовать, чтобы отношение

ajhvekf

в качестве функции f(Ar), оценивающей различие в классе игры спортсменов, удовлетворяло следующим условиям:
  1. f(Δr) > 0 при любых значениях Δr,
  2. f(Δr) монотонно возрастает относительно Δr, т.е. если Δr< Δr, то f(Δr) < f(Δr),
  3. f (0) = 1.

Среди основных элементарных функций этим трем условиям удовлетворяет лишь показательная f(Δr) = aΔr(при некотором а>1)». (Садовский А.Л., Садовский Л.Е., 1989).

Антикоммутативность, ограниченность интервала

«Функция должна:
1.Обладать свойством антикоммутативности:

F(З, П) = F(П, З).

2.Работать в избранном числовом интервале, а не по всей шкале.
3. Не выходить за пределы четырех действий арифметики и обеспечить минимальное число арифметических действий при пересчете рейтинга.
4. Свести к минимуму суммарную разницу между результатами участников в личной встрече и их общими результатами». (Полозов А.А., 1995).

 

ПОДВЕДЕМ ИТОГИ

В разделе затронута тема, по которой мало исследований. Обычный подход — «возьмем такую-то функцию» — представляет собой навязывание первой попавшейся под руку зависимости людьми, не желающими утруждать себя мотивировкой выбора. А между тем со стороны общества есть совершенно определенные пожелания. Если задать вопрос обыкновенному спартаковскому фанату, то какую функцию он бы предпочел? Конечно, речь пойдет о функции, состоящей только из арифметических действий. Никаких логарифмов, тройных интегралов тонкая нервная система фаната не выдержит. Другим, не явно выражаемым требованием будет антикоммутативность. Если победившей команде начисляют за победу не столько же очков, сколько проигравшей, то это уже нелинейная, непонимаемая зависимость, от которой рядовой болельщик откажется. Сам фанат назовет вам массу примеров, когда нет борьбы за результат, и скажет, что такие игры не стоит включать в рейтинг. Это значит, что функция должна действовать в определенном интервале. Но все же главным будет другое требование — сходимость модели. Должна быть уверенность, что разница в рейтингах на личную встречу будет соответствовать разнице в рейтингах в рамках всего проводимого турнира. Иначе к результатам нет доверия. Конечно, такой перевод слов обыкновенного фаната можно было бы считать литературным. Однако нельзя не видеть вполне определенных не высказанных обществом любителей спорта пожеланий и тем более игнорировать их.

 

1.4.5. Необходимое для подсчета рейтинга распределение должно быть задано в виде функции или таблицы значений?

В виде таблицы

(А. Эло, 1963), (Шахматы. Положение, 2003), (Шашки. Положение, 2003), (Студенческий союз дзюдо. Положение, 2003), (Спортивное ориентирование. Положение, 2001).

В виде функции

«Известно несколько вариантов построения шкалы рейтинга, что предполагает множество решений проблемы. Наиболее удобным представляется такое решение, которое можно записать в аналитическом виде (обойтись без табличек), состоящее из минимального числа только арифметических действий при пересчете рейтинга общеизвестным способом» (Полозов А.А., 1999).

«Шахматный статистик наших дней имеет огромное преимущество в виде мощного компьютера и миллионов партий, которые могут служить эмпирическим доказательством его выводов. В то время, когда А. Эло предложил свою таблицу, таких возможностей у него, конечно, не было. В наши дни мы можем проверить точность теории профессора Эло (см. главу 4 — А.П.).

Согласно базе из 266 000 партий за период с 1994 по 2001 г., прямая линия лучше помогает предсказать результат, нежели таблица Эло. Цифры Эло (белая кривая) основаны на теоретических вычислениях. Эта инверсионная экспоненциальная дистрибуция столь сложна, что дать простую формулу для расчета рейтингов просто невозможно. Остается обращаться к специальным таблицам. Мне непонятно, почему все должно быть так сложно. Взгляните на черную линию на графике. Эта прямая линия подкреплена конкретными партиями и более точно описывает ситуацию, нежели кривая Эло. К сожалению, для того чтобы делать выводы о результатах за пределами интервала +/— 400, данных недостаточно, однако в пределы вышеупомянутого интервала укладываются 99% всех официальных партий. У меня существует собственная теория о том, в чем состоит ошибка в вычислениях Эло. Как бы то ни было, одно совершенно очевидно: формула Эло может быть существенно улучшена» (Сонас Д., 2002).
 

ПОДВЕДЕМ ИТОГИ

Подведение итогов с помощью таблицы — свидетельство того, что проблему решить не удалось. Не удалось найти такой простой функции, которая бы обеспечивала выполнение задачи, и в качестве компенсации предлагается таблица. Всегда хочется большего. Всегда хочется иметь возможность, пусть даже с калькулятором, посчитать результат. А для этого хочется иметь только калькулятор, а не калькулятор и таблицу. Все же, учитывая, сколько людей будут пересчитывать рейтинг после одного-единственного результата и сколько таких результатов вообще, желательно довести дело до логического завершения и найти функцию. Все же таблица воспринимается промежуточным, нетехнологичным, а потому временным вариантом.

 

1.4.6. Является ли «нормальным» распределение функции вероятности выигрыша?

Да, является
(Теннис. Положение, 2003).
 
Нет, не является
«А кто-нибудь где-нибудь встречал обоснование (строгое в научном плане), вида функции вероятности?.. Чисто экспоненциальная форма в РС ЕГФ и некоторых других — просто аппроксимация функции распределения нормального закона, т.е. интеграла от e-x2). С другой стороны, и исходная интегральная функция распределения с экспоненциальной плотностью (Гаусс), и ее аппроксимации экспоненциального вида в точке DR=0, соответствующей равным соперникам (вероятность равна 1/2), имеют некоторую первую производную, т.е. тангенс угла наклона графика. Во всех моделях этот наклон почему-то разный: в ЕГФ зависит от уровня игрока, в АГА равен (0,83—0,5)/1 дан, в действующей российской (0,66—0,5)/1 дан.

А вторая производная во всех моделях в этой точке равна нулю, т.е. все эти функции в окрестности точки DR=0 ведут себя как линейные функции от DR, с точностью до членов третьего по DRпорядка. Последние тщательные исследования статистики ЕГФ (108 631 партия!) окончательно опровергли предположение о «нормальности» вида функции вероятности. Кстати, угол наклона, упоминавшийся выше, в российской РС «в среднем» по группе данов соответствует статистике. Это и понятно, так как в 1990 г. конкретные параметры функции вероятности (и значит угол наклона в точке DR=0) были рекомендованы исходя из российской статистики по группе данов (усредненно). Правда, статистика была куда скромнее сегодняшней европейской — всего-то около 400 партий. Но факт остается фактом! Значит, статистические данные в этой группе имеют высокую устойчивость и выявленным по ним закономерностям можно доверять. Итак, нормальная форма для функции вероятности не годится (а жаль!)» (Павлов С.В., 2004).

 

ПОДВЕДЕМ ИТОГИ

Нормальное распределение вероятности победы от разницы в рейтингах было всего лишь исходным предположением создателей первых систем классификаций. Они никак, никогда и нигде не обосновывали и не доказывали это. Они это просто предполагали. Однако исследователи в этой области не могли не знать, что существует такой уровень противостояния, когда нет борьбы за результат. Когда для одного участника не проблема прибавить в любой момент и выиграть у другого. Нормальное распределение полагает, что сборная детского сада когда-нибудь, но все-таки выиграет у сборной страны. С моей точки зрения, невозможно определить разницу в рейтингах, если одна команда не в состоянии забить другой. Когда счет растет (1:0, 2:0, 3:0 и т.д.) и когда итоговый счет все равно будет заканчиваться на ноль, то реально определить дистанцию между играющими невозможно. Разница в рейтингах в 1000 пунктов делает противостояние нереальным. Оно превращает встречу в баловство. Если один из соперников не может забить или выиграть у другого, то принципиально невозможно отличить разницу между ними в 1500 и 2500. Она просто не поддается оценке. Для оценки взаимоположения таких участников используются третьи оппоненты, для которых реально побороться за результат и с первыми, и со вторыми.

 

1.4.7. Какое минимальное число игр должен сыграть участник для получения рейтинга?

Число игр не задано, но за пропуски соревнований штрафуют «Рейтинг игрока, не участвующего в турнирах в течение продолжительного времени (пока оговаривается 5—7 турниров), усредняется с рейтингом 2200» (Пушков С., 2003).

«В случае если спортсмен не принимает участия в обсчитываемых соревнованиях в течение года, его рейтинг ежедневно уменьшается на 1. Именно это, «оштрафованное» значение используется во всех целях» (Настольный теннис. Пояснение к положению. 2004).

Зависит от числа участников официальных соревнований Минимальное число игр определяется из соображений по организации глобального макротурнира и находится в зависимости от числа участников макротурнира. Число два в степени числа игр данного участника должно быть равно общему их числу в макротурнире (Полозов А.А., 2004).
 

ПОДВЕДЕМ ИТОГИ

В подавляющем числе классификаций вопрос не обсуждается. В оставшейся части классификаций предлагается штрафовать тех, кто уклоняется от соревнований. При этом действия авторов носят скорее инквизиционный характер. Если есть определенный уровень игры, который следует из официальных результатов, то как можно так вольно, по чисто политическим мотивам его понижать? В результате спортсмен окажется ниже тех, кого он обыгрывал, и только из-за того, что пропустил несколько соревнований. Безусловно, это вольность административной власти в виде спорта, которая никем никогда не будет поддержана. Если они пойдут дальше и будут кому-то понижать, а кому-то повышать рейтинг, то рано или поздно встанет вопрос о замене такой администрации, ассоциирующей себя с божественным образом. Приходилось слышать предложения о том, что за избыточную активность нужно поощрять спортсмена. В таком подходе путается между собой уровень игры и активность спортсмена. Вопрос может стоять так: либо допускать в список рейтинга участника, либо не допускать из-за недостаточности его официальных результатов. И уж если он допущен, то никто не вправе произвольно корректировать его уровень. Если не допущен, то его результаты с другими допущенными участниками обнуляются. В этой ситуации к спортсмену относятся уважительно, заранее поставив его в известность о пороговом уровне активности. Но этот порог явно будет зависеть от общего числа участников. Если участников всего двое, то одного официального результата может быть достаточно. А вот если их миллион, то порог неизбежно сдвигается вверх.

 

1.4.8. Равны ли между собой прирост рейтинга одного соперника и убыль рейтинга другого?

Да, равны

(Шахматы. Положение, 2004.), (Потемкин Е.Л., 2004), (Полозов А.А., 1994).

Нет, не равны

«Обратите внимание, что в системе Глико изменения в рейтинге не столь сбалансированы, как это есть в системе Эло. Если рейтинг одного игрока возрос на xочков, то совсем не обязательно, что рейтинг его соперника уменьшится на те же xочков. Фактически в системе Глико количество очков, на которое уменьшится рейтинг соперника, регулируется значениями RD("рейтинговое отклонение") обоих игроков» (Гликман М., 1998).

Новый рейтинг игрока определяется как предыдущий рейтинг, измененный на сумму приращений рейтинга с учетом коэффициента значимости соревнований (КЗС). Приращения рейтинга определяются по итогам встречи в случае, если у победителя рейтинг не больше, чем у побежденного, на 99. В этом случае разница в рейтинге отнимается от 100 и все это делится на 10. Это и будет приращение рейтинга у победителя. У побежденного приращение будет отрицательным и в 2 раза меньше» (Настольный теннис. Положение, 2004).

«За победу над более сильным соперником команда получает больше очков, чем за абсолютно такую же победу над слабым соперником. И наоборот — за проигрыш более сильному сопернику команда теряет меньше очков, чем за такой же проигрыш слабому сопернику» (Божков А.В., 2004).
 

ПОДВЕДЕМ ИТОГИ

Неадекватность прироста и убыли рейтинга можно понимать как проявление нелинейности модели. Эта нелинейность может преследовать разные цели. В одних случаях авторы пытаются отсечь некоторую долю проходных матчей, где нет борьбы. В других случаях не явно формируется некий потолок рейтинга, который никому не дозволено достичь. В третьих случаях речь идет просто о проявлении нелинейности, на которой построена модель. В четвертых случаях речь идет о степени девальвации прироста рейтинга по линии слабый — сильный спортсмен. Правда, при этом забывают, что если слабому вообще очков не давать, то он никогда не станет сильным. Предположим, что у рядового зрителя есть выбор в подсчете рейтинга по линейной и нелинейной модели. Очевидно, что он выберет линейную модель, где прирост равен убыли рейтинга. Следовательно, все предложения по нелинейным моделям носят временный характер до появления линейной модели. Не могу не процитировать строчку из письма мне автора системы рейтинга на основе теории графов в настольном теннисе г-на Сухова в 1996 г.: «Вы сумели найти для чисто нелинейной задачи вариант линейного решения». Вместе с линейностью отпадут всякие «шалости» авторов классификаций с балансом прирост — убыль.

 

1.4.9. Можно ли рассчитать рейтинги всех участников двух изолированных друг от друга турниров?

Да, возможно

(Рейтинг Р1РЛ/Соса-Со1а, 2003), (Армрестлинг. Положение, 2003), (Го, 2003), (Теннис, 2003), (Студенческий союз дзюдо, 2003).

 

ПОДВЕДЕМ ИТОГИ

Если один турнир проводится на Марсе, а другой — на Венере, то при отсутствии официальных встреч между собой общий список рейтингов создать нельзя. Можно только создать два списка — один на Марсе, другой — на Венере. Обычно создают один список, полагая, что средний уровень подгрупп одинаков. Однако за всю историю футбола FIFAни разу не смогла создать равные по силам группы. Поэтому ее рейтинг никогда не соответствовал итоговым результатам чемпионатов мира. И когда официальные лица выходят из положения, просто присваивая одинаковый средний рейтинг участникам изолированных турниров, я говорю им: «Докажите!» Чем можно доказать равенство? Официальными результатами, которых нет. Тогда давайте объявим участников на Марсе премьер-лигой (все-таки Марс!), а участникам на Венере присвоим статус первой лиги. Поскольку официальных результатов нет, то ни подтвердить, ни опровергнуть оба предположения невозможно. Так как же быть? Нужны официальные матчи. Прототипом такой ситуации являются вполне земные примеры, когда в рамках города, области, страны участники увлечены игрой между собой.

 

1.4.10. Следует ли учитывать в расчетах результаты встреч между собой соперников разного класса?

Да, следует

(Рейтинг FIFA/Соса-Соха, 2003), (Армрестлинг. Положение, 2003).
 

Нет, не следует

«В результате встречи с соперником Приращение Рейтинга определяется:

3.3.1. равным 0 — в случае, когда разница Рейтинга Текущего выигравшего и проигравшего (РТВ-РТП) превышает значение 100» (Настольный теннис. Положение, 2004).
 

ПОДВЕДЕМ ИТОГИ

Вопрос о разнице в рейтингах, при которой не следует учитывать результат встречи, чрезвычайно важен с точки зрения корректности результатов. Всегда найдутся такие команды или спортсмены, во встрече которых счет будет WW:0 в пользу одной из сторон. Если другая сторона не в состоянии забить хотя бы один гол, то борьбы не получится. В этом случае исключение таких результатов означает, что о соотношении сил сторон лучше судить через встречи с третьими лицами. Если, например, я выиграл 10:0, то будет лучше вместо этого результата использовать мой результат 6:1 с другим участником, который, в свою очередь, выиграл у моего нынешнего оппонента, скажем, 5:2. Тогда можно реально оценить соотношение сил. Если разница в рейтингах 1500 и 2500, то судить о ее значении из игр невозможно — и в том, и в другом случае счета будут заканчиваться «на ноль».

 

1.4.11. Чему равно исходное среднее значение рейтинга в разных классификациях?

0

«Если игрок до соревнований не был классифицирован в рейтинг-листе, то для подсчета ему присваивается начальный рейтинг, равный 0». (Настольный теннис. Положение, 2003).

1000

«В первоначальных вариантах за основу оценки результатов по скорости было взято правило: вне зависимости от местности участнику, показавшему средний результат пятерки лучших на дистанции элиты, назначается 1000 очков». (Ориентирование. Положение, 2004).

1100

«Вновь заявленные пары получают начальный рейтинг 1100» (Чебышев Н., 2004, Конный спорт).

1500

(Гликман М., 1998). 2200
(Эло А., 1963).
 
...Такое, чтобы рейтинг самого слабого из участников был числом положительным.
«Назовем рейтингом смещенный в область целых положительных чисел результат участника... » (Полозов А.А., 1994).
 

ПОДВЕДЕМ ИТОГИ

Средний рейтинг, который присваивается на старте всем участникам, действительно может быть любым. От его значения ничего не зависит в расположении участников. Оно может зависеть только от разницы в рейтингах, а в этом случае, будут ли оба числа больше на 1000 или меньше, уже не играет никакой роли. Средний рейтинг задается исключительно из соображений удобства. Если каждый раз говорить «его рейтинг минус 430 целых 62 сотых пункта», то от необязательных «минус» и «сотых пункта» рано или поздно захочется избавиться. И чем активнее будут говорить эти слова, тем раньше захочется. Нужно избавить текст от слов-«сорняков». Для этого, раз уж все равно, каким будет средний рейтинг, лучше его поднять до 2000, 3000 и избавить себя от необходимости проговаривать малоинформативные слова-«сорняки». Однако на сколько поднимать? До миллиона? Здесь нужно учесть ряд психологических мотивировок. Желательно, чтобы рейтинги имели тот же порядок чисел, которым мы привыкли пользоваться в реальной жизни. В реальной жизни чаще всего мы сталкиваемся с числами, когда платим деньги за вещь, услуги. Наиболее часто используемыми рядовыми гражданами числами бывают относительно небольшие величины типа 100, 1000, 2000. Такой подход не потребует от рядового гражданина дополнительных усилий по адаптации к рейтингу. С другой стороны, раз уж мы решили избавиться от сорняков, то средний рейтинг всех участников следует приподнять так, чтобы рейтинг самого слабого из участников все еще был числом положительным. Если это правило, то для всех и без исключений. Еще одним психологическим мотивом следует считать приоритет работы А. Эло. Он обозначил средний рейтинг числом 2200, и оно вписывается в поле выбора, очерченное предыдущими соображениями. Мы можем критиковать Арпада Эло, но мы должны быть ему благодарны за открытие темы рейтинга, за высокое качество его работы. Поэтому лучше всего сохранить в модели будущего рейтинга какие-то предложенные им составные. Например, значение 2200. Это будет данью нашего уважения к выдающемуся ученому.

 

1.4.12. Средний рейтинг всех участников должен корректироваться или всегда быть постоянным?

«Для привязки всей системы, обеспечения меньшего смещения общего рейтинга вся совокупность игроков разбивается на несколько групп по уровням игры и регулярно делаются поправки, рассчитываемые по изменению рейтинга наиболее стабильных игроков (анкеров) из верхней части каждой из выделенных групп. Все параметры РС контролируются и уточняются на основе мониторинга РС с использованием современных методов статистической обработки экспериментальных данных» (Павлов С.В., 2004).

 

ПОДВЕДЕМ ИТОГИ

Нет ни одной классификации, в которой средний рейтинг спортсменов корректировался бы со временем. Между тем мы не можем отрицать развитие спорта. Полагаю, что тех, кто отрицает факт развития спорта, найти трудно. Складывается противоречие, которое как-то должно решаться.

Мы не можем, не имеем реальной возможности сравнить участников разных поколений. Но мы понимаем, что их силы неравны. Те, кто пришел после них, объективно сильнее. Но насколько? В этой связи вспоминаются некоторые законы физики. Если мы находимся внутри замкнутой системы, которая движется без ускорения, то узнать, с какой скоростью она движется и куда, мы никак не сможем. Но вот как только система начинает двигаться с ускорением, такая возможность у нас появляется. Независимые друг от друга участники макротурнира будут и прогрессировать независимо. Сначала одни вырываются вперед за счет новых методических, тактических решений. Потом другие. В системе беспрерывно совершаются ускоряющие действия. Плотность расположения участников то растет, то падает. Это единственный вариант корректировки среднего рейтинга макротурнира. Вполне логично ожидать, что средний рейтинг растет по логистическому виду зависимости, как и результаты во всех видах спорта.

 

1.4.13. Применим ли принцип транзитивности к рейтингу в спорте?

Нет, не применим

Если «Спартак» выиграл у «Динамо», а «Динамо» выиграло у «ЦСКА», то «Спартак» точно выиграет у «ЦСКА»? Широко распространено мнение, что этого не может быть — принцип транзитивности в спорте нарушается сплошь и рядом. Поэтому он не применим к спорту.

Да, применим

«Одной из основ любой рейтинговой классификации является принцип транзитивности» (Садовский А.Л., Садовский Л.Е., 1986).
 

ПОДВЕДЕМ ИТОГИ

Принцип транзитивности по факту используется формулами всех крупных соревнований, поэтому дискуссии по факту уже давно нет. Само деление команд на равные по силам группы предполагает неявное использование транзитивности. Основную интригу в дискуссию по теме внесли А.Л. Садовский, Л.Е Садовский. Они определили транзитивность как математики: если А>В, а B>C, то A>C. Именно в ответ на это и пошли примеры о «Спартаке», «Динамо». Следовательно, принцип надо уточнить. Если участник А предпочтительнее участника Б по совокупности результатов на протяжении всего сезона, а Б аналогично предпочтительнее С также по всей совокупности зафиксированных в течение года результатов, то уровень А выше, чем уровень С. В такой редакции исчезают примеры с московскими дерби и ситуация переходит в конструктивную плоскость. Транзитивность позволяет провести макротурнир без обязательной встречи каждого с каждым. А зачем играть А с С, если А уже играл с В, а В уже сыграл с С ? Тем самым создается возможность превратить круговой макротурнир в гипотетический, когда можно играть не все игры. Уровень игры, определенный на основе полученной части результатов, экстраполируют на всю сумму игр. Отсутствие этого принципа означает требование встречи каждого участника макротурнира со всеми остальными, что не имеет перспективы.

 

1.4.14. За счет чего может быть обеспечено единственно возможное распределение рейтингов?

За счет использования теории графов

(Сухов А., 1980).

За счет использования закономерностей математической статистики

(Мальковский Е., 1993), (Потемкин Е., 2004).

За счет большого числа пересчетов рейтинга

Под асимптотической устойчивостью результатов Л.Е. Садовский, А.А. Садовская понимают достижение устойчивого равновесия результатов в рамках любой действующей классификации. Имеется в виду то, что если бесконечное число раз пересчитывать те же самые данные, то рано или поздно они перестанут изменяться и станут константами (Садовский Л.Е., Садовская А.А., 1985).
 

ПОДВЕДЕМ ИТОГИ

Исследователи рейтинга всегда забывают, что, последовательно выписывая уравнения для участников, они используют систему линейных уравнений, которая может иметь или не иметь решений. Возможны и другие варианты обеспечения асимптотической устойчивости результатов. Например, теория графов. Однако предпочтение следует отдать именно системе линейных уравнений, которую изучают в школе и поэтому знают все. Нельзя требовать от рядового спортсмена знания всех разделов математики. Недопустима ситуация, когда спортсмену посчитали рейтинг, а он не может проверить правильность цифр из-за незнания, скажем, теории графов. Нужно понимать, что участники соревнований вправе отвергнуть систему, основанную на непонятном для них механизме пересчета, и это их право необходимо уважать. Первое условие любого соревнования — это прозрачность результатов. В случае с системой линейных уравнений участнику для проверки правильности подсчета его рейтинга нужно знать свои результаты и рейтинги своих соперников. Все действующие классификации в неявном виде используют систему линейных уравнений. Пора это положение закрепить явным способом.

 

1.4.15. Изменения рейтинга определяются после каждой очередной встречи или же после соревнования в целом?

После каждой встречи
«3.3. В результате встречи с соперником Приращение Рейтинга определяется:
3.3.1.  равным 0 — в случае, когда разница Рейтинга Текущего выигравшего (РТВ) и проигравшего (РТП) превышает значение 100,
3.3.2.   иначе по формуле:

  1. выигравшему: ПР=(100—РТВ+РТП)/10
  2. проигравшему: ПР=(100—РТВ+РТП)/(—20)»

(Настольный теннис. Положение, 2004). После соревнования в целом (Эло А., 1963).

«1. Рейтинг соревнования считается как среднее арифметическое рейтингов участников» (Чебышев Н., 2004, Конный спорт).
И после каждой встречи, и после соревнования в целом «Принцип трансляции в глубину призван обеспечить неизменность, преемственность способа пересчета рейтинга при переходе с макроуровня на последующие нижележащие слои, от уровня команд на уровень составляющих ее игроков, от уровня игроков — на уровень их базовых компонентов игры, и наоборот. Он предполагает возможность замены нескольких соперников одним, им эквивалентным» (Полозов А.А., 1994).
После нескольких соревнований в течение года

«7. В зачет рейтинга идет сумма баллов десяти лучших стартов» (Положение о рейтинге сильнейших спортсменов России по спортивному ориентированию бегом, 2004).

«Для каждого участника суммируются его пять лучших результатов за предыдущий календарный год» (Парусный спорт. Положение, 2004).

 

ПОДВЕДЕМ ИТОГИ

Необходимо добиться такого положения, когда пересчет рейтинга возможен как угодно: в ходе соревнования или по его завершении. Это проблема создателей систем рейтинга, а не ее пользователей. При этом не должно быть разницы, если считать рейтинг последовательно от результата к результату и если считать рейтинг по итогам всего турнира. Известно большое число парадоксов, которые связаны с несходимостью этих чисел. Практически все они связаны с выходом за пределы неявно используемых систем линейных уравнений. Разница в этих вариантах в том, что средний рейтинг оппонентов в обоих случаях разный. Для того чтобы не было разницы в подсчитанных результатах последовательно по ходу турнира или по турниру в целом, необходимо уметь представлять всех оппонентов спортсмена в некоего соперника с рейтингом, эквивалентным им. Это вопрос эквивалентности такой замены, при которой к концу турнира оба прототипа оппонентов становятся равнозначными.

 

1.4.16. Нужно ли учитывать в рейтинге факторы, создающие неравные условия, или нет?

Нет, не нужно

(Эло А., 1963).

Возможно, в виде исключения

«По представлению ФНТ субъекта РФ, решением секретаря ФНТР в субъекте РФ значение рейтинга может быть изменено конкретному спортсмену. Причины могут быть разные, однако цель всегда одна — приведение в соответствие (практически — исправление ошибки) рейтинга игрока. Это изменение, как правило, не применяется и может использоваться в исключительных случаях» (Настольный теннис. Положение, 2004).

Необходимо

«Существуют факторы (m), влияющие на итоговый результат и создающие неравные условия для участников. Выявление значения любого фактора предполагает сравнение результатов участника до и после его воздействия при нивелировании всех остальных. Компенсация суммы таких независимых, невзаимодействующих факторов должна быть равна сумме их компенсаций. Тогда официальным итогом соревнований будет рейтинг участника, скомпенсированный по всем выделенным факторам (чужое поле, климат, пол, возраст...)» (Полозов А.А., 1994).

«В системе «по занятым местам» кроме очков, начисляемых за занятое в турнире место, дополнительно начисляются премиальные очки (бонусы) за победу над игроком (парой игроков), имеющим большее количество очков по классификации ФТУ или СНГ в одиночном или парном разрядах» (Украинская теннисная классификация. Положение, 2004).
 

ПОДВЕДЕМ ИТОГИ

Это вопрос, который может быть поднят в рамках классификации высокого уровня. Конечно, не равны между собой белые и черные фигуры в шахматах. Трудно не согласиться с тем, что на любом турнире хозяева имеют завышенный результат. В теннисе считается большой проблемой взять чужую подачу. Понятно, что тот, кто бежит по дистанции после своего основного соперника, знает его время и имеет преимущество. В футболе хозяева забивают вдвое больше гостей. Но вот как это преимущество нейтрализовать в оценке? Поэтому вопроса, надо компенсировать или не надо, наверное, нет. Вопрос стоит: а как это лучше сделать? Должна ли такая компенсация быть сбалансированной — сколько прибавили одним, столько же отняли у других? На сегодняшний день, при нерешенности этого вопроса на уровне классификаций, проблему решают на уровне проведения соревнований. В футболе команды по очереди играют дома и в гостях. В теннисе подают также по очереди. В шахматах играют две партии обоими цветами. Однако определение механизма компенсации может позволить сократить необходимый минимум игр для расширения масштабов турнира.

 

1.4.17. Является ли значение рейтинга точным числом или же речь идет о некотором интервале шкалы рейтинга? 

Да, рейтинг — число точное

(Эло А., 1963).

Нет, рейтинг — это интервал расположения участника с вероятностью 95%.
«Проблема системы Эло, которую исправляет система Глико, — это достоверность рейтинга игрока. Предположим, что два игрока, оба с коэффициентом Эло в 1700, встречаются на турнире и первый побеждает второго. По версии Американской шахматной федерации системы Эло первый игрок получит в этом случае 16 рейтинговых очков, а второй игрок потеряет те же 16 очков. Но предположим, что первый игрок только что вернулся к играм на турнирах после многих лет «отдыха», а второй игрок режется в шахматы каждый выходной. В этой ситуации рейтинг первого игрока в 1700 очков является не совсем достоверным отражением его силы, в то время как рейтинг второго игрока в 1700 является вполне реальным отображением его игрового мастерства. Моя интуиция подсказывает мне, что (1) рейтинг первого игрока должен увеличиться намного (больше 16 очков), поскольку его рейтинг не совсем реален, и то, что он побил игрока с практически точным рейтингом в 1700, наводит на мысль, что его сила заведомо превышает 1700; и (2) рейтинг второго игрока должен немного уменьшиться (менее 16 очков), поскольку про его рейтинг и так уже известно, что а) он находится в районе 1700 и б) он проиграл игроку, чей рейтинг не заслуживает доверия, и потому о его собственной игровой силе могут быть сделаны лишь небольшие догадки. Хотя большинство ситуаций не столь экстремальны, мне кажется, что в систему ранжирования полезно включить меру достоверности чьего-либо рейтинга. Потому-то система Глико и превосходит систему Эло, что вычисляет не только рейтинг R, который может быть представлен, как «наилучшая догадка» о чьей-либо игровой силе, но и «рейтинговое отклонение» (RD) (в статистической терминологии — стандартное отклонение), которое измеряет неопределенность рейтинга. Высокие RDотвечают ненадежным рейтингам, указывая, что игрок выступает не часто или что игрок участвовал лишь в небольшом количестве игр. Низкий RDуказывает на то, что игрок постоянно принимает участие в турнирах... Так, например, если чей-либо рейтинг равен 1850 и RDравно 50, то интервал будет простираться между 1750 и 1950. Мы можем сказать тогда, что мы на 95% уверены, что реальная сила игрока находится между 1750 и 1950. Если у игрока низкий RD, то интервал будет уже и мы будем на 95% уверены в реальной силе игрока в меньшем интервале значений» (Гликман М., 1995).

Рейтинг всегда определяется с погрешностью

«Если участник имеет рейтинг 2300, забив и пропустив в свои ворота 20 мячей за сезон, то погрешность определения его рейтинга равна: 2000/20=100 пунктов по шкале рейтинга. В этом случае правильнее говорить о результате 2300 ± 50 пунктов. Естественно, что если сумма забитых и пропущенных мячей увеличится до 200, то интервал сократится — 2300+5. Поэтому одним из условий корректности проведенных соревнований является превышение плотности результатов (средний интервал расположения между участниками) над погрешностью их определения»
(Полозов А.А., 1994).
 

ПОДВЕДЕМ ИТОГИ

Я с большим уважением отношусь к мнению профессора математики Гликмана и последовавшими за ним работами по определению интервала расположения спортсмена. Полагаю, что поднята еще одна проблема, которую так или иначе предстоит решать. Однако вызывает недоумение сама манера изложения материала. Не изложены основополагающие идеи механизма. Есть только формулы. К сожалению, в них без помощи самого профессора нам не обойтись. Нет примеров, иллюстрирующих суть дела. Кажется странным разное количество очков за выигрыш и проигрыш, определяемое на основе «рейтингового отклонения». Отклонение определяет сам рейтинг — это непонятно. А как же тогда стабилизировать средний рейтинг всех участников? Теперь нужно считать и рейтинг, и интервал, и достоверность. Таким резким усложнением всей процедуры мы должны платить за желание наказать некоторых спортсменов, не участвующих полгода в турнирах? Кажется наиболее вероятным решением проблемы тот тезис, что рейтинг всегда определяется с погрешностью, и важно, чтобы к концу сезона эта погрешность стала меньше среднего расстояния между соседями по шкале рейтинга.

 

1.4.18. Соответствуют ли результаты официальных соревнований положению участников в рейтинге?

Нет, не соответствуют

«Издержки соревнований в виде пенальти, жеребьевки, не-дифферинцированности результата (те же очки за 1:0 и 11:0) неизбежно формируют несоответствие результатов соревнований реальному соотношению сил. Возьмем результаты любого кругового турнира и произвольно исключим некоторую их часть, с таким расчетом, чтобы обозначилась та или иная формула. Оценим степень сходимости результатов кругового макротурнира с результатами на основе выбранной формулы.

 

  • Олимпийская формула. Отметим очень широкий диапазон сходимости результатов в зависимости от случайности выбора — от 40 до 60%. К последней отметке (60%) он подходил в случаях относительно равномерного рассеивания сильнейших команд.
  • Смешанная (зонально-олимпийская) формула. Процент соответствия колебался в интервале 70—90%. Среднее значение составило 82%.
  • Круговая формула. Круговую формулу по определению считаем 100%, хотя более правильно говорить о 95% из-за погрешности очковой схемы интерпретации (Полозов А.А., 1995).

1.4.19. Создают ли искажения полуизолированные микротурниры?

Да, создают

«Самую серьезную трудность для любой системы рейтинга представляет собой проблема полуизолированных микротурниров.
Проблема полуизолированных микротурниров — это проблема замедленного обмена информацией между различными участниками макротурнира. Просматривается два пути ее решения. Первый связан с преодолением стихийности макротурнира. Необходимо просто проводить турниры в рамках тотального макротурнира по рейтинг-формуле, в которой невозможно существование ни изолированных, ни полуизолированных микротурниров. Второе направление связано с тем, чтобы корректировать состав участников любого турнира с учетом фактуры полуизолированных микротурниров. Желательны такие турниры, которые сокращают связь между двумя произвольно выбранными участниками. Это все касается формы с ручным пересчетом каждым участником своего рейтинга. Однако более правильным представляется подход, при котором каждый день рейтинги пересчитываются и «выбрасываются» в Интернет, а каждый участник имеет возможность из рейтингов его оппонентов и своего сверить свое уравнение в системе линейных уравнений. При этом условием является минимальное число игр участника» (Полозов А.А., 2004).

 

1.4.20. Какие парадоксы возникают при расчетах рейтинга?

«Снято необоснованное упрощение правила подсчета ожидаемого результата. Оно состояло в том, что, вместо того чтобы просуммировать ожидаемые результаты по всем партиям, вычисляется средний рейтинг соперников и считается, что все партии играются с таким «усредненным» соперником. Это приводит к нарушению закона «сохранения», то есть суммы рейтингов до и после турнира не равны (это без учета округлений). Желающие могут в этом и сами убедиться, если представят себе гипотетический турнир, в котором участвуют трое, у двоих из которых одинаковый рейтинг, а у третьего значительно ниже. После такого турнира общая сумма рейтингов уменьшится на величину, приближающуюся к пяти пунктам (при уменьшении рейтинга третьего).

Снят недостаток системы, при котором при большом количестве партий рейтинг изменяется неограниченно сильно. Пример: двое с рейтингом 2400 играют матч из большого числа партий, причем первый набирает в каждых двух партиях по 1,5 очка. Тогда у него после каждых двух партий рейтинг будет возрастать на 5 пунктов и после 240 партий достигнет 3000. Напрашивается справедливый вывод: рейтинг надо считать после каждой партии (это относится не только к матчам, но и к турнирам). Тогда в этом примере рейтинг сильнейшего стабилизируется у 2500, а слабейшего у 2300, как и должно быть. Однако, конечно, вряд ли кто возьмется считать рейтинги по каждой партии отдельно, да и не всегда порядок партий можно установить. Поэтому реализуется простой выход из положения: все же считается матч (турнир) целиком, но не за один заход, а за nзаходов, где в формуле подсчета изменения рейтингов К=10х(Р—Б) число 10 заменяется на 10/n(n— максимальное число партий, сыгранное кем-либо в турнире (матче)). Заметим, что с этой проблемой борются в ФШР, но уж очень оригинальным способом. Чтобы рейтинг не рос слишком быстро у «излишне активных» шашистов, изменение рейтинга в течение полугода домножается на 40/n, где n— число сыгранных партий (если n>40). Но ведь виновата не активность шашиста, которую нужно всячески приветствовать, а несовершенство системы подсчета рейтингов. Рейтинги с помощью программы В. Шулюпова подсчитываются с точностью до 0,1» (Степанчук Н. Шашки. Украина, 2004).

«Один из недостатков системы Эло связан с возникновением в ней некоторых парадоксов. Пусть, например, двое играют матч без ограничения числа партий. Причем один набирает чуть больший процент очков, чем "положено" по Эло, а другой — чуть меньший. Тогда рейтинг первого неограниченно растет, а рейтинг второго неограниченно падает. Если бы пересчет рейтингов производился после каждой партии, то в нашем примере они быстро стабилизировались бы и ничего парадоксального не произошло. Разумеется, такой частый пересчет рейтинга малоудобен. Впрочем, если число партий в матче или турнире не превосходит 20— 25 (а практически больше и не бывает), то никаких недоразумений не случится» (Гик Е.Я., 1976).

«Мне пришлось рассчитывать рейтинги команд — участников чемпионата мира по футболу с 1936 по 1996 год. Наибольший казус случился при расчете за 1982 год. Тогда сборная Италии играла в одной предварительной группе с Камеруном. Как известно, итальянцы безобразно плохо играют предварительные игры, много отсиживаются в обороне, играют по принципу минимальных затрат сил на предварительные встречи. Две игры они сыграли 0:0 и 1:1. Личную встречу со сборной Камеруна они сыграли 1:1. Сборная Камеруна две другие встречи в группе сыграла вообще 0:0. Естественно, эти счета равносильны тому, что Камерун и вовсе не играл ни с кем, кроме сборной Италии. А поскольку они сыграли 1:1, то сборная Камеруна была обречена иметь тот же рейтинг, что и сборная Италии. А они в тот год, как известно, стали чемпионами мира. Вот и случилось чудо — первое место в моих подсчетах за 1982 год «поделили» сборные Италии и Камеруна» (Полозов А.А., 2004).

«Часто наблюдается простое дублирование параметров игровой деятельности. Например, если учесть разность забитых и пропущенных мячей и еще набранные очки — это равносильно тому, что учесть две взаимосвязанные характеристики. При этом линейное уравнение в неявном виде становится нелинейным полиномиальным. Это может приводить к искажениям в итоговых результатах. Однако новые коэффициенты не в силах изменить нелинейность, и, как следствие, такие случаи явного несоответствия не прекращаются. В итоге смена коэффициентов неизбежно превращается в постоянный процесс. А далее возникает вопрос о необходимости выделения независимых параметров в "формуле успеха" и способе определения фактических коэффициентов, то есть такие неофициальные классификации можно рассматривать в качестве временной компенсации отсутствующей официальной» (Полозов А.А., 2000).
 

ПОДВЕДЕМ ИТОГИ

Все парадоксы пересчета рейтинга могут быть связаны с нелепостью самой ситуации, неадекватностью использования в формуле фиксированных коэффициентов и выходом за рамки соответствующей системы линейных уравнений. Именно произвольность в организации и пересчете приводит к потере корректного решения. В тех случаях, когда нет такой потери, решения получаются всегда и без проблем.

 

1.4.21. Возможна ли компенсация фактора возраста?

  Да, это возможно

«Для мужчин и женщин от 35 лет и моложе 20 лет полученный результат делится на возрастной коэффициент согласно таблице "Возрастные коэффициенты". (Возраст определяется как число полных лет на дату старта)» (Бег. Положение, 2004).

 

1.4.22. Нужно ли карать участника снижением рейтинга за пропуск очередных соревнований?

  Да, необходимо

«Неучастие спортсмена в соревновании приводит к понижению рейтинга на 6 пунктов в конкурсе и на 12 в выездке» (Чебышев Н., 2004, Конный спорт).
«Рейтинг Текущий определяется как Рейтинг Последний, уменьшенный на количество дней, прошедших по истечении одного года после даты последних соревнований, в которых участвовал игрок, до даты определения рейтинг-листа. В случае если спортсмен не принимает участия в обсчитываемых соревнованиях в течение года, его рейтинг ежедневно уменьшается на 1. Именно это, «оштрафованное» значение используется во всех целях» (Настольный теннис. Положение, 2004).

Нет, если он выполнил минимальную норму игр за год

«Минимальное число матчей макротурнира для данного участника определяется равенством общего числа участников макротурнира числу 2 в степени от числа официальных встреч данного участника. Если этот рубеж пройден, то участник точно попадает в итоговый рейтинг-лист календарного года. Если нет, то не попадает, а его результаты аннулируются. Любое число снятых пунктов рейтинга является произволом и неизбежно приводит к сползанию среднего рейтинга макротурнира» (Полозов А.А., 2004).

 

1.4.23. Должна ли быть связь между разрядами, званиями и рейтингом?

Не обязательно

(Эло А., 1963).

Да, это необходимо

«В настоящее время ЕВСК 2001—2005 вступило в силу и действует на всей территории Российской Федерации. Для выполнения разрядов требуется достичь значения рейтинга: КМС = 700, 1-й разряд = 500, 2-й разряд = 400, 3-й разряд = 300, 1-й юношеский разряд = 200, 2-й юношеский разряд = 100, 3-й юношеский разряд = 1. Для присвоения КМС спорткомитетом субъекта РФ 1-го разряда и ниже организацией, имеющей на это право, предоставленное спорткомитетом субъекта РФ, достаточным является соответствующее представление (подтверждение) достижения необходимого значения рейтинга секретарем ФНТР в субъекте РФ. Всякая иная схема присвоения спортивного разряда является незаконной и может преследоваться» (Настольный теннис. Положение, 2004).

 

1.4.24. Если считать рейтингом произведение параметров всех аспектов соревнований, то какие из них чаще всего входят в это произведение как сомножители?

Ранг соревнований, коэффициент команды. (Пейнтбол. Положение, 2004).

Ранг соревнований, бонусные очки, очки за место. (O'Neill Rankings/огOlympic Classes, ИСАФ, Парусныйспорт, 2003).

Ранг соревнований, занятое место. (Ледолазание. Положение, 2001).

Длина дистанции, время участника, коэффициент местности, коэффициент возраста участников. (Красильников Б., Ориентирование, 2003).

Число высококвалифицированных участников, очки за место, сумма зачетных упражнений. (Планерный спорт. Положение, 1997).

Число игроков, цена тура, доля положительных вистов участника. (Пушков С., Преферанс, 2004).

Занятые места. (Скалолазание. Положение, 2004).

Занятое место, ранг турнира, формула соревнований, число участников основного турнира. (Теннис. Украина. Положение, 2001).

Уровень турнира, бонус за разность, фактор поля, набранные очки. (Божков А.В., 2004).

 

1.4.25. Что автор классификации должен представить общественности в первую очередь — формулы расчета или принципы расчета?

Формулы расчета

Подавляющее большинство классификаций.

Принципы расчета

«Все классификации в той или иной мере должны быть основаны на принципах транзитивности и асимптотической устойчивости» (Садовский А.Л., Садовский Л.Е., 1986).

«Основной сложностью в восприятии рейтинг-систем является то, что их авторы предлагают нам, читателям, самим выделить, выковырять из их формул скрытый в них принцип. Нужно все время отгадывать какой-то кроссворд. Именно поэтому не получается нормальной дискуссии. Но это даже не самое главное. Самое главное состоит в том, что рейтинговая классификация — это официально используемый инструмент, который должен быть представлен общественности, и она с его положениями должна согласиться. В основе любой классификации стоят принципы, которые всеми нормально воспринимаются. А уже потом, после их одобрения, для реализации оформленных принципов любой студент сможет предложить подобающую им формулу. Незрелость системы рейтинга проявляется в первую очередь в том, что нет определения понятия "рейтинг" и нет принципов реализации этого определения» (Полозов А.А., 2003).

 

1.4.26. Как связаны между собой рейтинги участников и результат их личной встречи?

Отношения рейтингов равны отношению набранных и потерянных очков.

«Отношение рейтингов двух соперников равно отношению вероятностей их выигрыша друг у друга» (Мальковский Д.Г., 1993).

«Количество очков M, получаемых теннисистом за отдельный матч, определяется соотношением рейтингов двух теннисистов, участвующих в матче» (Божков А.В., 2004).

«В случае противоборства двух участников естественно принять определение рейтингов участников как отношение числа их побед и поражений» (Потемкин Е.Л., 2004).

Соотношение набранных (M) и потерянных (N) очков находится в степенной зависимости от разности в рейтингах соперников.

«А. Эло предполагал, что соотношение набранных (M) и потерянных (N) очков находится в степенной зависимости от разности в рейтингах соперников. В качестве исходного примем предположение, согласно которому отношение m/nсреднего числа побед игрока Uк среднему числу nего поражений в сериях из N встреч с игроком V находится в экспоненциальной зависимости от разности рейтингов игроков Uи V» (Садовский Л.Е, Садовский А.Л., 1986).

Разница в рейтингах равна разности забитых и пропущенных мячей, деленных на их сумму (Полозов А.А., 1995).

 

1.5. Сходимость модели

Давайте посмотрим на сходимость действующих моделей рейтинга на примере рейтинга FIFA/Соса-Сola. Прошедший в 2004 г. чемпионат Европы по футболу, как и все предыдущие, обозначил большой шлейф вопросов. Самым большим недоразумением этого чемпионата стала оставшаяся за кадром используемая FIFAсистема ранжирования участников. В финале встретились команды, которые в рейтинге FIFAзанимали 22-е (Португалия) и 35-е (Греция) места. После прихода к руководству сборной Г. Ярцева, несмотря на явное усиление игры, наша сборная почему-то не поднялась выше, а, напротив, опустилась по сравнению с концом 2003-го года на 7 позиций. Как же тогда смогла 31-я по силе команда (21-я без неевропейских команд) попасть в число 16 сильнейших сборных? Как известно, жеребьевка чемпионата Европы проводилась в соответствии с распределением команд по «корзинам», состав которых определялся по тому же рейтингу. Можно ли считать нашу группу равной другим группам, если в ней помимо сборной России играли два будущих финалиста и еще третья по силе команда — сборная Испании? Каким образом Чехия, которая обыгрывает Германию вторым составом, тем не менее находится ниже в рейтинге?

Опубликованный впервые в августе 1993 г. Мировой рейтинг FIFA/Соса-Соla являет собой ежемесячный статус-лист всех мировых ныне действующих старших национальных сборных и включает в себя около 180 команд. Имея множество разработанных систем, авторы взяли за прототип систему ранжирования теннисистов. Кстати, с 2000 г. рейтинг АТП изменен. Методика подсчета, подготовленная в Соса-Со1а, вызвала критику со стороны специалистов за многочисленные дефекты. Система состояла из многочисленных заплаток оказавшегося в итоге не нужного теннисистам рейтинга АТП. Например, авторы системы пытались стимулировать результативность коэффициентами, что представляется скорее политическим, чем статистическим решением. Учитываются результаты тренировочных игр, хотя в них тренеры не гонятся за результатом, а просто просматривают ближайший резерв. Теоретически невозможно сравнивать команды, не имеющие официальных встреч между собой. Если четыре года команды из Африки не играют с командами из Европы и Америки, то приводить их в общем списке нет никаких оснований. Предложенная классификация не имела статистического обоснования. По мнению Е. Потемкина, рейтинг FIFA/Соса-Соla примерно то же самое, как если бы организаторы конкурса красоты выбирали победительницу простым взвешиванием.

В том же теннисе классификации меняются часто, но это хорошо. Они ищут такой вариант, при котором в четвертьфиналах в 99% случаях окажутся 8 первых рейтингов турнира. Теннисисты озабочены сходимостью избранной модели. Рейтинг же FIFA/Соса-Со1а в очередной раз дискредитировал себя превосходством нижестоящих по рейтингу оппонентов над вышестоящими. Уровень классификации от дилетантов не соответствует уровню соревнований. Почему за коммерческие интересы FIFA, ее заигрывание с могущественными корпорациями в виде предоставления возможности «порулить» с помощью рейтинга должна отдуваться наша сборная?

Кстати сказать, показатель сходимости модели в теннисе (процент вышедших в четвертьфинал сеяных игроков) не является адекватным показателем. Он в первую очередь зависит от плотности результатов теннисистов. Во всех видах спорта плотность результатов год от года растет. Следовательно, будет расти и масштаб оценки. Это сейчас их интересует только сам факт победы одного теннисиста над другим. Придет время, и они начнут интересоваться счетом игры по партиям. А для большего масштаба шкалы рейтинга придется пересматривать все настройки. Если говорить о сходимости модели, то следует вести речь о среднем проценте отклонения ожидаемого, планируемого результата от фактического. Минимизации этого показателя на уровне выбора вида функции, способа пересчета должны быть посвящены соответствующие исследования.

 

ПОДВЕДЕМ ИТОГИ

Суть проблемы рейтинга можно было бы существенно упростить. Если исходить из предположения, что рейтинг — это результат участника в глобальном макротурнире, то сразу же возникает проблема. Все со всеми в круг играть не могут. Слишком много участников. Тогда нужна модель рейтинга, которая бы по части результатов макротурнира воспроизвела бы все его результаты. В этом случае возникает сомнение: насколько точно воспроизводится несыгранная часть макротурнира? Можно ли доверять модели, которая приписывает вам поражение там, где вы выиграли? О качестве модели судят по сходимости предполагаемых и фактических результатов. Тогда, исходя из счета игры, можно рассчитать фактический рейтинг и сравнить его с номинально предписываемым. Или же, что то же самое, сравнить разницу в рейтингах по фактическому исходу личной встречи с разницей номинальных рейтингов. Участника макротурнира интересует та система рейтинга, которая оценивает его с максимальной точностью или, иначе говоря, с минимальной погрешностью.