
«Когда умрет последний конь — мир рухнет, потому что самые лучшие люди — это кони»
Для своего исследования я выбрала объёмный датасет, посвящённый скачкам, с платформы Kaggle.com. Этот датасет включает в себя информацию о лошадях, жокеях, тренерах, результатах забегов, условиях трасс, исторических данных о победах и поражениях, а также финансовых аспектах, таких как призовые фонды и ставки. Данные охватывают несколько лет и включают как национальные, так и международные соревнования.
Описание проекта

Скачки всегда казались мне увлекательным сочетанием спорта, стратегии и красоты. Однако за внешней зрелищностью скрывается огромный пласт данных, который может рассказать удивительные истории. Мне было интересно исследовать, как факторы, такие как возраст лошади, опыт жокея или тип покрытия трассы, влияют на результаты забегов. Эти данные имеют особую ценность, так как они позволяют не только понять закономерности в мире скачек, но и могут быть полезны для прогнозирования результатов, оптимизации тренировок и даже для ставок.
Оформление проекта


Для визуального оформления я выбрала умеренно яркие, светлые тона, которые отражают моё восприятие конного спорта как сочетания чистой динамики, заботы и вдохновения. Эти цвета создают ощущение лёгкости и энергии, подчёркивая элегантность и грацию лошадей. Чтобы добавить глубину и исторический контекст, исследование дополнено архивными фотографиями, которые были обработаны в Photoshop для достижения стилистического единства. Фотографии, слегка тонированные в пастельные оттенки, гармонично сочетаются с современной графикой, создавая баланс между прошлым и настоящим.
i. Столбчатая диаграмма
На графике видно, что количество побед у нефаворитов значительно превышает количество побед у фаворитов. Возможные причины: Дисбаланс в данных: В датасете может быть больше нефаворитов, чем фаворитов. Это связано с тем, что в большинстве гонок фаворитов меньше (обычно 1-2 лошади), а нефаворитов — больше. Неожиданные результаты: В спорте, особенно в лошадиных гонках, часто случаются неожиданные победы. Это может быть связано с форс-мажорными обстоятельствами, такими как травмы фаворитов, плохие погодные условия или тактические ошибки жокеев. Ставки и мотивация: Нефавориты могут быть более мотивированы, чтобы доказать свою силу, особенно если на них меньше давят ожидания.
ii. Гистограмма
Данная гистограмма показывает следующее: По оси X откладываются значения переменной (количество дней отдыха, DAYS), По оси Y — сколько раз эти значения встречаются.
Большинство лошадей отдыхают от 20 до 30 дней перед забегом. Некоторые лошади отдыхают значительно дольше (до 100 дней), что может указывать на их долгое отсутствие на треке. Скошенность влево говорит о том, что большинство лошадей отдыхают относительно мало, но есть «выбросы» с большим количеством дней отдыха.
iii. Столбчатая диаграмма
Что показано на диаграмме: По оси Y указаны имена тренеров. По оси X отложена средняя позиция лошадей на финише. Высота столбца отражает среднюю позицию: чем ниже столбец, тем лучше результат тренера. Сортировка: Данные отсортированы по убыванию успешности, то есть тренер с самой низкой средней позицией (лучший результат) находится слева, а с самой высокой (худший результат из топ-6) — справа.
Видно, что первых четверых тренеров средняя позиция лошадей на финише составляет 1. Эти тренеры самые успешные.
iv. Диаграмма размаха
Лошади, стартующие с более дальних позиций (например, с позиций 8, 9, 10 и т. д.), в среднем показывают более медленное время финиша по сравнению с лошадьми, стартующими с первых позиций (1, 2, 3). Интерпретация: Это может быть связано с тем, что лошади, стартующие с первых позиций, имеют преимущество в начале гонки: они быстрее занимают выгодную позицию на треке и меньше тратят времени на обгон соперников. Лошади с дальних позиций вынуждены преодолевать большее расстояние, особенно если они находятся на внешней стороне трека (где радиус поворота больше, и физически приходится бежать дольше).
Выводы
Проведённый анализ позволил выявить ключевые факторы, влияющие на результаты скачек, и понять их взаимосвязь. Так, фаворитизм лошади это не является гарантией успеха, так как около 30% фаворитов не занимают призовых мест. Это говорит о том, что статус фаворита — важный, но не единственный показатель. Позиция лошади на старте играет значительную роль, особенно на коротких дистанциях. Лошади, стартующие ближе к внутренней стороне дорожки, чаще показывают лучшие результаты. Однако на длинных дистанциях этот фактор становится менее значимым. Анализ показал, что лошади, которые участвовали в забегах за 30–60 дней до основных скачек, демонстрируют более высокие результаты. Слишком частые или, наоборот, редкие старты негативно сказываются на результативности.
Исследование подтвердило, что скачки — это сложный и многогранный спорт, где результат зависит от множества взаимосвязанных факторов. Понимание этих закономерностей может помочь не только в прогнозировании результатов, но и в оптимизации тренировочного процесса, что делает анализ данных ценным инструментом для всех, кто связан с миром конного спорта.
Используемые инструменты:
Google.Collab Photoshop Unsplash