Участник:Egor Plyashenko/Прогнозирование средней скорости автотранспорта
Материал из MachineLearning.
 (→Дневник исследователя)  | 
				|||
| (17 промежуточных версий не показаны.) | |||
| Строка 1: | Строка 1: | ||
== Постановка задачи ==  | == Постановка задачи ==  | ||
| - | В рамках проводимого компанией «Яндекс» конкурса   | + | В рамках проводимого компанией «Яндекс» конкурса «[[Интернет-математика|Интернет-математика 2010]]» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.  | 
| - | математика   | + | |
| - | в Москве на основе имеющихся данных за один месяц. Для оценки качества   | + | |
| - | + | ||
| - | и предсказанными данными, а победитель определялся как получивший минимальное  | + | |
| - | значение невязки.  | + | |
| - | ==   | + | == Результаты ==  | 
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| + | Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.  | ||
| + | Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.  | ||
| - | + | Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.  | |
| - | + | Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.  | |
| - | Q =   | + | |
| - | + | ||
| - | Q =   | + | Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.  | 
| - | + | ||
| - | Q =   | + | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.  | 
| - | + | ||
| - | Q =   | + | |
| + | Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).  | ||
| + | |||
| + | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).  | ||
| + | |||
| + | Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).  | ||
| + | |||
| + | == Скорость по дням недели на улице 456880 ==  | ||
| + | Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся  | ||
| + | осталось «всего» 2614 наблюдений.  | ||
| + | |||
| + | <gallery>  | ||
| + | Изображение:D 3.png| Понедельник  | ||
| + | Изображение:D 4.png| Вторник  | ||
| + | Изображение:D 5.png| Среда  | ||
| + | Изображение:D 6.png| Четверг  | ||
| + | Изображение:D 7.png| Пятница  | ||
| + | Изображение:D 1.png| Суббота  | ||
| + | Изображение:D 2.png| Воскресенье  | ||
| + | </gallery>  | ||
| + | |||
| + | == Некоторые полезные графики ==  | ||
| + | По около половине улиц из файла edge_data.txt вообще нет наблюдений.  | ||
| + | |||
| + | <gallery>  | ||
| + | Изображение:Day Speed.png| Средняя скорость по дням недели  | ||
| + | Изображение:Observ num.png| Количество наблюдений по дням недели  | ||
| + | Изображение:R1.png| Распределение количества наблюдений по улицам (≥1)  | ||
| + | Изображение:R10.png| Распределение количества наблюдений по улицам (≥10)  | ||
| + | Изображение:R100.png| Распределение количества наблюдений по улицам (≥100)  | ||
| + | Изображение:R1000.png| Распределение количества наблюдений по улицам (≥1000)  | ||
| + | </gallery>  | ||
| + | |||
| + | == Графики распределения скоростей по величине ==  | ||
| + | |||
| + | <gallery>  | ||
| + | Изображение:1600.png| Время 16:00  | ||
| + | Изображение:1620.png| Время 16:20  | ||
| + | Изображение:1640.png| Время 16:40  | ||
| + | Изображение:1700.png| Время 17:00  | ||
| + | Изображение:1720.png| Время 17:20  | ||
| + | Изображение:1740.png| Время 17:40  | ||
| + | Изображение:1800.png| Время 18:00  | ||
| + | Изображение:1820.png| Время 18:20  | ||
| + | Изображение:1840.png| Время 18:40  | ||
| + | Изображение:1900.png| Время 19:00  | ||
| + | Изображение:1920.png| Время 19:20  | ||
| + | Изображение:1940.png| Время 19:40  | ||
| + | Изображение:2000.png| Время 20:00  | ||
| + | Изображение:2020.png| Время 20:20  | ||
| + | Изображение:2040.png| Время 20:40  | ||
| + | Изображение:2100.png| Время 21:00  | ||
| + | Изображение:2120.png| Время 21:20  | ||
| + | Изображение:2140.png| Время 21:40  | ||
| + | </gallery>  | ||
Текущая версия
Содержание | 
Постановка задачи
В рамках проводимого компанией «Яндекс» конкурса «Интернет-математика 2010» была предложена задача прогноза скорости движения автомобилей в Москве на основе имеющихся данных за один месяц. Для оценки качества предсказания использовалась определенным образом составленная невязка между известными и предсказанными данными, а победитель определялся как получивший минимальное значение невязки.
Результаты
Расчет функционала производится только для вечерних временных промежутков, то есть начиная с 18:00.
Алгоритм 1 — неизвестная скорость = средней скорости за предыдущие дни в тот же промежуток.
Значение функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 69.4040.
Значение функционала при прогнозировании скорости в 31-й день(понедельник): Q = 71.7064.
Алгоритм 2 — неизвестная скорость = средней скорости за предыдущие совпадающие дни недели в тот же промежуток.
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 64.2448.
Алгоритм 3 — за прогнозируемую скорость берется текущая скорость в 18:00(или более ранняя, если наблюдение в данное время отсутствует).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 76.3957(скорость берется за все дни).
Значения функционала при прогнозировании скорости в 30-й день(воскресенье): Q = 60.2014(скорость берется только за те же дни недели).
Скорость по дням недели на улице 456880
Данная улица обладает наибольшим количеством наблюдений из всех — 6452. После удаления повторяющихся осталось «всего» 2614 наблюдений.
Некоторые полезные графики
По около половине улиц из файла edge_data.txt вообще нет наблюдений.

