На Єдиному державному порталі відкритих даних публікують інформацію про пасажиропотік на міжнародному та внутрішньому залізничному сполученнях. Наразі оприлюднені дані з вересня 2018 року і до січня 2020 року включно.

В кожному файлі міститься інформація про:

  • Номер поїзда
  • Вид сполучення (внутрішнє чи міжнародне)
  • Дату відправлення поїзда
  • Станцію відправлення
  • Станцію призначення
  • Тип вагона (плацкарт, купе, люкс)
  • Тип документа (повний, пільговий, дитячий)
  • Кількість пасажирів

Що ми можемо дізнатися з цього набору даних?

  • Скільки пасажирів було перевезено за певний період
  • Найбільш завантажені потяги
  • Дні/тижні/місяці, коли було перевезено найбільше/найменше пасажирів
  • Частку пільговиків, дітей або військових у загальній кількості пасажирів
  • Структуру перевезень за типами вагонів

Що ми не можемо дізнатися з цього набору даних?

  • Найбільш завантажені станції, а також найбільш популярні напрямки (пари станцій). Оскільки частина інформації була видалена з набору перед публікацією, ми не можемо сказати, з якої до якої станції їхали люди. Ми можемо знати, наприклад, що вони їхали потягом Київ - Львів, але у нас нема можливості сказати, чи вони їхали від Києва до Вінниці, чи від Вінниці до Львова.

Особливості та проблеми набору даних

  • У файлах можуть відрізнятися назви змінних та може бути різна кількість стовпчиків
  • У файлах може відрізнятися форматування дат
  • Відсутні дані за декілька днів 2019 року