запросы в Росстат
2021-12-15 12:29:15
Рассказываю интересующимся о том, как работают запросы в Росстат. С подачи Алексея Ракши, 2 ноября я отправил в Росстат следующий запрос (заполнив форму https://rosstat.gov.ru/appeal):
Добрый день, для исследований по демографии регионов России, прошу предоставить данные о числе умерших по субъектам Российской Федерации по окончательным годовым данным по месяцам смерти с января 1990 по декабрь 2020 или указать ссылки на эти данные, если они опубликованы. Мне известны "оперативные" данные Росстата по месяцам и по регионам, сгруппированные по дате регистрации смерти. Но сейчас меня интересуют окончательные данные, сгруппированные по дате смерти. Большое спасибо! С уважением, Дмитрий КобакЧерез две недели, 15 ноября, мне на электронную почту пришел ответ (официальное отсканированное письмо с номером и подписью в PDF и таблица в XLS). К сожалению, посмотрев на данные, я понял, что это не число умерших, а число рождений :-/ Так что 18 ноября я отправил повторный запрос, объяснив, что произошла ошибка. Еще через две недели, 28 ноября, мне (без дополнительных комментариев) прислали новый ответ и новую таблицу -- на этот раз действительно умерших.
На этот раз обнаружилось, что значение за август неверное (не совпадает с уже известными мне данными) и совпадает со значением за июль, причем только в строчке "Российская Федерация" и только за последние 10 лет. Значения по регионам вроде бы верные, так что значения в строчке "Российская Федерация" можно было восстановить, сложив значения по регионам. Я решил не писать новый запрос, а просто внести в таблицу это изменение самому. Но как могла произойти такая ошибка, мне не очень понятно.
Обе присланные мне таблицы (уже в исправленном виде) я выложил на https://github.com/dkobak/excess-mortality/tree/main/russian-data, вместе с данными, конвертированными в более удобный вид и CSV формат. В исходных данных в каждый год есть некоторое небольшое кол-во смертей с неизвестным месяцем смерти (и это число сильно выросло в 2020). Для CSV файла я эти смерти распределил по месяцам пропорционально смертям с известным месяцем смерти.
Все мои графики избыточной смертности по регионам РФ теперь основаны на этих окончательных данных (вплоть до конца 2020 года). Несколько странностей (в Краснодарском крае, например), которые мы обсуждали в прошлом году, теперь просто исчезли, т.е. это были артефакты регистрации смертей.
Подробнее https://kobak.livejournal.com/124260.html?me...