Александр и София — самые популярные имена московских младенцев последние пять лет. Но, возможно, скоро их потеснят Львы, Марки и Евы.
В дюжину самых популярных имен также вошли:
у девочек — Анастасия, Полина, Елизавета, Александра, Варвара, Дарья, Екатерина;
у мальчиков — Иван, Дмитрий, Матвей, Марк, Кирилл, Андрей, Илья.
Мода на имена пока консервативна и меняется медленно. За последние пять лет тройка лидеров, как у мальчиков, так и у девочек, не изменилась, хотя все имена из топа немного потеряли “вес”.
У мальчиков сохранилась пятерка лидеров, но набирают популярность “библейские” имена — Марк, Матвей и Лев.
У девочек с 4-го на 10-е место переместилась “Анастасия”, из пятерки ее вытеснила “Алиса”. По странному совпадению, становится популярным еще одно “библейское” имя — “Ева”.
Постепенно растет и количество непривычных для Москвы традиционных исламских имен. За пять лет их доля выросла в 2 раза, с 2,5 до 5%.
В 2015 около 2 тыс. девочек назвали такими именами как Фатима, Медина, Саида, в 2020 — уже 3,3 тыс.
Мальчиков с именами Сайд, Сулейман, Мухаммед стало в 2,5 раза больше: в 2015 редкие имена получили 1,3 тыс. мальчиков, в 2020 — 3 тыс.
В большинстве случаев месяц рождения не влияет на выбор имени*. За исключением двух мужских имен — Ильи и Льва. Мальчиков с этими именами появляется заметно больше в августе.
У девочек таких ярких аномалий нет. Разве Ксений рождается чуть больше в феврале, а Викторий — в мае.
*Анализировались 20 самых популярных мужских и женских имен.
Методология:
1. Датасеты взяты с портала открытых данных Москвы.
Датасеты содержат данные о 100 самых популярных именах девочек и мальчиков по месяцам с января 2015 года. Соответственно, часть самых редких имен в датасет не попали.
2. В датасетах есть небольшое количество ошибок и опечаток, но главная проблема — непоследовательность. В основном, варианты имен считаются отдельно (“София” и “Софья”), но иногда вместе (“София, Софья”).
Возможно из-за этого часть вариантов редких имен осталась за рамками.
3. Данные об общем количестве младенцев взяты из статистики Росстата.
4. Традиционные исламские имена — с арабскими корнями. Из-за особенностей датасета были взяты только те имена, которые попадали в топ-100 все пять лет.
5. Сезонные аномалии смотрел по 20 самым популярным именам (дальше нет смысла, слишком маленькие значения). Смотрел на дисперсию и выбросы.
Папка с доработанными датасетами на Гугл.Диске.