Центр демографических исследований

Российской экономической школы

О курсе «Основы статистического анализа в демографии»

Курс посвящен методам статистического анализа демографических данных. В курсе будут представлены методы как классической, так и современной математической статистики, реализуемые  на стандартном для демографии языке программирования R, к программной среде которого имеется свободный доступ. Теоретические результаты будут проиллюстрированы на основе многочисленных демографических примеров.

Преподаватель:

Трифон И. Мисов (Max Planck Institute for Demographic Research, Germany)

Курс дает возможность

- ознакомиться с классическими и современными методами статистического анализа демографических данных

- получить практический опыт применения этих методов на широко используемом в демографических исследованиях языке программирования R для решения конкретных научно-практических задач

- научиться интерпретировать полученные количественные результаты

Содержание курса

Цель данного курса – ознакомить слушателей с наиболее часто применяемыми методами для статистического анализа демографических данных.

Как статистически правильно сравнить режимы смертности разных лет? Как исследовать динамику неплодовитости по времени? Как оценить вероятность зачатия для курящих и некурящих женщин? Как оценить интенсивность заболевания раком в зависимости от различных факторов? Какова вероятность вступить в брак в том или ином возрасте? Ответы на эти и другие важные вопросы – как на теоретические, так и прикладные темы – даются после корректного применения статистических методов, которым посвящен данный курс.

Курс состоит из трех частей. Первая из них служит введением в анализ демографических данных. Даются ответы на вопросы о том, какие бывают демографические данные, как проводить их предварительный описательный анализ, какие параметры необходимо оценивать.

Вторая часть посвящена методам классической математической статистики, с помощью которой оцениваются вероятности наступления и интенсивности демографических событий. Основной акцент делается на разъяснение применения метода максимального правдоподобия (ММП).

Третья часть курса затрагивает анализ выживаемости (Survival Analysis), с помощью которого оценивается наступление демографических событий во времени. Будет рассказано об особенностях данных типа выживаемости и о том, почему для их анализа нужно применять методы неклассической статистики. Затем будут представлены методы параметрического и непараметрического оценивания режимов выживания и их практическое применение. В конце будет разобрано статистическое оценивание с учетом ненаблюдаемой неоднородности и его применение при изучении смертности.

Основная литература

1. Agresti A., and B. Finlay (2009). Statistical Methods for the Social Sciences. 4th edition. Pearson Prentice Hall.

2. Rodriguez, G.. Lecture Notes: http://data.princeton.edu/wws509/notes/

3. Klabfleisch, J.D., and R.L. Prentice (1980). The Statistical Analysis of Failure Time Data. New York: Wiley.

Программа курса «Основы статистического анализа в демографии»

I. Введение: демографические данные и общая постановка их статистического анализа

II. Статистический анализ вероятности наступления и интенсивности демографических событий

1. Дескриптивная статистика в R: предварительный анализ данных

2. Статистические модели как механизмы генерирования данных. Применение теории вероятностей в задачах демографии и эпидемиологии

3. Параметрические статистические модели: оценивание методом  максимального правдоподобия

4. Примеры применения метода максимального правдоподобия в демографических моделях:

            a) возрастные коэффициенты смертности: биномиальная модель

            b) плодовитость: геометрическая модель

            c) число смертей: пуассоновская модель

5. Регрессионные параметрические статистические модели:

            a) использование противозачаточных средств: логистическая регрессия

b) заболеваемость раком: пуассоновская регрессия

III. Введение в статистический анализ данных типа времени жизни (анализ выживаемости)

            1. Особенности данных типа времени жизни: цензурирование

            2. Примеры параметрических моделей:

                       a) модель Вейбулля

                       b) человеческая смертность: модель Гомперца

            3. Непараметрические модели: оценка Каплана-Майера и регрессия Кокса.

            4. Ненаблюдаемая неоднородность в данных по смертности: модели уязвимости