О курсе «Основы статистического анализа в демографии»
Курс посвящен методам статистического анализа демографических данных. В курсе будут представлены методы как классической, так и современной математической статистики, реализуемые на стандартном для демографии языке программирования R, к программной среде которого имеется свободный доступ. Теоретические результаты будут проиллюстрированы на основе многочисленных демографических примеров.
Преподаватель:
Трифон И. Мисов (Max Planck Institute for Demographic Research, Germany)
Курс дает возможность
- ознакомиться с классическими и современными методами статистического анализа демографических данных
- получить практический опыт применения этих методов на широко используемом в демографических исследованиях языке программирования R для решения конкретных научно-практических задач
- научиться интерпретировать полученные количественные результаты
Содержание курса
Цель данного курса – ознакомить слушателей с наиболее часто применяемыми методами для статистического анализа демографических данных.
Как статистически правильно сравнить режимы смертности разных лет? Как исследовать динамику неплодовитости по времени? Как оценить вероятность зачатия для курящих и некурящих женщин? Как оценить интенсивность заболевания раком в зависимости от различных факторов? Какова вероятность вступить в брак в том или ином возрасте? Ответы на эти и другие важные вопросы – как на теоретические, так и прикладные темы – даются после корректного применения статистических методов, которым посвящен данный курс.
Курс состоит из трех частей. Первая из них служит введением в анализ демографических данных. Даются ответы на вопросы о том, какие бывают демографические данные, как проводить их предварительный описательный анализ, какие параметры необходимо оценивать.
Вторая часть посвящена методам классической математической статистики, с помощью которой оцениваются вероятности наступления и интенсивности демографических событий. Основной акцент делается на разъяснение применения метода максимального правдоподобия (ММП).
Третья часть курса затрагивает анализ выживаемости (Survival Analysis), с помощью которого оценивается наступление демографических событий во времени. Будет рассказано об особенностях данных типа выживаемости и о том, почему для их анализа нужно применять методы неклассической статистики. Затем будут представлены методы параметрического и непараметрического оценивания режимов выживания и их практическое применение. В конце будет разобрано статистическое оценивание с учетом ненаблюдаемой неоднородности и его применение при изучении смертности.
Основная литература
1. Agresti A., and B. Finlay (2009). Statistical Methods for the Social Sciences. 4th edition. Pearson Prentice Hall.
2. Rodriguez, G.. Lecture Notes: http://data.princeton.edu/wws509/notes/
3. Klabfleisch, J.D., and R.L. Prentice (1980). The Statistical Analysis of Failure Time Data. New York: Wiley.
Программа курса «Основы статистического анализа в демографии»
I. Введение: демографические данные и общая постановка их статистического анализа
II. Статистический анализ вероятности наступления и интенсивности демографических событий
1. Дескриптивная статистика в R: предварительный анализ данных
2. Статистические модели как механизмы генерирования данных. Применение теории вероятностей в задачах демографии и эпидемиологии
3. Параметрические статистические модели: оценивание методом максимального правдоподобия
4. Примеры применения метода максимального правдоподобия в демографических моделях:
a) возрастные коэффициенты смертности: биномиальная модель
b) плодовитость: геометрическая модель
c) число смертей: пуассоновская модель
5. Регрессионные параметрические статистические модели:
a) использование противозачаточных средств: логистическая регрессия
b) заболеваемость раком: пуассоновская регрессия
III. Введение в статистический анализ данных типа времени жизни (анализ выживаемости)
1. Особенности данных типа времени жизни: цензурирование
2. Примеры параметрических моделей:
a) модель Вейбулля
b) человеческая смертность: модель Гомперца
3. Непараметрические модели: оценка Каплана-Майера и регрессия Кокса.
4. Ненаблюдаемая неоднородность в данных по смертности: модели уязвимости