Биологический факультет СПбГУ

Математические методы в биологии



ПРОГРАММА КУРСА

Основные предпосылки внедрения и распространения математических методов в биологических исследованиях. Математизация как введение стандартного языка; математические методы - инструмент исследования и анализа.

Этапы биологического исследования и соответствующие математические методы. Постановка и формулирование задачи исследования в биологических и математических понятиях, подбор адекватного метода анализа ожидаемых результатов и планирование эксперимента (наблюдения). Анализ результатов, представление их в наглядном виде, интерпретация и - корректировка плана дальнейшего исследования (и анализа).

Виды биологических задач. Сравнение и группировка объектов; различение и разделение групп; определение места объекта (группы) в ранее описанной системе (идентификация). Взаимосвязи и зависимости; особенности анализа процессов.

Разделение признаков (переменных) на независимые - факторы и зависимые - "отклики"; качественные и количественные характеристики. Влияние на характер анализа особенностей представления признаков. Производные "вторичные" признаки (индексы, главные компоненты и др.).

Множественное сравнение и его особенности. Основы дисперсионного анализа; его отличия и преимущества перед попарным сравнением. Требования к исходным данным для одно- и многофакторного комплекса; влияние отклонений. Трансформация данных; преобразование неравномерных комплексов. Иерархическая модель дисперсионного анализа, ее особенности. Схема с «повторными измерениями».

Оценка и интерпретация результатов дисперсионного анализа. Планирование многофакторного дисперсионного анализа по полной и сокращенной схеме; греколатинский квадрат.

Многомерные (многопризнаковые) описания, задачи а/отбора признаков и/или сжатия информации для удобства ее представления, б/ исследования структуры связей и зависимостей в комплексе признаков.

Корреляционный анализ. Различные меры связи; нелинейность и способы линеаризации. Анализ системы связей: корреляционные плеяды П.В.Терентьева. Графический способ представления и анализа результатов: максимальный корреляционный путь (=минимальное покрывающее дерево), сечения корреляционного цилиндра, дендрограммы и дендриты (графы).

Сравнение корреляционных матриц по уровню и структуре связей. Уровни организации биологических систем и связи между их элементами. Изменчивость и детерминированность признаков; сила связи и ее стабильность.

Основы факторного анализа; факторы - скрытые переменные. Порядок вычислений в центроидном методе. Специфика анализа главных компонент. Новые переменные - факторы, их использование. “Идеальная структура” и ротация факторов. Интерпретация и графическое представление результатов. Ограниченность факторного анализа (линейная модель, аддитивность переменных). Факторный анализ как этап исследования (оценка набора признаков, группировка признаков и объектов и пр.). Ротация факторов. R и Q-техника факторного анализа.

Регрессионный анализ. Планирование регрессионного эксперимента; размах значений независимой переменной, количество и расположение интервалов. Общие требования при анализе эмпирических зависимостей (Г.Г. Винберг, 1980).

Особые случаи регрессионного анализа: исследование роста и размножения (аллометрия, экспонента, логистическая кривая и пр.), анализ кривых "доза-эффект". Пробит-анализ, его преимущества. Множественная регрессия.

Ряды динамики (=временные ряды). Основные компоненты рядов динамики, их выделение. Оценка случайности последовательных значений. Сглаживание временных рядов. Автокорреляция и кросскорреляция.

Многомерные описания.

Группировка многомерных описаний. Разграничение групп при трансгрессии по отдельным признакам. Принципы дискриминантного анализа. Нахождение и использование дискриминантной функции. Возможность использования аналогичных методов для многих групп. Канонический анализ. Деревья классификации.

Количественные методы классификации. Таксономические и экологические задачи классификации, их особенности. Использование количественного и альтернативного предcтавления данных. Основные этапы анализа. Наиболее употребительные меры сходства, их специфика. Особенности несимметричных и корреляци¬онных мер. Методы классификации при равном и неравном весе признаков: таксономический анализ Е.С.Смирнова, "нумерическая таксономия"(Sokal, Sneath); филогенетические методы: клади¬стический анализ (Wagner, Hennig, Farris).

Классификация и ординация, "нечеткие множества" (A.Zade). Кластеры и группировки с "захождением". Анализ матриц сходства. Простейшие алгоритмы группировки (кластеризации): метод ближайшего соседа, метод группового среднего. Определение "порога" при группировке; зависимость выбора процедуры и результатов от объективной дискретности групп, их объема и отношений между группами; компактность групп, их отдаленность и наличие переходов (дистинктность и транзитность по С.Ф.Колодяжному). Графическое представление результатов.

Анализ формы и ее изменчивости – «геометрическая морфометрия». Основные принципы (Bookstein, Zelditch). Область применения.

Методы “ресамплинга”. Применение для оценки в нестандартных ситуациях и для характеристик, не имеющих статистического обоснования. Jackknife, bootstrap, тест Mantel’я.

МАТЕРИАЛЫ К ЛЕКЦИЯМ


Обзор

Повтор пройденного

Дисперсионный анализ.

Компонентный анализ.

Регрессионный анализ

Классификация



Сравнение матриц


ПРАКТИЧЕСКИЕ ЗАНЯТИЯ


Редактирование

Занятие 1

Занятие 2

Занятие 3

Занятие 4-1

Занятие 4-2

Занятие 5

Книги, помещенные на ftp-сервере факультета (ftp.bio.pu.ru)

Список литературы:

Урбах В.Ю. Статистический анализ в биологических и медицинских исследованиях, М, 1975.
Бейли Н. Математика в биологии и медицине, М, 1970.
Ефимов В.М., В.Ю.Ковалева Многомерный анализ биологических данных. 2008. СПб. (изд.2, исправленное и дополненное). 86 с.

Дисперсионный анализ:
Рокицкий П.Ф. Биологическая статистика (любое издание кроме первого), гл.8
Снедекор Дж. У. Статистические методы в применении к исследованиям в сельском хозяйстве и биологии. М. 1961.
Шеффе Г. Дисперсионный анализ. М, 1980.
Аптон Г. Анализ таблиц сопряженности. М. 1982

Факторный анализ:
Окунь Я. Факторный анализ. М, 1974.
Лиепа И.Я. Матем.методы в биол.исследованиях.Рига,1980.
Иберла К. Факторный анализ. М, 1980

Регрессионный анализ:
Шмидт В.М. Математические методы в ботанике. Л, 1984 гл.6, §2-3
Урбах В.Ю. (см.выше) гл. 8-9.
Алимов А.Ф. Введение в продукционную гидробиологию.Л,1989.
Дрейпер Н.,Смит Г. Прикладной регрессионный анализ.М,1973
Винберг Г.Г. Условия корректного применения в биологии элементарных эмпирических формул. Колич. методы в экологии животных, Л., 1980, с.34-36

Ряды динамики:
Лакин Г.Ф. Биометрия. М, 1968, гл.7.
Кендалл Дж. Временные ряды. М, 1981

Дискриминантный анализ:
Урбах В.Ю. (см.выше) гл. 10

Классификация:
Дюран Б., Оделл П. Кластерный анализ. М, 1977.
Андреев В.Л. Классификационные построения в экологии и систематике. М, 1980.
Андреев В.Л. Анализ эколого-географических данных с использованием теории нечетких множеств. Л, 1987.
Павлинов И.Я. Методы кладистики. М, 1989

Планирование
Урбах В.Ю. (см.выше), гл.1
Налимов В.Б. Теория эксперимента. М, 1971.
Монтгомери Л.К. Планирование эксперимента и анализ дан¬ных. Л, 1980.

Анализ формы
Zelditch M. et al. “Geometric morphometrics for biologists” 2003: 444 pp

Методы “ресамплинга”
Efron B., Tibshirani R.. “An introduction to the bootstrap”. 1998




© Биологический факультет СПбГУ, 2006-2011