Московский семинар по биоинформатике - 14 января 2016

Четверг, 14 января 2016, 18.00
МГУ, Лаб. корпус Б (факультет биоинженерии и биоинформатики), к. 221.

Дмитрий Колобков
Институт системной биологии, Москва

Идентификация параметров математической модели по гетерогенному набору экспериментальных данных
 

Идентификация параметров математической модели заключается в получении их точечной и доверительной оценки. Первая показывает значения параметра, при котором модель лучше всего (в том или ином смысле) описывает экспериментальные данные. Вторая показывает вариабельность точечной оценки при условии независимого повторения экспериментов. В работе рассматривается точечная оценка (ОМП), полученная методом максимального правдоподобия, и доверительные оценки, полученные разными асимптотическими методами, которые сравниваются между собой.

В работе рассмотрены доверительные оценки трех видов: доверительные интервалы для одного параметра, доверительные области для вектора параметров и доверительные полосы для скалярной функции от вектора параметров. Точные методы построения доверительных оценок изучены слабо и сложны в реализации; приближения (например, численное интегрирование), неизбежные при реализации этих алгоритмов, приводят к значительному снижению точности. В связи с этим на практике применяются асимптотические методы, чья точность падает с уменьшением мощности набора экспериментальных данных. В работе рассматриваются и сравниваются четыре метода доверительного оценивания. Первый метод основан на линеаризации модели и предполагает, что стандартизованная ОМП (для вектора параметров) распределена по Стьюденту. Второй метод основан на обращении статистики F-теста и предполагает, что некоторая функция от ОМП распределена по Фишеру. Третий метод основан на обращении статистики теста отношения правдоподобий. Четвертый метод использует бутстреппинг для описания распределения ОМП.

Гетерогенные экспериментальные данные – данные, полученные в результате различных экспериментов с различно распределенной экспериментальной ошибкой – усложняют поставленную задачу. В частности, широко известное решение задачи поиска оценки максимального правдоподобия методом наименьших квадратов перестает работать. Разработанная методология предполагает использование гетерогенных экспериментальных данных.

Дизайн эксперимента используется для постановки эксперимента, который даст больше информации о модели при прежней затрате ресурсов. Новый подход к моделированию подразумевает не единовременную трату всех экспериментальных ресурсов, а цикличное выполнение последовательности этапов: эксперимента, оценки параметров и дизайна эксперимента. Ключевой вопрос дизайна эксперимента – выбор критерия оптимальности. Многие критерии оптимальности используют доверительные оценки. Так, популярный D-оптимальный критерий, предполагающий максимизацию определителя матрицы информации, сводится к задаче минимизации объема доверительного эллипсоида – доверительной области, построенной методом, основанным на линеаризации модели. В работе предлагаются альтернативные оптимальные критерии, использующие доверительные оценки, полученные методом, основанным на тесте отношения правдоподобий.