Участник:EvgSokolov/Песочница
Материал из MachineLearning.
| Строка 1: | Строка 1: | ||
== Вычисление концентрации с помощью контрольных проб ==  | == Вычисление концентрации с помощью контрольных проб ==  | ||
| - | Известно, что пробы на   | + | Известно, что пробы на ДНК-микрочипах бывают двух типов: целевые, предназначенные для определения концентрации РНК определенных генов в растворе, и «spike-in»-пробы, комплементарные к последовательностям, отсутствующим в ДНК исследуемого организма. Как правило, «spike-in»-РНК добавляется в раствор в известных концентрациях, и эту информацию можно использовать для настройки модели интенсивности.  | 
Для использования данного метода необходимо несколько чипов с одинаковыми концентрациями целевой РНК и различными известными концентрациями «spike-in»-РНК.  | Для использования данного метода необходимо несколько чипов с одинаковыми концентрациями целевой РНК и различными известными концентрациями «spike-in»-РНК.  | ||
Версия 10:17, 3 ноября 2011
Вычисление концентрации с помощью контрольных проб
Известно, что пробы на ДНК-микрочипах бывают двух типов: целевые, предназначенные для определения концентрации РНК определенных генов в растворе, и «spike-in»-пробы, комплементарные к последовательностям, отсутствующим в ДНК исследуемого организма. Как правило, «spike-in»-РНК добавляется в раствор в известных концентрациях, и эту информацию можно использовать для настройки модели интенсивности.
Для использования данного метода необходимо несколько чипов с одинаковыми концентрациями целевой РНК и различными известными концентрациями «spike-in»-РНК.
Рассматривается модель Ленгмюра, описывающая зависимость интенсивности свечения пробы от концентрации РНК:
,
где  — номер микрочипа, 
 — номер набора проб, 
 — номер пробы в наборе, 
 — интенсивность свечения пробы, 
 — абсолютная концентрация РНК, соответствующей 
-му гену 
-го микрочипа (концентрация зависит от номера чипа только в том случае, если рассматривается «spike-in»-проба), 
 — логарифмически нормальная случайная величина с нулевым средним; 
 — параметры модели.
Предполагается, что параметры описываются следующей линейной моделью:
,
где  — число нуклеотидов типа A, C и G соответственно на пробе 
 набора 
.
Концентрации РНК восстанавливаются следующим образом:
-  Так как для «spike-in»-проб известны и интенсивности 
, и концентрации
, то с их помощью можно найти оценки
для параметров модели. Это делается с помощью нелинейной регрессии, минимизирующей сумму квадратов ошибок модели (1).
 -  Полученные оценки 
подставляются в модель (2), после чего с помощью линейной регрессии оцениваются параметры
и
.
 -  Найденные на предыдущем шаге оценки для параметров 
и
используются для вычисления
для целевых проб (на шаге 1 эти параметры были найдены только для «spike-in»-проб).
 -  Концентрация 
-го целевого гена восстанавливается путем минимизации функционала
 

