Фоновая поправка в анализе ДНК-микрочипов

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
Фоновая поправка - важный предварительный этап в анализе [[ДНК-микрочип]]ов. Его необходимость связана с наличием таких мешающих факторов, как шум оптической системы распознавания и неспецифическая гибридизация.
Фоновая поправка - важный предварительный этап в анализе [[ДНК-микрочип]]ов. Его необходимость связана с наличием таких мешающих факторов, как шум оптической системы распознавания и неспецифическая гибридизация.
== Ideal mismatch ==
== Ideal mismatch ==
-
Изначально для анализа фонового эффекта была разработана система так называемых PM-MM проб. Помимо нуклеотидных зондов, в точности соответствующих последовательности каждого рассматриваемого гена (Perfect Match probes), на микрочипах Affymetrix GeneChip размещались зонды, в которых средний (тринадцатый) олигонуклеотид был заменён на комплементарный (Missmatch probe). Предполагалось, что по интенсивности MM-проб можно будет оценить эффект неспецифической гибридизации и вычесть его из интенсивности PM-проб. Этот подход сразу же продемонстрировал свою несостоятельность - было показано, что в среднем для ДНК-микрочипа интенсивность около 30% MM-проб превышает интенсивность соответствующих им PM-проб<ref name="notMM">Naef F, Lim DA, Patil N, Magnasco MO. From features to expression: High-density oligonucleotide array analysis revisited. 2001. http://arxiv.org/abs/physics/0102010/.</ref>. Из-за этого вычитание интенсивностей MM-проб приводит к бессмысленному результату, поскольку экспрессия гена оказывается отрицательной.
+
Изначально для анализа фонового эффекта была разработана система так называемых PM-MM проб. Помимо нуклеотидных зондов, в точности соответствующих последовательности каждого рассматриваемого гена (Perfect Match probes), на микрочипах Affymetrix GeneChip размещались зонды, в которых средний (тринадцатый) олигонуклеотид был заменён на комплементарный (Mismatch probe). Предполагалось, что по интенсивности MM-проб можно будет оценить эффект неспецифической гибридизации и вычесть его из интенсивности PM-проб. Этот подход сразу же продемонстрировал свою несостоятельность - было показано, что в среднем для ДНК-микрочипа интенсивность около 30% MM-проб превышает интенсивность соответствующих им PM-проб<ref name="notMM">Naef F, Lim DA, Patil N, Magnasco MO. From features to expression: High-density oligonucleotide array analysis revisited. 2001. http://arxiv.org/abs/physics/0102010/.</ref>. Из-за этого вычитание интенсивностей MM-проб приводит к бессмысленному результату, поскольку экспрессия гена оказывается отрицательной.
Чтобы нейтрализовать этот эффект, компанией Affymetrix была разработана концепция Ideal Mismatch<ref name="affIM">Affymetrix. Statistical algorithms reference guide. Technical report, Affymetrix, Santa Clara, CA, 2001.</ref>. Идея заключается в том, чтобы делать обычную PM-MM коррекцию там, где это возможно, а в остальных случаях вычитать из интенсивности PM-проб некоторую величину, меньшую интенсивности MM-проб. Для каждого множества проб, соответствующих одному участку ДНК, вычисляется значение специфической фоновой интенсивности <tex>SB</tex>, представляющее собой устойчивое к выбросам среднее по каждой паре проб в множестве логарифмов отношений PM-интенсивностей к MM-интенсивностям. Если <tex>i</tex> - номер пробы, а <tex>k</tex> - номер подмножества проб, то фоновый эффект оценивается следующим выражением:
Чтобы нейтрализовать этот эффект, компанией Affymetrix была разработана концепция Ideal Mismatch<ref name="affIM">Affymetrix. Statistical algorithms reference guide. Technical report, Affymetrix, Santa Clara, CA, 2001.</ref>. Идея заключается в том, чтобы делать обычную PM-MM коррекцию там, где это возможно, а в остальных случаях вычитать из интенсивности PM-проб некоторую величину, меньшую интенсивности MM-проб. Для каждого множества проб, соответствующих одному участку ДНК, вычисляется значение специфической фоновой интенсивности <tex>SB</tex>, представляющее собой устойчивое к выбросам среднее по каждой паре проб в множестве логарифмов отношений PM-интенсивностей к MM-интенсивностям. Если <tex>i</tex> - номер пробы, а <tex>k</tex> - номер подмножества проб, то фоновый эффект оценивается следующим выражением:
Строка 12: Строка 12:
Итоговое значение интенсивности для PM-проб с учётом фоновой поправки получается вычитанием из исходных значений интенсивностей PM-проб соответствующей им величины <tex>IM</tex>.
Итоговое значение интенсивности для PM-проб с учётом фоновой поправки получается вычитанием из исходных значений интенсивностей PM-проб соответствующей им величины <tex>IM</tex>.
-
== RMA ==
+
== RMA-свёртка ==
 +
Данный метод фоновой коррекции является частью комплекса RMA методов для предобработки данных ДНК-микрочипов <ref name="RMA"> Irizarry RA, Hobbs B, Collin F, et al. Exploration, normalization, and summaries of high density oligonucleotide array probe level data. Biostatistics. 2003;4(2):249-64. Available at: http://www.ncbi.nlm.nih.gov/pubmed/12925520.</ref>. Используются только данные PM-проб. Значения интенсивности по ним корректируются отдельно по каждому микрочипу с использованием следующей модели распределения интенсивностей проб. Нескорректированное значение интенсивности <tex>Y</tex> представляется в виде суммы нормально распределённого шума <tex>B</tex> со средним <tex>\mu</tex> и дисперсией <tex>\sigma^2</tex> и экспоненциально распределённого сигнала <tex>S</tex> со средним значением <tex>\alpha</tex>. Чтобы исключить возможность получения отрицательных значений интенсивности, рассматривается только неотрицательная часть нормального распределения. Корректировка производится согласно следующей формуле: <br /><tex>E\left(S\left|Y=y\right.\right)=a + b \frac{\phi\left(\frac{a}{b}\right)-\phi\left(\frac{y-a}{b}\right)} {\Phi\left(\frac{a}{b}\right) - \Phi\left(\frac{y-a}{b}\right) -1},</tex><br />
 +
где <tex>a=s-\mu-\sigma^2\alpha,</tex> <tex>b=\sigma</tex>, <tex>\Phi</tex> и <tex>\phi</tex> - соответственно функция распределения и плотность стандартного нормального распределения.
 +
 
== MAS 5.0 ==
== MAS 5.0 ==
[[Категория:Биоинформатика]]
[[Категория:Биоинформатика]]
{{Stub}}
{{Stub}}

Версия 11:48, 11 мая 2010

Фоновая поправка - важный предварительный этап в анализе ДНК-микрочипов. Его необходимость связана с наличием таких мешающих факторов, как шум оптической системы распознавания и неспецифическая гибридизация.

Ideal mismatch

Изначально для анализа фонового эффекта была разработана система так называемых PM-MM проб. Помимо нуклеотидных зондов, в точности соответствующих последовательности каждого рассматриваемого гена (Perfect Match probes), на микрочипах Affymetrix GeneChip размещались зонды, в которых средний (тринадцатый) олигонуклеотид был заменён на комплементарный (Mismatch probe). Предполагалось, что по интенсивности MM-проб можно будет оценить эффект неспецифической гибридизации и вычесть его из интенсивности PM-проб. Этот подход сразу же продемонстрировал свою несостоятельность - было показано, что в среднем для ДНК-микрочипа интенсивность около 30% MM-проб превышает интенсивность соответствующих им PM-проб[1]. Из-за этого вычитание интенсивностей MM-проб приводит к бессмысленному результату, поскольку экспрессия гена оказывается отрицательной.

Чтобы нейтрализовать этот эффект, компанией Affymetrix была разработана концепция Ideal Mismatch[1]. Идея заключается в том, чтобы делать обычную PM-MM коррекцию там, где это возможно, а в остальных случаях вычитать из интенсивности PM-проб некоторую величину, меньшую интенсивности MM-проб. Для каждого множества проб, соответствующих одному участку ДНК, вычисляется значение специфической фоновой интенсивности SB, представляющее собой устойчивое к выбросам среднее по каждой паре проб в множестве логарифмов отношений PM-интенсивностей к MM-интенсивностям. Если i - номер пробы, а k - номер подмножества проб, то фоновый эффект оценивается следующим выражением:

IM_i^{(k)} = \left\{MM_i^{(k)}, \:\:\: MM_i^{(k)}<PM_i^{(k)},\\ \frac{PM_i^{(k)}}{2^{SB_k}}, \:\:\: MM_i^{(k)}\geq PM_i^{(k)}, \: SB_k>\tau_c, \\ \frac{PM_i^{(k)}}{2^{\tau_c/(1+(\tau_c-SB_k)/\tau_s)}}, \:\:\: MM_i^{(k)}\geq PM_i^{(k)}, \: SB_k\leq\tau_c. \right.
Здесь \tau_c и \tau_s - настраиваемые параметры: \tau_c - константа различия со значением по умолчанию 0.03, \tau_s - константа масштабирования со значением по умолчанию 10. Итоговое значение интенсивности для PM-проб с учётом фоновой поправки получается вычитанием из исходных значений интенсивностей PM-проб соответствующей им величины IM.

RMA-свёртка

Данный метод фоновой коррекции является частью комплекса RMA методов для предобработки данных ДНК-микрочипов [1]. Используются только данные PM-проб. Значения интенсивности по ним корректируются отдельно по каждому микрочипу с использованием следующей модели распределения интенсивностей проб. Нескорректированное значение интенсивности Y представляется в виде суммы нормально распределённого шума B со средним \mu и дисперсией \sigma^2 и экспоненциально распределённого сигнала S со средним значением \alpha. Чтобы исключить возможность получения отрицательных значений интенсивности, рассматривается только неотрицательная часть нормального распределения. Корректировка производится согласно следующей формуле:
E\left(S\left|Y=y\right.\right)=a + b \frac{\phi\left(\frac{a}{b}\right)-\phi\left(\frac{y-a}{b}\right)} {\Phi\left(\frac{a}{b}\right) - \Phi\left(\frac{y-a}{b}\right) -1},
где a=s-\mu-\sigma^2\alpha, b=\sigma, \Phi и \phi - соответственно функция распределения и плотность стандартного нормального распределения.

MAS 5.0

Личные инструменты