Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- \documentclass[a4paper,7pt]{article}
- \usepackage{graphicx}
- \usepackage{ragged2e}
- \usepackage{setspace}
- \usepackage{wrapfig}
- \usepackage{lettrine}
- \usepackage[utf8]{inputenc}
- \usepackage[macedonian]{babel}
- \usepackage[T1]{fontenc}
- \usepackage{multicol}
- \usepackage{flowfram}
- \usepackage{microtype}
- \setlength{\parskip}{0pt}
- \usepackage{color}
- \setlength{\columnseprule}{1pt}
- \def\columnseprulecolor{\color{black}}
- \usepackage[a4paper,top=0cm,bottom=5cm,left=1cm,right=1cm,marginparwidth=1.75cm]{geometry}
- \usepackage{amsmath}
- \usepackage{graphicx}
- \usepackage[colorinlistoftodos]{todonotes}
- \usepackage[colorlinks=true, allcolors=blue]{hyperref}
- \usepackage{amsmath}
- \usepackage{abstract}
- \usepackage{parcolumns}
- \renewcommand{\abstractname}{} % clear the title
- %-------------------------
- \usepackage{fancyhdr}
- \pagestyle{fancy}
- \lhead{Методологии на истражувањето во ИКТ \\*
- - обработка на статија -}
- \rhead{Страна \thepage}
- \cfoot{Факултет за информатички науки и компјутерско инженерство - Скопје, јануари 2018\\*\copyrightХристијан Јорданов 143190}
- \renewcommand{\headrulewidth}{0.4pt}
- \renewcommand{\footrulewidth}{0.4pt}
- \newenvironment{myindentpar}[1]%
- {\begin{list}{}%
- {\setlength{\leftmargin}{#1}}%
- \item[]%
- }
- {\end{list}}
- %-------------------------------
- \title{\flushleft\textbf{Колективен пат на метастазите: \\Седишта со кластери на туморските клетки}}
- \author{Kevin J. Cheung and Andrew J. Ewald}
- \date{\vspace{-3ex}}
- \begin{document}
- \begin{parcolumns}[colwidths={1=.65\textwidth,1=.5\textheight},rulebetween=true]{2}
- \colchunk{% left column
- \sloppy
- \justify\small
- \maketitle
- {И покрај децениското истражување, сè уште постојат многу неодговорени прашања за метастазите, процесот со кој се локализира ракот кој пак се смета како системска болест. Едно од овие прашања е природата на туморските клетки кои предизвикуваат метастази. Иако конвенционалните модели укажуваат на тоа дека метастазите се заситени од единечни клетки од примарниот тумор, постои сè поголем доказ дека сеењето бара колективно дејство на туморските клетки кои патуваат заедно во кластери. Овде, ги разгледуваме овие докази, кои произлегуваат од анализата на двете експериментални модели и примероци на пациенти. Презентираме модел на метастатска дисеминација која ги нагласува активностите на кластерите на туморските клетки кои ги задржуваат и бараат нивните епителски својства.} \linebreak
- }
- \small\colchunk{% right column
- {во споредба со присуството на единечни КТЦ (8, 9). Нивната прогностичка вредност е во согласност со хипотезата дека кластерите на туморските клетки даваат посебен придонес во метастазата.
- Ако метастатското семе е единствена канцерогена клетка, тогаш туморот кој произлегува ќе биде клонален. Односно, ако семето е CTC кластер, тогаш метастазата што може да настане може да биде поликлонална од самиот почеток. Длабоко секвенционираната анализа на тумори овозможува реконструкција на еволутивните истории на клонови на клеточни клетки за време на метастатската прогресија. Овие еволуционистички истории може да се користат за да се заклучи моноклонална наспроти поликлонално сеење. Една неодамнешна студија за пациенти со рак на простата открила докази за чести поликлонални сеења од примарниот тумор до секундарните места и поликлоналното ширење на постоечките метастази на нови места во телото (11). Оваа опсервација се појавува во контекст на проширена литература за фенотипска}
- }
- \end{parcolumns}
- \begin{myindentpar}{0cm}
- \begin{multicols}{3}
- \small\lettrine[lines=3, findent=0em, slope=0em]{M }
- { }етастазата е комплексен, повеќестепен процес при кој што клетките на ракот се одвојуваат од примарниот тумор, за да мигрираат низ соседното ткиво, да пристапуваат и да патуваат низ васкулатурата, а потоа да преживеат и да се размножуваат во далечните органи (1, 2). Постојат и дополнителни предизвици при канцерогените заболувања поради зрелите епителни клетки од кои што тие потекнуваат кои се вообичаено поларизирани и неподвижни. Всушност, метастазите претставуваат впечатливи дивергенции од нивното хомеостатско својство.Сепак, епителните ткива се високо динамични и миграторни за време на развојот и репарирањето на ткивата (3), а епителните клетки можат да стекнат мезенхимални со молекуларни карактеристики и во развојните и болестите (4). Актуелните терапии не се доволно ефикасни во лекувањето на метастатската болест, па затоа е важно да ги утврдиме клеточните и молекуларните карактеристики на клетките на ракот кои "предизвикуваат" нови тумори во далечните органи. Во оваа перспектива, дискутираме за неодамнешната работа што ја поддржува улогата на кластерите на туморските клетки во метастатското посадување - алтернатива на конвенционалниот став дека метастазите се засејуваат од единечни клетки од примарниот тумор.\\
- \textbf{Кластери на туморските клетки и поликлонално сеење на метастази}\\
- Идејата дека кластерите на туморските клетки придонесуваат за метастази, може да се проследи од 1950-тите, кога беше објавено дека примероците од крв од пациентите заболени од рак содржат и единечни и групирани туморски клетки (2)и дека кластерите на туморските клетки брзо може да ги преминат белите дробови во животинските модели (5). Подоцна беше прикажано дека кластерите на туморските клетки беа поефикасни за разлика од кај единечните клетки при производство на метастази кога интравенозно се инјектирале во глувци (2, 6). Сепак, бидејќи метастазите се познати како неефикасни(2), податоците од овие рани студии се во согласност со две многу различни начини: метастази може да произлезат од помалку ефикасен процес на сеење со изобилство на одделни клетки или од поефикасен процес на сеење на ретки кластери. Неодамнешните технолошки достигнувања ја револуционизираа нашата способност да ги квантифицираме циркулационите туморски клетки (CTCs) и CTC кластерите и да ги утврдиме нивните молекуларни својства кај различни типови на тумори (7-10). Во две такви студии, присуството на CTC кластерите било поврзано со значително полоши клинички исходи како\\
- \includegraphics[height=6cm, width=6cm]{1}
- \includegraphics[height=6cm, width=6cm]{2}\\
- и генотипска разновидност во рамките на примарните тумори и зголемена проценка на соработничката и конкурентната динамика кај клоновите на клетките на ракот (12). Овие студии укажуваат на тоа дека различните клонални комбинации во кластерот би можеле да имаат многу различни својства во однос на растот и / или одговорот на терапијата.\\
- Поликлоналните метастази може да се појават на два различни начини: директно сеење со повеќеклеточна кластера или сериска акумулација на повеќе единечни клетки на заедничка локација.Глувчовите моделите се покажаа корисни во разликувањето помеѓу овие два механизми. Клучна карактеристика на овие експерименти е способноста да се формираат примарни тумори кои содржат мешавина од клетки на ракот кои изразуваат флуоресцентни протеини од различни бои (9, 13, 14). Двете единечни клетки и кластери на клетки, составени целосно од иста боја, ќе генерираат обоени метастази (слика 1А). Спротивно на тоа, кластерите составени од повеќе од една боја ќе формираат разноцветни метастази, кои ќе обезбедат директни докази за нивното поликлонално потекло (Слика 1, А и Б). Три независни истражувачки групи спровеле студии за овој дизајн со користење на различни модели на глушец, а сите откриле разнобојни метастази, што е во согласност со концептот дека поликлоналните метастази може да се поплочат од кластери на туморските клетки (9, 13, 14). Првата група формираше шарени тумори кај глувците кај глувци и честопати забележале разнобојни метастази (9). Кога се формирал еднобоен тумор на едната страна на глувчето и поинаку
- \end{multicols}
- \end{myindentpar}
- \includegraphics[width=19cm]{3}
- \maketitle\justify\small
- {\textbf{ Слика 2. Модел за метастатско ширење кој се базира на колективна дисеминација на кластери на епителијални туморски клетки}.Овој модел претпоставува дека примарните туморски клетки напаѓаат, циркулираат и растот на туморот на семето на далечните места како колективни единици и дека овие активности бараат нивно изразување на епителни гени, како што е K14. По пристигнувањето во секундарниот орган (белите дробови), претежно K14 + семето (сино) од примарен карцином на дојка се шири да формира претежно K14-макрометастази (црвено). Понатамошни детали се достапни во (14, 16).}
- \begin{multicols}{3}
- {\textbf{Корепресивни мрежи и кластеринг алгоритми}}
- туморот со еден боја, од друга страна, метастазите биле претежно еднобојни (9). Овој резултат сугерира дека агрегацијата на туморските клетки во крвта или на далечниот орган е неефикасна и, според тоа, мултикоцветите метастази произлегуваат од засејување со кластери на туморските клетки (9). Втората група го прошири концептот за анализа на родот на ракот на панкреасот, каде што е документирано поликлонално сеење од кластери кај глувците и забележани се силни разлики во степенот до кој поликлоналното семе се проширило во клонални или поликлонални метастази во различни органски места (13). Проучувајќи го спонтаниот карцином на дојка кај глувци, третата група беше квантитативно поврзана со степенот на клонално мешање во примарниот тумор со фреквенцијата на откривање на разнобојни метастази, што доведе до проценка дека> 97\% од метастази произлегоа од кластери (14) . Овие три студии, исто така, обезбедија директни докази дека кластерите покажуваат супериорен опстанок и потенцијал за формирање колонија и во културата (14) и in vivo (9, 13, 14). Контролни експерименти во кои различни тумори на боја биле воспоставени на различни локации во глувчето или различни клетки на рак на боја биле инјектирани интравенски во различни периоди ретко или никогаш не давале разноцветни метастази. Затоа, сите три студии даваат податоци за поддршка на концептот дека повеќеклеточната кластера патува како единица од примарниот тумор до оддалечените органи за да ги полицира поликлоналните метастази (Слика 2) (9, 13, 14).\\
- \textbf{Епителни својства на метастатското семе}\\
- Набљудувањата дискутирани по горе покренуваат неколку интересни прашања, вклучувајќи како кластерите на туморските клетки бегаат од примарниот тумор и какви се нивните молекуларни својства додека тие транзитираат на далечната локација. Ќе се фокусираме на ракот на дојката, каде што има значителен напредок во разбирањето на молекуларните својства на туморските клетки, како што тие напаѓаат, шират и патуваат во далечни органи. Карциномите можат да го нападнаат ткивото со помош на колективен начин, како групи на клетки на канцери кои одржуваат барем некои аспекти на епителната клеточна клеточна адхезија (3). Една неодамнешна тридимензионална анализа на стромалната граница на тумори на дојка открила честа колективна инвазија и практично немало само еден качен клетки (15). Овие колективни инвазивни насоки би можеле да ги намалат малите кластери на клетките на ракот за да го полагаат метастатскиот процес. Едноставна почетна точка за валидација на овој модел е да се тестираат молекуларните сличности
- помеѓу клетките на ракот во насоките на колективните инвазии и во подоцнежните фази на метастатското ширење. Се покажа дека клетките на ракот кои водат колективна инвазија имаат заеднички молекуларни својства низ подтиповите на ракот на дојката, како кај моделите на глувци, така и кај туморите на дојките (16). Овие инвазивни клетки на канцер се карактеризираат со нивна експресија на молекуларни маркери на базална епителна диференцијација, вклучувајќи цитокератин 14 (K14), K5, P-cadherin и p63 (16). Клетките во оваа K14 + инвазивна состојба биле забележани во сите фази на дисеминативната ширење-колективна инвазија, локална дисеминација, CTC кластери и микрометастази - но биле ретки во примарниот тумор и кај макрометастазите (14). Овие податоци укажуваат на тоа дека постојат различни епителни молекуларни програми кои го отежнуваат растот и ширењето на туморските клетки (Слика 2). Генската експресија во овие инвазивни лидерски клетки личи на онаа на базалните матични клетки од матични клетки (14). Ова е во согласност со едноклеточната транскриптомска анализа на човечки метастатски клетки за рак на дојка (17), кои покажаа дека дисеминираните клетки на ракот споделуваат профил на изразување на ген за базалните матични клетки во микро-метастази, но предизвикуваат макрометастази составени главно од луминозна клетка на канцер 17). Заедно, овие студии откриваат дека промените во епителната диференцијална состојба ја придружуваат метастатската дисеминација.
- Епителните клетки се карактеризираат со специфични комплекси за интерцелуларна адхезија. Често се смета дека овие спојувања ја попречуваат подвижноста; на тој начин, концептуално е привлечно да се мисли на метастази како транзиторно или трајно губење на епителни карактеристики, преку процес како што е епителна-месенхимална транзиција (ЕМТ) (4). Сепак, неодамнешните студии претставија алтернативен модел во кој комплексите за епителна адхезија играат важна улога во метастатските туморски клетки. Овие студии покажаа дека метастатските клетки на ракот на дојката ја задржуваат експресијата на епителни цитоскелетни и адхезивни гени како што се К5, К8, К14, Е-кадхерин и П-кадхерин (14, 16). Овој концепт е поддржан од набљудувањето на дезмозомалниот адхезивен протеински плакоглобин во CTC кластерите (9) и во барањето за плакоглобин (9), Е-кадхерин (18) и K14 (14) кај различни експериментални модели на метастази на рак на дојка. Зголемувањето на плакоглобинот предизвикало дезагрегација на кластери на клетките на ракот и ја потврдило нивната ефикасност во формирањето на метастази (9),
- \end{multicols}
- \begin{figure}[ht]
- \centering
- \caption{Bayesian networks: A is conditionally independent of D and E given B and C; information-theoretic networks: mutual information is 0 for statistically
- independent variables, and Data Processing Inequality helps pruning the network; ordinary differential equations: deterministic approach, where the rate of transcription
- of gene A is a function (f) of the level of its direct causal regulators.}
- \end{figure}
- \begin{multicols}{2}
- За да се спроведе обратен инженер на Bayesian мрежен модел на генетска мрежа, мора да го најдеме насочениот ацикличен график G (т.е. регулаторите на секој препис) кој најдобро ги опишува податоците за изразот на ген D, каде што D се претпоставува дека е стабилна состојба збир на податоци. Ова се изведува со избирање на функција за оценување која го евалуира секој график G (т.е. можна мрежна топологија) во однос на податоците за изразување на ген D, а потоа го бара графикот G кој го максимизира резултатот.
- Резултатот може да се дефинира со помош на Bayes правило:
- \begin{equation}
- P(G/D)=\frac{P(D/G)*P(G)}{P(D)}
- \end{equation}
- каде P (G) може да содржи априорно знаење за мрежната структура, ако е достапно, или може да биде константна не-информативна пред, а P (D / G) е функција која ќе биде избрана од страна на алгоритамот кој ја евалуира веројатноста дека податоците D се генерирани од графикот G. Најпопуларните резултати се Бајесовските информативни критериуми (BIC) или Bayesian Dirichlet еквивалентност (BDe). Двата резултати вклучуваат казна за сложеност за да се заштитат од преоптоварување на податоците.
- Во Bayesian мрежите, проблемот со учењето е обично недооценет и се наоѓаат неколку мрежи со висок скок. За да се одговори на овој проблем, може да се користи просек на модел или бутирање за да се изберат најверојатните регулаторни интеракции и да се добијат проценки за доверба за интеракциите. На пример, ако одредена интеракција помеѓу два транскрипта постојано се појавува во модели со голем скок, добива уверување дека овој раб е вистинска зависност. Алтернативно, може да се зголеми непотполниот збир на податоци со претходни информации за да се избере најверојатната структура на модел. Bayesian мрежите не можат да содржат циклуси (т.е. без повратни информации). Ова ограничување е главното ограничување на Bayesian мрежните модели. Динамичните бајесовски мрежи го надминат ова ограничување. Динамичните бајесовски мрежи се продолжување на Bayesian мрежи кои можат да заклучат интеракции од податочниот сет D кој се состои од временски серии, а не од податоци за стабилна состојба. Го пренесуваме читателот на (Yu et al, 2004).
- Banjo е софтвер за генерирање на генска мрежа, развиен од групата Hartemink (Yu et al, 2004). Бањо е базиран на формализам на бајесови мрежи и ги имплементира двете Bayesian и Динамички Bayesian мрежи. Затоа, може да ги заклучи генските мрежи од податоци за изразување на генска експозиција или податоци од временски серии.
- Во Банјо, хеуристичките пристапи се користат за пребарување на "мрежниот простор" за да го најдат мрежниот графикон G (Proposer / Searcher модул во Банџо).
- Банјо излегува со потпишан редовен графикон кој укажува на регулација помеѓу гените. Банџо може да ги анализира податоците за стабилна состојба и временски серии. Во случај на податоци за стабилна состојба, Банџо, како и другите алгоритми на Bayesian мрежите, не е во можност да заклучи мрежи кои вклучуваат циклуси (на пример, повратни информации или податочни циклуси).
- \section{\textbf{Информациски-теоретски пристапи}}
- Информациско-теоретски пристапи употребуваат генерализација на парниот коефициент на корелација во равенката (1), наречена Заедничка информација (МИ), за да се споредат изразните профили од множеството на микрорагради. За секој пар на гени, нивните MIij се пресметуваат и работ aij = aji е поставен на 0 или 1, во зависност од прагот на важност на кој MIij се споредува. МИ може да се користи за мерење на степенот на независност помеѓу два гени.
- Меѓусебните информации, MIij, помеѓу генот i и генот j се пресметуваат како:
- \begin{equation}
- MI_i,_j=H_i+H_j-H_i,_j
- \end{equation}
- каде што Н, ентропијата, се дефинира како:
- \begin{equation}
- H_i=-\sum\limits_{k=1}^n p(x_k)log(p(x_k))
- \end{equation}
- Ентропијата Hi има многу интересни својства; конкретно, тој достигнува максимум за рамномерно распределените променливи, што е, колку е повисока ентропијата, толку по случаен избор се изразуваат нивоа на генска експресија. Од дефиницијата, следува дека МИ станува нула ако двете варијабли xi и xj се статистички независни (P (xixj) = P (xi) P (xj)), како нивна заедничка ентропија Hij = Hi + Hj. Високо МИ покажува дека двата гена не се поврзани по случаен избор едни со други. Можно е лесно да се покаже дека МИ е симетрична, Mij = Mji, затоа мрежата е опишана со ненасочен граф G, со што се разликува од бајесовските мрежи (насочен ацикличен график).
- МИ е поопширен од коефициентот на корелација на Пирсон. Ова квантифицира само линеарни зависности помеѓу променливите, а корелацијата што исчезнува Пирсон не значи дека две варијабли се статистички независни. Во практична примена, сепак, корелацијата на МИ и Пирсон може да даде речиси идентични резултати (Steuer et al, 2002).
- \section{\textbf{ARACNE}}
- ARACNE (Basso et al, 2005; Margolin et al., 2006) припаѓа на семејството на информатичко-теоретски пристапи кон заклучокот на генската мрежа за првпат предложен од Butte и Kohane (2000) со нивниот мрежен алгоритам за релевантност.
- ARACNE го пресметува Mij за сите парови на гените i и j во множеството на податоци. Mij се проценува користејќи го методот на густината на Gaussian кернелот (Steuer et al, 2002). Откако ќе се пресметаат Mij за сите парови на гените, ARACNE ги исклучува сите парови за кои нулта хипотеза за меѓусебно независни гени не може да се исклучи (Ho: MIij = 0). П-вредност за нулта хипотеза, пресметана со користење на Montecarlo симулации, е поврзана со секоја вредност на взаемните информации. Последниот чекор на овој алгоритам е чекор на градинарство кој се обидува да го намали бројот на лажно-позитивни (т.е. заклучи интеракции меѓу два гена кои не се директна каузална интеракција во реалниот биолошки пат). Тие го користат принципот на нееднаквост на обработка на податоци (DPI) кој тврди дека ако и двете (i, j) и (j, k) се директно интерактивни и (i, k) индиректно се поврзува преку j, тогаш Mi, k<min (Mij , Мјк). Оваа состојба е неопходна, но не е доволна, односно нееднаквоста може да биде задоволена, дури и ако (i, k) се директно интерактивни. Затоа авторите потврдуваат дека со примена на овој чекор на градинање со користење на DPI, тие може да отфрлат и некои директни интеракции.
- \section{\textbf{Обични диференцијални равенки}}
- Алгоритмите за обратно инженерство базирани на обични диференцијални равенки (ОДЕ) ги поврзуваат промените во концентрацијата на транскрипцијата на гените едни на други и на надворешна пертурбација. Со надворешна пертурбација, ние подразбираме експериментален третман кој може да ја смени стапката на транскрипција на гените во клетката. Пример за пертурбација е третман со хемиско соединение (т.е. лек) или генетска пертурбација која вклучува прекумерна експресија или намалување на регулацијата на одредени гени.
- Ова е детерминистички приод кој не се базира на проценката на условните веројатности, за разлика од бајесовските мрежи и информатичко-теоретски пристапи. Множество ОДЕ, по еден за секој ген, ја опишува генската регулација како функција на други гени:
- \begin{equation}
- x_i(t)=f_i(x_1,...,x_N,u,\theta_i)
- \end{equation}
- каде $\theta_i$ е збир на параметри кои ги опишуваат интеракциите меѓу гените (рабовите на графикот), i = 1 ... N, xi (t) е концентрацијата на транскриптот i измерена во времето t, \begin{equation}
- x_i(t)=\frac{dx_i}{dt}(t)
- \end{equation}
- е стапка на транскрипција на транскриптот i , N е бројот на гените и u е надворешна пертурбација на системот.
- \section{\textbf{NIR, MNI and TSNI.}}
- Во неодамнешните студии (Gardner et al, 2003; di Bernardo et al, 2005; Bansal et al, 2006), се развиени алгоритми базирани на ОДЕ (идентификација на Мрежа со повеќекратна регресија (NIR) и идентификација на мрежни мрежи (MNI)) кои користат серија на мерења на експресија на изразена РНК, или мерења на временска серија (времена сериска идентификација-TSNI) по транскрипционите пертурбации, за реконструкција на интеракциите на генот-генот и за идентификација на медијаторите на активноста на лекот.
- Мрежата е опишана како систем на линеарни ODEs (de Jong, 2002) што ја претставува стапката на синтеза на транскрипт како функција на концентрациите на секој друг транскрипт во ќелијата и надворешната пертурбација:
- \begin{equation}
- x_i(t_k)=\sum\limits_{j=1}^N a_i,_j x_j(t_k)+b_iu(t_k)
- \end{equation}
- каде i = 1, ..., N; k = 1 ... M, N е бројот на гени, M е бројот на временски точки, вградената Imagei (tk) е концентрацијата на транскриптот i измерена во времето tk, вградената Imagei (tk) е стапката на промена на концентрацијата на генот i во времето tk, т.е. првиот дериват на концентрацијата на mRNA на ген i измерена во времето tk, aij претставува влијание на генот j врз ген i, би претставува ефектот на надворешното perturbation на xi и u (tk) ја претставува надворешната пертурбација во времето tk (aij и bi се $\theta$ во равенката (5)).
- Во случај на податоци со стабилна состојба, вградената слика (tk) = 0 и равенката (6) за генот i станува независна од времето и може да се поедностават и презапишат во форма на линеарна регресија:
- \begin{equation}
- \sum\limits_{j=1}^N a_i,_j x_j=-b_iu
- \end{equation}
- Алгоритмот за NIR (Gardner et al., 2003) ги пресметува рабовите aij од податоците за изразување на генската експресија со помош на равенката (7). На NIR му се потребни профили за изразување на ген по секој експеримент за пертурбација (xj), знаење за тоа кои гени биле директно вознемирени во секој експеримент за пертубација (biu) и опционално, стандардно отстапување на репликативните мерења. NIR се базира на претпоставка на мрежниот простор, односно максималниот број на иницијални рабови по ген (т.е. максимален број регулатори по ген), кој може да го избере корисникот. Излезот е во матрикс формат, каде што секој елемент е раб aij. Алгоритмот за инференција се намалува за решавање на равенката (7) за непознатите параметри aij, т.е. класичен проблем со линеарна регресија.
- Алгоритмот MNI (di Bernardo et al, 2005) се базира на равенката (7) и користи податоци за стабилна состојба како NIR, но најважно е што секој експеримент со микрораспредел може да резултира од било каков вид на пертурбација, односно, ние не бараат познавање на био. MNI е различен од другите методи на инференција, бидејќи мрената што се заклучува не се користи само по себе, туку да го филтрира профилот на генска експресија по третман со соединение за да се утврдат патеките и гените директно насочени од соединението. Ова се постигнува во два чекора. Во првиот чекор, параметрите aij се добиваат од податоците за изразот на ген D; во вториот чекор се мери профилот на изразување на ген по третман со соединенија (xid со i = 1 ... N), а равенката (7) се користи за пресметување на вредностите biu за секој i, како што е познато а u е едноставна константа претставувајќи го третманот. би различен од 0 ги претставува гените кои директно се погодени од соединението. Излезот е рангирана листа на гени; гените на врвот на листата се најверојатните цели на соединението (т.е. оние со највисока вредност на bi).
- Алгоритмот за идентификација на мрежата TSNI (Bansal et al, 2006) ја идентификува генската мрежа (aij), како и директните цели на пертурбациите (bi). TSNI се базира на равенката (6) и се применува кога податоците за изразување на ген се динамични (временски серии). За да се реши равенката (6), потребни ни се вредностите на вградените Imagei (tk) за секој ген i и секоја точка k. Ова може да се процени директно од временската серија на профили за изразување на ген. TSNI претпоставува дека се врши единствен пертурбациски експеримент (на пример, третман со соединение, прекумерна експресија на гени и сл.) И M временски точки по пертурбацијата се мерат (наместо M различни услови во стабилна состојба како кај NIR и MNI). За мали мрежи (десетици гени), тој е способен правилно да ја заклучи мрежната структура (т.е. aij). За големи мрежи (стотици гени), неговите перформанси се најдобри за предвидување на директните цели на пертурбацијата (т.е. би) (на пример, наоѓање на директни цели на фактор на транскрипција од временски серии за изразување на ген по преголема експресија на факторот). TSNI не е тестиран тука, но ние го упатуваме читателот до Bansal et al (2006).
- \section{\textbf{Реверзибилно инженерство алгоритам перформанси}}
- Ние извршивме споредба со користење податоци за "лажни" генски израз генерирани од компјутерски модел за регулација на ген (податоци "во силико").
- За да се симулираат податоците за изразување на ген и регулацијата на ген во форма на мрежа, ние користиме линеарни ОДЕ кои ги поврзуваат промените во концентрацијата на транскрипцијата на ген едни на други и на надворешните пертурбации. Линеарни ODEs можат да симулираат генетски мрежи како што е наведено потпишани графикони со реална динамика и да генерираат профили на изразување на генската експресија на статични и временски серии.
- Ние генерираме 20 случајни мрежи со 10, 100 и 1000 гени и со просечен ин-степен по ген од 2, 10 и 100, соодветно. За секоја мрежа генериравме три вида на податоци: податоци за симулирани микротризирани податоци кои резултираат од M глобалните пертурбации (т.е. сите гени во мрежата се разгоруваат истовремено во секој експеримент со пертурбации); податоци за стабилна состојба кои произлегуваат од M локалните пертурбации (т.е. различен единствен ген во мрежата е вознемирен во секој експеримент) и динамички временски серија-симулирани податоци со микро-податоци, кои произлегуваат од вознемирувачки 10 \% од гените истовремено и мерење на M временски точки по пертурбацијата експеримент. За сите збирки на податоци, М беше избран еднаков на 10, 100 и 1000 експерименти. Потоа се додал бучавост во сите множества на податоци со сумирање на секое симулирано ниво на изразување на ген во сетот на податоци, бел шум со нула и стандардна девијација еднаква на 0,1 помножена со апсолутната вредност на нивото на симулираниот генски израз (Gardner et al, 2003) .
- Сите алгоритми беа извршени на сите множества на податоци користејќи стандардни параметри (Дополнителна табела 1). Банџо не беше раководен на 1000-те генски податоци, бидејќи паѓа поради ограничувањата на меморијата, додека НИР бараше премногу долго време на пресметување.
- Забележуваме дека за глобалните податоци за пертурбации, сите алгоритми, но Banjo, (бајесовските мрежи) не успеваат, бидејќи нивните перформанси се споредливи со случаен алгоритам (оттаму важноста на известување секогаш е случајната изведба). Перформансите на Бањо се слаби кога се достапни само 10 експерименти и постигнуваат многу добра точност за 100 експерименти (независно од бројот на гени), иако со многу ниска чувствителност (се наоѓаат само неколку рабови). Перформансите на сите алгоритми, но Banjo, драматично се подобруваат за 'локалниот' набор на податоци. Во овој случај, и АРАЦНЕ и НИР вршат многу добро, додека перформансите на Банјо сеуште се случат за 10 експерименти, додека достигаат многу добра точност, но слаба осетливост за поставените 100 експерименти. Кластеринг е подобар од случаен, но очигледно не е добар метод за да се заклучи генетски мрежи. Изведбата е повторно случајна за "динамичен" временски сет на податоци. Во овој случај ние го водиме ARACNE, иако временските точки не може да се претпостави независно едни од други. Бањо се покажало дека работи на динамички податоци, но има потреба од многу голем број на експерименти (временски точки) во споредба со бројот на гените (Yu et al, 2004).
- Ние ги пресекуваме мрежите заклучени од сите алгоритми и откривме дека за "локалните" податоци за 10-генската мрежа во просек околу 10 \% од рабовите се преклопуваат во сите четири алгоритми, додека околу 0.01 \% се преклопуваат за 100-генската мрежа " локална "група на податоци . Ова се должи на фактот дека Банџо за базата на податоци од 100-генски мрежи обновува многу малку врски во споредба со другите алгоритми, при што пресекот има многу малку рабови во овој случај; исклучувајќи го Бањо кога пресметувањето на пресекот го спасува пресекот на преклопување на околу 10\%.
- Потоа го проверивме PPV и Se, земајќи ги предвид само рабовите што беа пронајдени од сите алгоритми, доколку ги има.Како што се очекуваше се намали, но PPV се подобри само малку во споредба со онаа на секој алгоритам разгледуван одделно . Покрај тоа, за големи мрежи (100 гени), пресекот помеѓу мрежите постои само 35% од времето, додека кај малите мрежи (10 гени), постои 95% од времето.
- Перформансите на секој алгоритам може дополнително да се подобрат со модификување на нивните параметри. Параметарот ARACNE DPI (праг за нееднаквост во обработката на податоците) варира од 0 до 1 и го контролира одземањето на тројките во мрежата (1, без градинарство и 0, секој триплет е скршен на најслаб раб). Најдовме DPI = 0,15 за да биде конзервативен праг кој дава добар компромис помеѓу Se и PPV. Друг параметар е прагот на МИ. Зголемувањето на овие параметри овозможува да се подобри PPV по цена на намалување на Se. Нивото на МВ може, исто така, автоматски да се избере од ААКНЕ, што е прилично добра работа; па затоа предлагаме рачно да не го поставите прагот на MI.
- Настапот на NIR алгоритам може да биде засегнат со промена на параметарот k, кој ја дефинира просечната индукција по јазол (т.е. секој ген може да се регулира најмногу од другите к гени). Колку е помал К, толку е повисоко PPV по цена на намалување на Se. Перформансите на NIR на симулираните збирки на податоци се пристрасни, бидејќи NIR се базира на линеарни ODEs, кои исто така се користат за генерирање на "лажни" симулирани податоци за изразот на ген; сепак, бидејќи бучавата се додава на симулираните податоци, пријавената изведба не треба да биде премногу далеку од вистинската. Изгледа дека НИР е подобар од останатите алгоритми, но исто така бара повеќе информации, односно гени кои биле директно вознемирени во секој експеримент со микрораспределба (на пример, кој ген е исфрлен, итн.).
- \section{\textbf{Примена на експериментални податоци}}
- Податоците за microarray кои треба да се дадат како влез за алгоритмите не треба да имаат специфична претходна обработка, туку само нормализација и избор на гените кои значително одговорија на експериментите за пертурбација, користејќи стандардни техники. Избравме три различни организми и множества на податоци од различни големини: два големи множества на податоци (А и Б), два средни множества податоци (C и D) и два мали множества на податоци (E и F). Ние го тестиравме секој алгоритам за најголем број на можни податоци. Во секој случај ги користевме стандардните параметри. Банџо не може да работи на множествата на податоци А и Б, поради големата големина на базата на податоци. NIR може да се примени само на базата на податоци Е, бидејќи бара експерименти со постојана состојба и знаење за вознемирениот ген во секој експеримент. Хиерархиското групирање беше применето за сите збирки на податоци.
- ARACNE добро функционира на бази на податоци A и C, додека останатите алгоритми не се значително подобри од случаен. ARACNE не е подобар од случаен за сетот на податоци B и е подобар од случаен за податочен сет D, додека Банјо е значително подобар од случаен за податочен сет D, иако со многу ниска чувствителност, во согласност со резултатите од силико. За истиот сет на податоци, D, кластеринг врши подобро отколку случајно, со помала точност од Бањо, но подобра чувствителност. Вкупната ниска ефикасност на базата на податоци Б, во споредба со другите збирки на податоци, најверојатно се должи или на повисоките нивоа на бучава во овој назив на податоци или на несовршено познавање на вистинската мрежа (транскрипциона мрежа во квасец).
- Податоците множества E и F не се многу информативни, бидејќи вистинските мрежи се мали и густо поврзани и затоа случаен алгоритам многу добро функционира. Во секој случај, само НИР врши значително подобар од случаен за сетот на податоци Е, а само кластерирањето значително е подобрено од случаен избор на податоци.
- \section{\textbf{Дискусија и заклучоци}}
- Во силико анализата се даваат сигурни насоки за перформансите на алгоритмите во согласност со резултатите добиени на реални збирки на податоци: ARACNE добро функционира за податоци за стабилна состојба и може да се примени и кога има неколку експерименти, во споредба со бројот на гени, но не е погоден за анализа на кратки податоци од временски серии. Ова може да се очекува поради барањата за статистички независни експерименти. Бањо е многу прецизен, но со многу ниска чувствителност, на податоци во состојба на состојба, кога има повеќе од 100 различни пертурбациски експерименти, независно од бројот на гени, додека не успева за податоци од временски серии. Банјо (и Bayesian мрежите воопшто) е веројатност алгоритам кој бара проценка на дистрибуција на густина на веројатност, задача која бара голем број податоци поени. NIR работи многу добро за податоци за стабилна состојба, исто така, кога има неколку експерименти, но бара знаење за гените кои биле разрушени директно во секој експеримент со пертурбации. NIR е детерминистички алгоритам, и ако бучавата на податоците е мала, таа не бара големи множества на податоци, бидејќи се заснова на линеарна регресија. Кластерирањето, иако не е алгоритам за обратно инженерство, може да даде некои информации за мрежната структура кога е достапен голем број експерименти, како што е потврдено и со силико и со експериментални анализи, иако со многу помала прецизност од другите обратни инженерски алгоритми .
- Различните обратни инженерски методи што се разгледуваат овде заклучуваат мрежи кои се преклопуваат околу 10% од рабовите за мали мрежи, а уште помалку за поголеми мрежи. Интересно е тоа што ако сите алгоритми се согласат за интеракција помеѓу два гени (предност во мрежата), оваа интеракција не е поголема веројатност да биде вистина од оние заклучени со еден алгоритам. Затоа, не е добра идеја да се "доверба" интеракција повеќе само затоа што повеќе од еден обратен инженеринг алгоритам го најдете.
- Општо земено, природата на експериментите што се изведуваат со цел да се пертрубираат клетките и да се измери профилот за изразување на ген може да ја олесна задачата за инференција (или потешко). Од нашите резултати, "локалните" пертурбациони експерименти, односно преголемата експресија на гените или нокдаунд, се чини дека се многу информативни од "глобалните" пертурбациски експерименти, односно преголема експресија на десетици гени истовремено или поднесување на клетките до силен шок.
- Податоците од временската серија дозволуваат една да ја испита динамиката на активирање (инхибиција) на гените како одговор на одредена пертурбација. Побогата динамика во пертурбацијата ќе даде побогата динамика во одговорот и на тој начин повеќе информативни податоци.
- Алгоритмите за инференцијација на генската мрежа стануваат доволно точни за да бидат практично корисни, барем кога се достапни податоци за изразување на гени во состојба на стабилност, но напорите мора да бидат насочени кон оценување на перформансите на алгоритам. За неколку години, заклучокот за генетска мрежа ќе стане исто толку популарен како кластеринг за анализа на податоци со микро податоци.
- \end{multicols}
- \section{\textbf{Референци}}
- \begin{itemize}
- \item Amato R, Ciaramella A, Deniskina N, Del Mondo C, di Bernardo D, Donalek C, Longo G, Mangano G, Miele G, Raiconi G, Staiano A, Tagliaferri R (2006) A multi‐step approach to time series analysis and gene expression clustering. Bioinformatics 22: 589–596
- \item Ambesi A, di Bernardo D (2006) Computational biology and drug discovery: From single‐target to network drugs. Curr Bioinform 1: 3–13
- \item Bansal M, Della Gatta G, di Bernardo D (2006) Inference of gene regulatory networks and compound mode of action from time course gene expression profiles. Bioinformatics 22: 815–822
- \item Basso K, Margolin AA, Stolovitzky G, Klein U, Dalla‐Favera R, Califano A (2005) Reverse engineering of regulatory networks in human B cells. Nat Genet 37: 382–390
- \item Foat B, Morozov A, Bussemaker HJ (2006) Statistical mechanical modeling of genome‐wide transcription factor occupancy data by matrixreduce. Bioinformatics 22: e141–e149
- \item Hughes TR, Marton MJ, Jones AR, Roberts CJ, Stoughton R, Armour CD, Bennett HA, Coffey E, Dai H, He YD, Kidd MJ, King AM, Meyer MR, Slade D, Lum PY, Stepaniants SB, Shoemaker DD, Gachotte D, Chakraburtty K, Simon J, Bard M, Friend SH (2000) Functional discovery via a compendium of expression profiles. Cell 102: 109–126
- \item Pe'er D, Nachman I, Linial M, Friedman N (2000) Using bayesian networks to analyze expression data. J Comput Biol 7: 601–620
- \end{itemize}
- \bibliographystyle{alpha}
- \end{document}
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement