Informácie

5: Diferenciálne a diferenčné formy - Biológia

5: Diferenciálne a diferenčné formy - Biológia



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

5: Diferenciálne a diferenčné formy

Od čítaní RNA-seq k výsledkom diferenciálnej expresie

Na predspracovanie údajov o vysokovýkonnom sekvenovaní RNA a na detekciu rozdielnej expresie je dostupných mnoho metód a nástrojov.

Vysokovýkonné sekvenčné technológie sa v súčasnosti bežne používajú v biológii. Tieto technológie produkujú milióny čítaní krátkych sekvencií a bežne sa aplikujú na genómy, epigenómy a transkriptómy. Sekvenovanie RNA v ustálenom stave vo vzorke, známe ako RNA-seq, je bez mnohých obmedzení predchádzajúcich technológií, ako je napríklad závislosť od predchádzajúcej znalosti organizmu, ako sa vyžaduje pre mikročipy a PCR (pozri rámček 1: Porovnania mikročipy a sekvenovanie na analýzu génovej expresie). Okrem toho RNA-seq sľubuje rozlúštenie predtým nedostupných zložitostí v transkriptóme, ako je expresia špecifická pre alelu a nové promótory a izoformy [1–4]. Vytvorené súbory údajov sú však veľké a zložité a interpretácia nie je jednoduchá. Ako pri každej vysokovýkonnej technológii je pre interpretáciu údajov kritická metodológia analýzy a postupy analýzy RNA-seq sa neustále vyvíjajú. Preto je načase preskúmať v súčasnosti dostupné metódy analýzy údajov a vyjadriť sa k budúcim smerovaniam výskumu.

Zmysel údajov RNA-seq závisí od vedeckej otázky, ktorá je predmetom záujmu. Napríklad stanovenie rozdielov v alelovo špecifickej expresii vyžaduje presné určenie prevalencie transkribovaných jednonukleotidových polymorfizmov (SNP) [5]. Alternatívne možno fúzne gény alebo aberácie vo vzorkách rakoviny detegovať nájdením nových transkriptov v údajoch RNA-seq [6, 7]. V minulom roku sa objavilo niekoľko metód, ktoré využívajú údaje RNA-seq na odhad hojnosti [8, 9], detekciu alternatívneho zostrihu [10–12], úpravu RNA [13] a nové transkripty [11, 14]. Primárnym cieľom mnohých biologických štúdií je však profilovanie génovej expresie medzi vzorkami. V tomto prehľade sa teda zameriavame na dostupné metodológie na detekciu rozdielov v expresii na úrovni génov medzi vzorkami. Tento druh analýzy je relevantný najmä pre kontrolované experimenty porovnávajúce expresiu v divokom type a mutantných kmeňoch rovnakého tkaniva, porovnávajúce liečené bunky s neošetrenými bunkami, rakovinové bunky s normálnymi atď. Napríklad porovnanie zmien expresie medzi kultivovaným patogénom Acinetobacter baumannii a patogén pestovaný v prítomnosti etanolu – o ktorom je známe, že zvyšuje virulenciu – odhalil 49 odlišne exprimovaných génov patriacich do radu funkčných kategórií [15]. Tu načrtneme proces spracovania používaný na detekciu diferenciálnej expresie (DE) v RNA-seq a preskúmame dostupné metódy a softvérové ​​nástroje s otvoreným zdrojom na vykonanie analýzy. Zdôrazňujeme tiež niekoľko oblastí, ktoré si vyžadujú ďalší výskum.

Väčšina experimentov s RNA-seq berie vzorku purifikovanej RNA, strihá ju, konvertuje na cDNA a sekvenuje na vysokovýkonnej platforme, ako je Illumina GA/HiSeq, SOLiD alebo Roche 454 [16]. Tento proces generuje milióny krátkych (25 až 300 bp) čítaní získaných z jedného konca fragmentov cDNA. Bežným variantom tohto procesu je generovanie krátkych čítania z oboch koncov každého fragmentu cDNA, známe ako čítanie na párovom konci. Platformy sa podstatne líšia vo svojej chémii a krokoch spracovania, ale bez ohľadu na presné detaily sa nespracované údaje skladajú z dlhého zoznamu krátkych sekvencií s pridruženými skóre kvality, ktoré tvoria vstupný bod pre túto recenziu.

Prehľad typického potrubia RNA-seq pre DE analýzu je načrtnutý na obrázku 1. Najprv sa čítania mapujú do genómu alebo transkriptómu. Po druhé, mapované hodnoty pre každú vzorku sa zostavia do súhrnov expresie na úrovni génu, na úrovni exónu alebo na úrovni transkriptu v závislosti od cieľov experimentu. Ďalej sú zhrnuté údaje normalizované v súlade so štatistickým testovaním DE, čo vedie k zoradenému zoznamu génov s pridruženými génmi. P-hodnoty a násobné zmeny. Nakoniec, biologický pohľad z týchto zoznamov možno získať vykonaním prístupov systémovej biológie, podobných tým, ktoré sa vykonávajú na experimentoch s mikročipmi. Nižšie kritizujeme v súčasnosti dostupné metodológie pre každý z týchto krokov analýzy údajov RNA-seq. Namiesto poskytovania kompletného zoznamu všetkých dostupných nástrojov sa zameriavame na príklady bežne používaného softvéru s otvoreným zdrojovým kódom, ktoré ilustrujú metodiku (tabuľka 1). Úplný zoznam softvéru na analýzu RNA-seq nájdete v [17, 18].

Prehľad analytického potrubia RNA-seq na detekciu diferenciálnej expresie. Kroky v potrubí sú v červených rámčekoch, metodické komponenty potrubia sú zobrazené v modrých rámčekoch a tučné textové softvérové ​​príklady a metódy pre každý krok (neúplný zoznam) sú zobrazené bežným textom v modrých rámčekoch. Odkazy na zobrazené nástroje a metódy sú uvedené v tabuľke 1. Najprv sa čítania mapujú do referenčného genómu alebo transkriptómu (pomocou spojovacích knižníc na mapovanie čítaní prekračujúcich hranice exónu) mapované čítania sa zostavujú do súhrnov výrazov (tabuľky počtov, ktoré ukazujú, ako môžu sa čítať v kódujúcej oblasti, exóne, géne alebo spojení) údaje sú normalizované štatistické testovanie diferenciálnej expresie (DE), produkcia a zoznam génov s pridruženými P-hodnoty a násobné zmeny. Prístupy systémovej biológie sa potom môžu použiť na získanie biologických poznatkov z týchto zoznamov.


Typy metód odstreďovania

Bežne existujú tri druhy centrifugačných techník:

Gradient hustoty Centrifugácia

Je to ďalšia metóda odstreďovania, pri ktorej sa vzorka obsahujúca rôzne molekuly zmieša s roztokom s vysokou hustotou. Odstreďovanie s hustotným gradientom využíva substráty (sacharóza, glycerol atď.) na prípravu roztoku na vývoj hustotného gradientu.

Na oddelenie rôznych koncentrátov by mal mať roztok (kde sa musí vzorka zmiešať). nízka koncentrácia a vysoká difúzna nehnuteľnosť. Pred odstredením roztoku vzorky by sa mal určitý čas skladovať v jednotnej zmesi.

Pri odstreďovaní zaujmú rôzne molekuly rôznej hustoty miesto v a gradient hustotyvzhľadom na ich hmotnosti. Nakoniec sa koncentrovaná vrstva častíc izoluje prepichnutím centrifugačnej skúmavky.

  • Rýchlostná zónová centrifugácia: Pri tomto druhu sa vzorka odstreďuje v a prezaložená gradient hustoty.
  • Izopyknické odstreďovanie: Tu, a samogenerujúce gradient sa vytvorí počas odstreďovania vzorky.

Rýchlostná zónová centrifugácia

Vzťahuje sa na rýchlostné odstreďovanie, kde k separácii častíc dochádza na základe rýchlosti ich sedimentácie, ktorá priamo závisí od častice omša alebo veľkosť. Častice’ tvar ovplyvňuje aj rýchlosť sedimentácie.

Využíva vysokú hustotu sacharóza riešenie 5-20% na vytvorenie gradientu hustoty. Sedimentácia hustých častíc nastáva na dne odstredivej trubice a ľahké častice zostávajú na vrchu. Preto sa vyvíja zónová centrifugácia diskrétne pásma alebo zóny, zodpovedajúce hustote častíc prítomných vo vzorke.

Na oddelenie pásov sa zospodu napichne centrifugačná skúmavka. Touto technikou možno určiť sedimentačný koeficient a hmotnosť molekuly, ktorá je predmetom záujmu. Veľkosť alebo hmotnosť častíc môže ovplyvniť účinnosť sedimentácie, pretože sedimentačný koeficient je úmerný hmotnosti častice.

Izopyknická centrifugácia

Vzťahuje sa na gradient rovnovážnej hustoty centrifugácia, kde sa častice koncentrujú na základe ich nezávislé na hustote vztlaku veľkosti a tvaru častíc. Čas potrebný na odstreďovanie častíc neovplyvňuje rýchlosť sedimentácie.

Tento spôsob sa používa na koncentrovanie takých častíc, ktoré majú rovnakú veľkosť, ale odlišnú hustotu. Pri izopyknickej centrifugácii 20-70% sacharóza roztok vyvíja gradient na oddelenie rôznych molekúl. K sedimentácii biomolekúl nedôjde, kým sa hustota vztlaku nerovná hustote gradientu.

Diferenciálna centrifugácia

Je to metóda odstreďovania, ktorá závisí od rozdielov v rýchlosti sedimentácie, ktorá priamo ovplyvňuje separáciu rôznych zložiek podľa ich relatívnej hmotnosti, tvaru a hustoty.

Vo všeobecnosti oddeľuje subcelulárne zložky. Pri diferenciálnej centrifugácii zmiešajte bunky. Nalejte zložky roztrhnutých buniek do centrifugačnej skúmavky, ktorá zachová integritu zložiek buniek.

Potom sa suspendované zložky v roztoku podrobia počiatočné odstreďovanie pri nízkej odstredivej sile po definovaný čas. Počiatočná centrifugácia spôsobuje sedimentáciu väčších molekúl na dne (ako pelety) a supernatantu na vrchu.

Po odstredení pod a vysoká odstredivá silasupernatant sa opakovane dekantuje, aby sedimentovali rôzne bunkové zložky. Preto sa odstredivá sila plus odstredivý čas postupne zvyšuje po každom kroku.

Ultracentrifugácia

Táto metóda zvyšuje gravitačnú silu Zeme použitím odstredivej sily (1 000 000-krát) väčšej ako gravitačná sila. Ultracentrifugácia spôsobuje sedimentáciu častíc tak malých ako 10 kDa.

V homogénnej zmesi sa husté častice objavia ako pelety výlevka rozpúšťadlaa ľahšie častice sa budú javiť ako supernatant rozpúšťadlový vrch. Ultracentrifugácia využíva hustý roztok sacharózy alebo chloridu cézneho na koncentráciu častíc.

Využitie odstreďovania

Nasledujú aplikácie centrifugačnej techniky:

  • Enviromentálna veda: Pri čistení odpadových vôd.
  • Molekulárna veda: Pomáha pri extrakcii biomolekúl ako DNA, RNA, proteín atď.
  • Zdravotný výskum: Pomáha pri separácii rôznych zložiek z moču, krvného séra atď.
  • Chemická veda: Pomáha pri procese obohacovania uránu.
  • Veda o potravinách: Pomáha pri tvorbe odstredeného mlieka odstránením tuku.

Preto môžeme konštatovať, že centrifugačná technika má široké uplatnenie vo výskumnej biochémii, molekulárnej biológii, bunkovej biológii a lekárskej vede.


  • Citácie
  • Predslov k prvému vydaniu
    • Pedagogické boje
    • Kryštalizácia a zaostrovanie – moja cesta
    • Ako používať túto knihu v triede
    • Poďakovanie
    • Referencie
    • Prehľad
    • Definície modelovania
    • Modelovanie základných funkcií systému
    • Primárne zameranie: Dynamické (dynamické) modely systému
    • Kombinácia modelov merania a dynamických systémov: Dôležité!
    • Stabilita
    • Modelovanie zhora nadol a zdola nahor
    • Zdroj & Sink Submodels: One Paradigm for Biomodeling with Subsystem Components
    • Systémy, integrácia, výpočty a mierka v biológii
    • Prehľad procesu modelovania a cieľov biomodelovania
    • Pohľad do budúcnosti: Model kapitol zhora nadol
    • Referencie
    • Niektoré základy a trochu filozofie
    • Algebraické alebo diferenciálne modely rovníc
    • Diferenciálne a diferenčné modely rovníc
    • Rôzne druhy modelov diferenciálnych a rozdielových rovníc
    • Lineárne a nelineárne matematické modely
    • Linearizované modely po častiach: Mierne/mäkké nelinearity
    • Riešenie modelov obyčajného diferenciálu (ODE) a diferenciálnych rovníc (DE).
    • Špeciálne funkcie vynucovania vstupu (signály) a ich modelové odozvy: Kroky a impulzy
    • Modely stavových premenných systémov so spojitým časom
    • Lineárne časovo invariantné (TI) diskrétne časové diferenciálne rovnice (DE) a ich riešenie
    • Linearita a superpozícia
    • Laplaceovo transformačné riešenie ODR
    • Prenosové funkcie lineárnych modelov TI ODE
    • Viac o stabilite systému
    • Pozerať sa dopredu
    • Cvičenia
    • Referencie
    • Prehľad
    • Problémy s počiatočnou hodnotou
    • Grafické programovanie ODR
    • Simulácie časového oneskorenia
    • Multiškálová simulácia a časové oneskorenia
    • Normalizácia ODR: Magnitude- & Time-Scaling
    • Algoritmy numerickej integrácie: Prehľad
    • Taylorova séria
    • Algoritmy Taylorovho radu na riešenie obyčajných diferenciálnych rovníc
    • Výpočtová/numerická stabilita
    • Samospúšťacie metódy riešenia ODE
    • Algoritmy na odhadovanie a riadenie postupnej presnosti
    • Porovnania metód založených na Taylorových radoch
    • Problémy s tvrdou ODE
    • Ako si vybrať riešiteľa?
    • Riešenie rozdielových rovníc (DEs) pomocou ODE Solver
    • Iné simulačné jazyky a softvérové ​​balíky
    • Dva príklady modelu simulácie dynamiky interakcie populácie
    • Zhodnotenie a výhľad dopredu
    • Cvičenia
    • Referencie
    • Úvod
    • Kompartmentalizácia: formalizmus prvej úrovne pre štrukturálne biomodelovanie
    • Matematika viackompartmentového modelovania z biofyziky
    • Nelineárne multikompartmentové biomodely: Špeciálne vlastnosti a riešenia
    • Dynamický systém Nelineárne epidemiologické modely
    • Veľkosti oddelení, koncentrácie a koncepcia ekvivalentných distribučných objemov
    • generál n-Priestorové modely s viacerými vstupmi a výstupmi
    • Modelovanie nepriamych a časovo oneskorených vstupov na základe údajov
    • Bazény a modely bazénov: prispôsobenie sa nehomogenitám
    • Rekapitulácia a výhľad do budúcnosti
    • Cvičenia
    • Referencie
    • Úvod
    • Výstupné dáta (Dynamické podpisy) odhaľujú dynamickú štruktúru
    • Rozmernosť viackompartmentového modelu, modálna analýza a dynamické podpisy
    • Zjednodušenie modelu: Skryté režimy a ďalšie informácie
    • Nejednoznačnosti štruktúry biomodelu: Modelová diskriminácia, odlíšiteľnosť a ekvivalencia medzi vstupmi a výstupmi
    • *Algebra a geometria rozlíšiteľnosti modelu MC
    • Redukovateľné, cyklické a iné vlastnosti modelu MC
    • Tracers, Tracees & Linearizing Perturbation Experiments
    • Rekapitulácia a pohľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad
    • Modely kinetickej interakcie
    • Zákon masovej akcie
    • Dynamika reakcií v otvorených biosystémoch
    • Enzýmy a kinetika enzýmov
    • Enzýmy a úvod do metabolickej a bunkovej regulácie
    • Cvičenia
    • Rozšírenia: Teória predpokladu kvázi ustáleného stavu
    • Referencie
    • Prehľad
    • Enzýmovo-kinetické podmodely extrapolované na iné biomolekulové systémy
    • Coupled-Enzymatic Reactions & Protein Interaction Network (PIN) Modely
    • Výroba, eliminácia a regulácia kombinovaná: Modelový zdroj, odtok a ovládacie komponenty
    • Stechiometrická matica N
    • Špeciálne balíčky modelovania v biochémii, bunkovej biológii a príbuzných odboroch
    • Stochastické modelovanie dynamického molekulárneho biosystému
    • Keď sa uprednostňuje stochastický model
    • Stochastické modely procesov a Gillespieho algoritmus
    • Cvičenia
    • Referencie
    • Prehľad
    • Fyziologicky založené (PB) modelovanie
    • Problémy s návrhom experimentu v kinetickej analýze (výstrahy)
    • Parametre celého organizmu: Kinetické indexy celkovej produkcie, distribúcie a eliminácie
    • Nekompartmentové (NC) Biomodelovanie a analýza (NCA)
    • Rekapitulácia a výhľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad/Úvod
    • Stabilita modelov biosystému NL
    • Stabilita modelov lineárnych systémov
    • Lokálna nelineárna stabilita prostredníctvom linearizácie
    • Bifurkačná analýza
    • Oscilácie v biológii
    • Iné komplexné dynamické správanie
    • Nelineárne režimy
    • Rekapitulácia a výhľad do budúcnosti
    • Cvičenia
    • Referencie
    • Úvod
    • Základné pojmy
    • Formálne definície: obmedzené štruktúry, štrukturálna identifikovateľnosť a identifikovateľné kombinácie
    • Neidentifikovateľné modely
    • SI pod obmedzeniami: Intervalová identifikovateľnosť s niektorými známymi parametrami
    • SI analýza nelineárnych (NL) biomodelov
    • Čo bude ďalej?
    • Cvičenia
    • Referencie
    • Úvod
    • Citlivosť na variácie parametrov: Základy
    • Citlivosť stavových premenných na variácie parametrov
    • Výstupná citlivosť na variácie parametrov
    • * Matica citlivosti výstupných parametrov a štrukturálna identifikovateľnosť
    • *Citlivosť globálnych parametrov
    • Rekapitulácia a výhľad do budúcnosti
    • Cvičenia
    • Referencie
    • Odhad parametrov biomodelu (identifikácia)
    • Zvyškové chyby a kritériá optimalizácie parametrov
    • Metódy optimalizácie parametrov 101: Analytické a numerické
    • Hodnotenie kvality odhadu parametrov
    • Ďalšie hodnotenia kvality biomodelov
    • Rekapitulácia a pohľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad
    • Prospektívny simulačný prístup k meraniam spoľahlivosti modelu
    • Zjednodušená kvantifikácia modelu s obmedzeniami
    • Reparametrizácia modelu a kvantifikácia identifikovateľných kombinácií parametrov
    • Metóda nútenej funkcie
    • Multiexponenciálne (ME) modely a použitie ako vnucovacie funkcie
    • Montáž a úprava modelu so skutočnými údajmi
    • Rekapitulácia a pohľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad
    • Modelovanie fyziologického riadiaceho systému
    • Neuroendokrinné fyziologické modely systému
    • Štrukturálne modelovanie a analýza biochemických a bunkových riadiacich systémov
    • Modelovanie prechodných a ustálených biomolekulových sietí
    • Metabolic Control Analysis (MCA)
    • Rekapitulácia a pohľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad
    • Štatistické kritériá pre rozlišovanie medzi alternatívnymi modelmi
    • Makroškálové a mezoškálové modely na objasnenie biomechanizmov
    • Mezoškálové mechanické modely biochemických/bunkových riadiacich systémov
    • Kandidátske modely pre nariadenie p53
    • Rekapitulácia a pohľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad
    • Formálny model pre návrh experimentu
    • Návrh vstupno-výstupného experimentu z matice TF
    • Grafy a analýza cutset pre návrh experimentu
    • Algoritmy pre návrh optimálneho experimentu
    • Návrh sekvenčného optimálneho experimentu
    • Rekapitulácia a pohľad do budúcnosti
    • Cvičenia
    • Referencie
    • Prehľad
    • Citlivosť miestnych a globálnych parametrov
    • Metodika redukcie modelu
    • Hodnotenie parametrov
    • Pridané výhody: Uveďte premenné na meranie a parametre na odhad
    • Algoritmy globálnej analýzy citlivosti (GSA).
    • Čo bude ďalej?
    • Cvičenia
    • Referencie
    • Transformačné metódy
    • Reprezentácie a riešenia spoločnosti Laplace Transform
    • Kľúčové vlastnosti Laplaceovej transformácie (LT) a jej inverznej (ILT)
    • Krátky stôl Laplaceových transformačných párov
    • Riešenie Laplaceovej transformácie obyčajných diferenciálnych rovníc (ODE)
    • Prehľad
    • Matrice
    • Vektorové priestory (V.S.)
    • Riešenie lineárnych rovníc
    • Miery a ortogonalita
    • Maticová analýza
    • Maticové diferenciálne rovnice
    • Dekompozícia singulárnej hodnoty (SVD) a analýza hlavných komponentov (PCA)
    • Vstupy a výstupy
    • Dynamické systémy, modely a kauzalita
    • Vstupno-výstupné (čierna skrinka) modely
    • Časová nemennosť (TI)
    • Vstupno-výstupné modely kontinuálneho lineárneho systému
    • Modely štruktúrovaných stavových premenných
    • Modely dynamického systému s diskrétnym časom
    • Zložené modely vstup-výstup a stavové premenné
    • Matica stavových prechodov pre lineárne dynamické systémy
    • Adjoint Dynamic System
    • Ekvivalentné dynamické systémy: Rôzne realizácie modelov stavových premenných – odhalená nejedinečnosť
    • Názorný príklad: A 3- Model dynamického systému oddelenia a niekoľko jeho diskretizovaných verzií
    • Transformácia vstupno-výstupných dátových modelov na modely stavových premenných: Zovšeobecnené vytváranie modelu
    • Základné pojmy a definície
    • Pozorovateľnosť a ovládateľnosť modelov lineárnych stavových premenných
    • Lineárne časovo premenné modely
    • Lineárne časovo invariantné modely
    • Ovládateľnosť výstupu
    • Ovládateľnosť výstupných funkcií
    • Dosiahnuteľnosť
    • Konštruovateľnosť
    • Kontrolovateľnosť a pozorovateľnosť s obmedzeniami
    • Pozitívna ovládateľnosť
    • Relatívna ovládateľnosť (dosiahnuteľnosť)
    • Podmienená ovládateľnosť
    • Štrukturálna ovládateľnosť a pozorovateľnosť
    • Vzťahy pozorovateľnosti a identifikovateľnosti
    • Kontrolovateľnosť a pozorovateľnosť stochastických modelov
    • Realizácie (modelovacie paradigmy)
    • Kanonická teoréma rozkladu
    • Ako rozložiť model
    • Testy ovládateľnosti a pozorovateľnosti s použitím ekvivalentných modelov
    • Pozorovateľné a kontrolovateľné kanonické formy z modelov ľubovoľných stavových premenných pomocou vlastností ekvivalencie
    • Ďalšie prediktorovo-korektorové algoritmy
    • Odvodenie informačného kritéria Akaike (AIC)
    • Informačná matica Stochastic Fisher (FIM): Definície a odvodenia

    Jozef Distefano

    „Profesor Joe“ – ako ho volajú jeho študenti – je uznávaným profesorom informatiky a medicíny a predsedom medziodborového programu výpočtovej a systémovej biológie na UCLA – bakalárskeho programu zameraného na výskum, ktorý pestoval a zdokonaľoval niekoľko desaťročí. Ako aktívny člen fakulty UCLA na plný úväzok takmer pol storočia tiež rozvíjal a viedol inovatívne postgraduálne doktorandské programy, vrátane výpočtovej systémovej biológie v informatike a biosystémovej vedy a inžinierstva v biomedicínskom inžinierstve. Od roku 1968 mentoroval študentov z týchto programov ako riaditeľ Biokybernetického laboratória UCLA a v roku 2003 mu boli udelené prestížne ocenenia UCLA Distinguished Teaching Award a Eby Award za kreatívne vyučovanie a v roku 2004 cena Lockeed-Martin Award for Teaching Excellence. Profesor Joe je tiež členom Spoločnosti biomedicínskeho inžinierstva. Hosťujúce profesúry zahŕňali stáže na univerzitách v Kanade, Taliansku, Švédsku a Spojenom kráľovstve a v roku 1979 bol Senior Fulbright-Hays Scholar v Taliansku.

    Profesor Joe je veľmi aktívny vo vydavateľskom svete. Ako redaktor od roku 1984 do roku 1991 založil a bol šéfredaktorom Modeling Methodology Forum – oddelenie siedmich časopisov American Journals of Physiology. Ako spisovateľ je autorom alebo spoluautorom oboch vydaní Feedback and Control Systems (Schaum-McGraw-Hill 1967 a 1990), viac ako 200 výskumných článkov a nedávno vydal svoju opusovú učebnicu: Dynamic Systems Biology Modeling and Simulation (Academic Press/Elsevier, november 2013 a február 2014).

    Veľká časť jeho výskumu bola založená na integrácii experimentálnych neuroendokrinných a metabolických štúdií u cicavcov a rýb s metodológiou matematického modelovania riadenou údajmi – silne motivovanou jeho skúsenosťami v „mokrom laboratóriu“. Jeho kľúčové príspevky k teórii a praxi modelovania sú v analýze štrukturálnej identifikovateľnosti (nejednoznačnosti parametrov), poháňanej experimentálnym zaťažením. Zaviedol pojmy interval a kvázi-identifikovateľnosť neidentifikovateľných dynamických systémov systémov a jeho laboratórium vyvinulo symbolické algoritmické prístupy a nový internetový softvér (webová aplikácia COMBOS) na výpočet kombinácií identifikovateľných parametrov. Ide o súhrnné časti inak neidentifikovateľných modelov, ktoré je možné kvantifikovať – so širokým využitím pri redukcii modelov (zjednodušení) a dizajne experimentov. Jeho dlhodobé príspevky ku kvantitatívnemu pochopeniu produkcie a metabolizmu hormónov štítnej žľazy u cicavcov a rýb sa nedávno vykryštalizovali do webovej aplikácie THYROSIM – pre internetový výskum a výučbu dynamiky hormónov štítnej žľazy u ľudí.

    V neposlednom rade, profesor Joe je vášnivý priamy jazzový saxofónista (alt a tenor), jeho alternatívna kariéra začala v 50-tych rokoch minulého storočia v New Yorku na strednej škole Stuyvesant – dočasne pozastavená, keď nastúpil na strednú školu, a pokračovala opäť na strednej škole. Vek. Nedávno pridal do svojho tréningového plánu hru na flautu a jeho a jeho kapelu – Acoustically Speaking – môžete občas nájsť na koncertoch v Los Angeles alebo Honolulu.

    Pridruženia a odbornosť

    Významný profesor Katedra počítačovej vedy, medicíny a biomedicínskeho inžinierstva, medzirezortný program výpočtovej a systémovej biológie UCLA Los Angeles CA


    Fakulta

    Čad Brasil, kolega z School of Biological Sciences, robí výskum v oblasti teoretickej ekológie využívaním matematiky, predovšetkým nelineárnych diferenciálnych rovníc, ako nástroja na pochopenie ekológie a evolúcie. Jeho primárnym teoretickým záujmom bolo skúmanie dôsledkov časových variácií pre základnú ekologickú teóriu. Súčasná práca začleňuje evolučnú dynamiku do modelov tropickej diverzity. Okrem toho využíva techniky maximálnej pravdepodobnosti na preklenutie priepasti medzi teoretickou a empirickou ekológiou.

    Bo Deng zaujíma sa o matematickú biológiu, ktorá zahŕňa: pôvod a vývoj kódov DNA, elektrickú neurofyziológiu a nervovú komunikáciu, chaos v potravinovej sieti a ekologickú stabilitu, dynamiku chorôb a modelovanie epidémií. Medzi hlavné nástroje, ktoré profesor Deng využíva vo svojich výskumných aktivitách, patria: teória informácií a komunikácie, obvody, diferenciálne rovnice, kvalitatívna teória dynamických systémov a aplikovaná nelineárna analýza. Profesor Deng dúfa, že prostredníctvom modelovania využije matematiku na lepšie pochopenie biologických procesov.

    Huijing DuHlavným výskumom je vývoj výpočtových a matematických modelov na štúdium biologických problémov kvantitatívnym spôsobom. S novým 3D hybridným rámcom, ktorý zahŕňa diskrétny stochastický model subcelulárnych prvkov, parciálne diferenciálne rovnice kontinua-difúzia-advekcia a stochastický model rozhodovania pre prechod bunkovej línie, jej výsledky ukazujú, ako modelovací prístup spájajúci biologicky relevantné škály môže poskytnúť nové pohľad na komplexné biologické problémy súvisiace so štruktúrou črevných krýpt, embryonálnym vývojom a regeneráciou epidermálneho tkaniva.

    Yu Jin má výskumný záujem o aplikovanú matematiku s hlavným zameraním na dynamické systémy a matematickú biológiu. Jej výskumná práca je spojením nelineárnej dynamiky a biológie. To zahŕňa vytvorenie vhodných matematických modelov (hlavne obyčajných/čiastočných/funkčných diferenciálnych rovníc a diferenčných rovníc) pre javy v priestorovej ekológii, populačnej dynamike a epidemiológii, ako aj matematickú a výpočtovú analýzu modelov. Jej súčasný výskum je zameraný najmä na priestorovú populačnú dynamiku, najmä na šírenie a pretrvávanie populácie v potokoch či riekach.

    Emeritný profesor Glenn Ledder pracuje v oblasti matematického modelovania pre biologické vedy a fyzikálne vedy. V súčasnosti pracuje s medzinárodným tímom rastlinných vedcov (vrátane Sabriny Russo z UNL School of Biological Sciences) na vývoji modelu fyziológie stromu, ktorý spája tok vody a fotosyntézu s vlastnosťami pôdy a podmienkami prostredia. Dlhodobým cieľom projektu je začleniť model fyziológie stromu do modelu dynamického energetického rozpočtu, ktorý dokáže sledovať rast stromu v priebehu času v rôznych prostrediach. Takýto model by bol užitočný pri predpovedaní reakcií stromových spoločenstiev na zmenu klímy. Zaujímajú ho aj modely, ktoré kombinujú populačnú dynamiku systémov dravec-korisť s optimálnym hľadaním potravy.

    Richard Rebarber má výskumné záujmy v oblasti matematickej ekológie a teórie riadenia distribuovaných parametrov. Jeho výskum v oblasti ekológie je v populačnej dynamike, vrátane: vplyvu neistoty parametrov (ako je chyba modelovania) a porúch (ako je globálne otepľovanie) na dlhodobý a prechodný rast populácie, aplikácia metód robustnej teórie riadenia na analýzu a manažment populácie vlastnosti stability nelineárnych modelov a analýza modelov so stochasticitou.

    Emeritný profesor Thomas Shores zaujíma sa o numerické riešenia obyčajných a parciálnych diferenciálnych rovníc, najmä tých singulárnych a nelineárnych rovníc, ktoré sú prístupné metódam sinc. Zaujíma sa aj o numerické metódy pre úlohy inverznej teórie, najmä o úlohy identifikácie parametrov v obyčajných a parciálnych diferenciálnych rovniciach. Vo všeobecnosti má výskumné záujmy v oblasti vedeckých výpočtov. Napokon sa zaujíma o matematické modelovanie populácií a problémy s pórovitým médiom.

    Brigitte Tenhumberg používa stochastické, diskrétne časové modely prispôsobené špecifickým biologickým systémom na zlepšenie pochopenia ekologických procesov. Modely, ktoré používa, zahŕňajú stochastické dynamické programovanie, maticové modely a simulačné modely založené na agentoch. Jednou z oblastí, na ktoré sa výskum kladie, je optimálne rozhodovanie zvierat (rozhodovanie o hľadaní potravy alebo o životnej histórii) alebo ľudí (manažment populácií voľne žijúcich živočíchov). Nedávna práca sa zaoberá témami inváznej ekológie, najmä pochopením ekologických mechanizmov podporujúcich odolnosť ekosystémov voči inváziám.

    Drew Tire je kolegom v Škole prírodných zdrojov. Jeho práca sa zameriava na používanie štatistických a mechanistických modelov dynamiky populácie jednotlivých druhov, ktoré pomáhajú manažérom prijímať informovanejšie rozhodnutia o zveri aj o neherných druhoch. Zaujíma sa o aplikáciu robustných kontrolných metód na štruktúrované modely populácie, optimalizačné metódy na rozhodnutia o ochrane a využívaní a bayesovské hierarchické modely na prieskum a zber údajov.

    Emeritný profesor Steve Dunbar má výskumné záujmy v oblasti nelineárnych diferenciálnych rovníc a aplikovaných dynamických systémov, najmä tých, ktoré vznikajú v matematickej biológii. V súvislosti s prácou s modelmi diferenciálnych rovníc a systémami matematickej biológie sa zaujíma aj o stochastické procesy, numerické a počítačom podporované riešenie diferenciálnych rovníc a matematické modelovanie. Zaujíma sa aj o problematiku matematického vzdelávania na stredoškolskej a vysokoškolskej úrovni. Je riaditeľom programu American Mathematics Competitions pri Americkej matematickej asociácii, ktorý sponzoruje matematické súťaže na stredných a stredných školách, ktoré vedú k výberu a výcviku delegácie USA na každoročnú medzinárodnú matematickú olympiádu. Okrem toho sa zaujíma o dokumentovanie trendov v zápisoch do kurzov matematiky na univerzitách ao používaní matematického softvéru na vyučovanie a učenie sa matematiky.

    Emeritná profesorka Wendy Hinesová robí výskum v dynamických systémoch. Zaujíma sa o všeobecnú teóriu a tiež o aplikácie na oneskorenie rovníc a parciálnych diferenciálnych rovníc. V súčasnosti pracuje na rovnici reakcie a difúzie s nelokálnou difúziou, ktorá modeluje šírenie génov v populácii. Toto je veľmi zaujímavý problém, pretože sa na ňom urobilo veľmi málo a odporuje aplikácii štandardných reakčno-difúznych metód.

    Emeritný profesor David Logan pracuje v oblastiach aplikovanej matematiky a ekologického modelovania. Medzi jeho záujmy patria obyčajné a parciálne diferenciálne rovnice, diferenčné rovnice a stochastické procesy. Jeho súčasný výskum v matematickej ekológii zahŕňa prácu na kolobehu živín, fyziologicky štruktúrovanej dynamike populácie, účinkoch globálnej zmeny klímy na ekosystémy a potravinové siete a ekofyziológii hmyzu.


    Čo sú selektívne médiá

    Selektívne médiá označujú typ rastového média, ktoré umožňuje rast vybraných mikroorganizmov v médiu. Napríklad, ak je konkrétny mikroorganizmus odolný voči určitému antibiotiku, ako je tetracyklín alebo ampicilín, toto antibiotikum sa môže pridať do média, čím sa zabráni rastu iných mikroorganizmov v tomto médiu. Selektívne rastové médiá tiež zabezpečujú prežitie a množenie mikroorganizmov s určitými vlastnosťami. Gén, ktorý dáva schopnosť rásť v selektívnom médiu, je známy ako marker. Eukaryotické bunky môžu tiež rásť v selektívnych médiách. Selektívne médiá pre eukaryotické bunky bežne obsahujú neomycín. Mikroorganizmus, ktorý rastie na selektívnom agarovom médiu, je znázornený v postava 1.


    Čo je spojitá variácia?

    V nepretržitej variácii sa bez prestávky demonštruje séria postupných zmien konkrétnej charakteristiky v populácii z jedného extrému do druhého. Rôzne charakteristiky populácie môžu vykazovať nepretržité variácie. Takéto vlastnosti sú tvorené kombinovaným účinkom polygénov a environmentálnych faktorov. Ak sa za príklad vezme populácia kráv, dojivosť nie je ovplyvnená len genetickými faktormi, ale aj faktormi prostredia. Ak sú pre vysoký výnos mlieka prítomné genetické faktory, môžu byť potlačené faktormi prostredia, ako je kvalita pastvy, nevhodná strava, extrémne poveternostné podmienky, choroby atď.

    Frekvenčné rozdelenie charakteristiky, ktorá predstavuje spojitú variáciu, je normálna distribučná krivka s typickým zvonovitým tvarom. V takejto krivke sa priemer, modus a medián považujú za rovnaké. Výška ľudí, hmotnosť, rozpätie rúk a veľkosť topánok sú niekoľko príkladov nepretržitých variácií.

    Obrázok 01: Tvar distribúcie spojitej variácie

    Ako je znázornené na obrázku vyššie, kontinuálna variácia kolíše okolo priemeru (priemeru) druhov. Táto variácia ukazuje hladkú krivku v tvare zvona v rámci populácie. Nepretržité variácie sú bežné a nenarúšajú genetický systém. Okrem toho sú tieto variácie spôsobené polygénnou dedičnosťou a sú často ovplyvnené vplyvmi prostredia.


    Výsledky a diskusia

    Výpočtový rámec

    The conceptual framework of MethylPurify is shown in Figure 1. Under the assumption that tumor tissues often contain two major components of cells, that is, tumor and normal, MethylPurify only takes WGBS or RRBS data from a tumor tissue as input, and tries to infer the unknown fraction of normal cells within. After removing duplicated reads and mapping them with BS-map [41], MethylPurify divides the reference genome into small 300 bp bins and assigns reads mapped to each bin. The true methylation levels in most bins are similar between the two components and thus not informative to tumor purity inference or differential methylation analysis. Instead, MethylPurify aims to find informative bins that have differential methylation between normal and tumor cells, and use them to help infer the tumor purity and the methylation level of each component. It relies on the following characteristics of the DNA methylome data: (1) all CpG cytosines within a short genomic interval (approximately 300 bp) in a pure cell population share similar methylation levels which are either mostly methylated or mostly unmethylated [36] (2) the number of bisulfite reads mapped to each genomic interval to tumor and normal cells are in accordance with their relative compositions in the mixture, subject to standard sampling noise.

    Overview of MethylPurify. (a) A differentially methylated region (DMR) between tumor and normal cells. Solid and hollow red circles represent methylated and unmethylated cytosines, respectively. (b) Short reads from two cell populations after bisulfite treatment and sonication. (c) A library of bisulfite reads in a mixture of two cell populations. (d) EM algorithm iteratively estimates three parameters: the minor composition (α1) and the methylation level of each population (m1, m2) in M step, and assigns reads to each population in E step. (e) Among all 300 bp bins, the parameters estimated from informative bins converge on a final mixing ratio estimate. (f) Top, density plot of predicted minor component from selected informative bins. Bottom, separated methylation level of tumor and normal cells based on the predicted mixing ratio, and DMRs are detected as consecutive differentially methylated bins (DMBs).

    MethylPurify uses the following mixture model to estimate the two components in the tumor methylome data. Given a mixture of bisulfite reads from two components, the relative compositions of the minor and major components can be represented as α1 and 1 - α1, and the methylation levels of the two components within each 300 bp bin can be represented as m1 a m2, resp. Given initial parameter values of α1, m1, a m2, each read in a bin can be assigned to its most likely component given the read assignment in a bin, parameter values of α1, m1, a m2 can be re-estimated to maximize the probability of seeing the specified read assignment. For each 300 bp bin across the genome, MethylPurify uses expectation maximization (EM) to iteratively estimate parameters and assign reads until convergence (see Methods section for details).

    Due to the sampling noise and other confounding biases, α1 estimates from individual bins will be distributed around the true value. To reach a more reliable mixing ratio from all α1 estimates, MethylPurify uses the following bootstrapping approach to prioritize the informative bins. First, it selects only bins with over 10 CpGs, 10-fold read coverage (termed qualifying bins thereafter), then samples equal number of reads as the actual number of reads in each bin with replacement 50 times to get 50 sets of EM converged α1, m1, a m2 parameters. To avoid complications of copy number aberrations (CNA) in cancer at this step, MethylPurify filters bins in regions with frequent copy number alterations as well as their 1,000 bp flanking regions, and only selects one qualifying bin within each CpG island. Then MethylPurify finds the 500 bins with the smallest parameter variance in the 50 sampling and uses the mode of their α1 estimate as the α1 for the whole tumor sample (Figure 1e,f). With the sample α1, a few EM iterations in each bin could quickly converge on the m1 a m2 estimates and read assignment across the genome. To avoid local maxima of EM, MethylPurify starts from two distinct initial values of m1 a m2 in each bin, representing α1 component being hyper- and hypo-methylated, and the convergence point with higher likelihood is selected as the final prediction (see Methods section for details).

    The output of MethylPurify will report the mixing ratio of the two components (α1: 1 - α1) in the whole sample and the methylation level of each component (m1 a m2) in each qualifying bin across the genome. MethylPurify could also detect differentially methylated regions (DMRs) as consecutive differentially methylated bins (DMBs).

    Inference of mixing ratio from simulated mixture of bisulfite reads from tumor and normal cell lines

    To validate MethylPurify in estimating the mixing ratio, we used simulated mixture of whole genome bisulfite sequencing data from two separate breast cell lines [22]. HCC1954 cell line (thereafter refer to as HCC) is derived from an estrogen receptor (ER)/progesterone receptor (PR) negative and ERBB2 positive breast tumor, and human mammary epithelial cell line (HMEC) is immortalized from normal breast epithelial cells. Bisulfite sequencing for the two cell lines have slightly different read lengths (approximately 70 to 100 bp) and sequencing coverage (27-fold and 20-fold, respectively). We randomly sampled bisulfite reads from the two cell lines at 20-fold total coverage with varying mixing ratios from 0:1 (all HMEC) to 1:0 (all HCC) with a step of 0.05.

    We first examined how the parameter estimation varies with changing inputs. At different mixing ratios, the average variance (of all qualifying bins by bootstrapping) of the minor component percentage α1 is very small and stable (Figure 2a). The variance of α1 initially increases with the mean of α1, but is suppressed as α1 approaches 0.5 since α1 is designated as the minor component to be always ≤0.5 in our model. In contrast, the estimated methylation level of the minor component m1 is the most variable. This is reasonable because at low α1 (close to 0), the minor component has very little read coverage at high α1 (close to 0.5), it is sometimes difficult to determine which component is minor so m1 could fluctuate depending on whether MethylPurify assigns the methylated or unmethylated reads to the minor component.

    Parameter estimation and properties of informative bins. (a) Averaged standard deviations of three free parameters at different mixing ratios by bootstrap sampling of HCC (breast cancer) and HMEC (normal mammary epithelial) cell lines for all qualifying bins. (b) Predicted mixing ratios at different standard derivation cutoffs of the minor composition. (c, d) Some properties of informative bins compared with genome-wide background. (c) The number of CpG counts in informative bins vs. the rest bins with over 10 fold read coverage. (d) Distribution of predicted methylation levels of informative bins in each cell line.

    Od r m1 is the most variable among the three parameters and dominates the sum of the variances, MethylPurify later only uses the standard deviation (stdev) of m1 from bootstrapping to rank all qualifying bins. Indeed, the informative bins, defined as qualifying bins with m1 stdev <0.1 (after filtering CNA regions and selecting one bin with smallest stdev from each CpG island), in general give very stable α1 estimates at different mixing ratios (Figure 2b). A closer examination of the informative bins found that they often contain significantly more CpGs (Figure 2c), and have a strong dichotomy of reads being either mostly methylated (1) or mostly unmethylated (0) (Figure 2d). So in the remaining text, the top 500 informative bins with the smallest parameter variance by bootstrap were used to vote for the mixing ratio for the whole sample.

    We then evaluated whether MethylPurify could correctly infer the mixing ratio of the two components. When given a pure cell line without mixing, MethylPurify correctly reported a warning for insufficient number (66 and 322 for HMEC and HCC cell lines, respectively) of informative bins. Further examination of such bins in HCC cell line suggested that they have significant overlap with ASM regions [22] (P = 0.0086 by Fisher’s exact test). For all samples with real mixing, MethylPurify identified sufficient number of informative bins across the genome (see Additional file 1: Figure S1 as an example), and their respective α1 estimates are often centered around the true α1 (Figure 3a). Over 20 repeated simulations at each mixing ratio, MethylPurify gives predicted α1 that tightly surrounds the true α1 with two interesting twists (Figure 3b,c). The first is that since MethylPurify dictates α1 to represent the minor component, α1 estimates tend to be slightly lower when the mixing is close to 0.5:0.5. The second is that MethylPurify tends to slightly under estimate the cancer component. This might be because even as cell lines, the cancer HCC is more heterogeneous than the normal HMEC, as supported by the larger number of informative bins in HCC than HMEC alone, causing the EM algorithm to assign a small portion of the HCC reads to the HMEC component. This implies that in tumor samples, MethylPurify might also tend to slightly underestimate the tumor percentage due to tumor heterogeneity.

    Prediction performance on simulated data. (a) Histogram of the predicted mixing ratio from selected informative bins insimulation results when bisulfite reads of HCC and HMEC cell lines are mixed at different ratios. Dotted blue lines highlight the true minor components. Black line is the density of the predicted mixing ratio. (b, c) Predicted minor compositions (α1) at different mixing ratios where the composition of tumor cell line is above 50% (b) or below 50% (c). Error bars represent standard derivations derived from 20 mixing simulations.

    Detection of differentially methylated bins in the simulated mixture

    We next evaluated whether MethylPurify could correctly predict the methylation level of each component in the mixture and identify the differentially methylated regions between the two components. At HCC and HMEC mixing ratio of 0.7:0.3, we analyzed all 90,748 qualifying bins (300 bp with over 10 CpGs and over 10-fold coverage) to evaluate the performance. Under the gold standard of methylation difference >0.5 between the two pure cell lines, we found that MethylPurify could predict differentially methylated bins at 96.5% sensitivity and 88.0% specificity (Figure 4a). At coverage range from 10-fold to 40-fold, the performance of MethylPurify decreases only slightly with decreased coverage, although the number of qualifying bins with enough coverage decreases (Additional file 2: Figure S2).

    Predicted DMBs (DMBs predicted to have methylation difference over 0.5 from mixture reads by MethyIPurify) are compared with true DMBs (DMBs inferred from BS-seq reads in two separate cell lines) in HCC and HMEC cell lines. (a) Overlap between predicted (from mixture, red) and true (blue) DMBs in the mixture of HCC1954 (70%) and HMEC (30%). (b, c) Correlations of predicted and true methylation levels in normal (b) and tumor cell line (c) for qualifying bins. (d) An example of differentially methylated region between HCC and HMEC cell lines. Each point represents one qualifying bin of length 300 bp. HMEC.t and HCC.t are true methylation profiles in this region, while HMEC.p and HCC.p are predicted methylation profiles from mixture reads. (e) Correlation of predicted and true methylation differences. (f) DMB prediction sensitivity and correlation of methylation between predicted and true differential methylation at different mixing ratio of the two cell lines.

    Detailed examinations revealed that in the true positive predicted regions HMEC is often fully unmethylated (0) while HCC is fully methylated (1). This is consistent with many studies showing that cancer samples often have global hypomethylation and CpG promoter hypermethylation [42]-[45]. In contrast, in the false positive bins, the methylation levels in the individual cell lines are often at intermediate levels (Additional file 3: Figure S3). These might represent the methylation variability regions previously reported in tumor DNA methylation studies [14],[46],[47], and might cause reads to be assigned to the wrong component. For example, a tumor sample has 1/3 normal and 2/3 cancer, and in one region the methylation level of the normal and cancer components are 0% and 50%, respectively. Assume MethylPurify correctly estimated the minor component α1 to be 1/3, it would naturally assign the 1/3 methylated reads to the minor normal component, and 2/3 unmethylated reads to the major cancer component. In this case, although MethylPurify incorrectly called the cancer component as hypomethylated, it nonetheless correctly identified this region as differentially methylated, whereas a standard cancer/normal differential call might miss it.

    To reduce the above effect of tumor heterogeneity, we removed bins that show strong read methylation variability (var >0.1) in the HCC (Additional file 4: Figure S4). We then examined whether DNA methylation levels of the two components can be correctly estimated in the remaining qualifying bins. The correlation between the true and predicted methylation level is at 0.89 for the minor normal component and 0.98 for the major tumor component, respectively (Figure 4b,c). Figure 4d is an example showing the true and predicted methylation levels from each cell line in the mixture. The predicted methylation difference from the cell line mixture is highly correlated with the estimated methylation difference by directly comparing the two individual cell lines (Figure 4e). Further examination of bins that were called in the wrong directions found many to have lower sequence coverage. This suggests that the mixture sampling might introduce biases, i.e. the mixing at specific bins could be off from the genome-wide ratio of 0.7:0.3. In fact, if we examine only bins with >15-fold coverage, the correlation of methylation difference estimated from individual cell lines vs. mixture increased from 0.71 to 0.75.

    We then tested the performance of MethylPurify when the normal (HMEC) component of the mixture varies from 0.1 to 0.5. When the mixing ratio is close to 0.5:0.5, determining which component is hypo- or hyper-methylated becomes an unidentifiable problem, so the correlation between the true and predicted methylation difference in the two components drops. Nonetheless, our ability to correctly call regions of differential methylation increases with the minor component percentage, from 89.4% at 0.1:0.9 mixing to 98.4% at 0.5:0.5 mixing, because there is enough coverage on each component to confidently identify bins with discordant methylation reads (Figure 4f).

    Application of MethylPurify to lung cancer tissues

    With the success of MethylPurify on cell line mixing simulations, we next tested MethylPurify on real tumors. We conducted reduced representation bisulfite sequencing on five primary lung adenocarcinoma samples as well as their respective adjacent normal tissues, and obtained approximately 15 to 40 million 90 bp reads for each sample. MethylPurify was able to process each tumor sample within 1 h on a single core, and estimated the normal component in the tumors to be between 18% and 33% (Figure 5a). In these samples, the true normal percentage in each tumor sample is unknown. In addition, methylation differences have been reported to well precede pathological differences, which have been used to predict cancer risk [48]. Therefore, we instead focused on evaluating differentially methylated regions called by MethylPurify from tumor samples alone, using the tumor to normal comparison as the gold standard. In this standard, a 300 bp bin is defined as differentially methylated if the average methylation difference between cancer and normal in the region exceeds 0.5. We also tried other cutoffs to call differential methylation and got similar results (data not shown).

    Application of MethylPurify to the lung adenocarcinoma samples. (a) Distribution of informative bins and the calculated minor components of five primary lung adenocarcinoma samples. (b) The numbers of DMBs inferred from normal-tumor comparison (blue, true DMB), predicted DMB by MethylPurify from only tumor tissue (red) and DMB inferred from TCGA (green) for each sample. (c-g) Violin plots show the distributions of CpG counts (c), read counts (d), tumor/normal methylation differences (e), tumor methylation levels (f), and numbers of lung adenocarcinoma samples with copy number alteration in TCGA (g) for false negative (FN), true positive (TP), false positive (FP), and true negative (TN) bins.

    For each sample, we divided the genome into 300 bp bins and only considered qualifying bins with >10 CpG and >10-fold read coverage. Due to different sequencing depth on the different samples, the number of qualifying bins in different samples varies. We then examined the Cancer Genome Atlas (TCGA) lung adenocarcinoma methylation data [49] and used the differential methylated regions in TCGA that overlap with the qualifying bins in each sample to determine the number of differential DNA methylated bins to call in each sample. Differentially methylated bins called either from tumor samples alone or from the tumor to normal comparisons are both ranked by their absolute differential methylation levels, respectively. Using the tumor to normal comparison as gold standard, MethylPurify calls in the tumor samples alone could achieve sensitivity of over 57% and specificity of over 91% in the five samples tested (Figure 5b).

    We then examined the false negatives and false positive predictions MethylPurify made on the tumor samples alone. Using sample 137B as an example since it has the best sequencing coverage, we found that the regions with false negative predictions often have fewer CpG count (P <2.2e-16, t-test, Figure 5c), lower coverage (P = 0.0037, Figure 5d), and smaller methylation differences (P <2.2e-16, Figure 5e) between tumor and normal. In contrast, the false positive bins are more similar to true positive ones in CpG count (P = 0.73) and read coverage (P = 0.83). Interestingly, their absolute DNA methylation in the tumor samples show more intermediate levels instead of the dichotomy of 0 for unmethylated or 1 for methylated (Figure 5f), and they often contain many reads with discordant methylation levels. They suggest that such regions are indeed differentially methylated, but were not detected in the normal cancer comparison because tumor heterogeneity reduced the observed normal to tumor methylation difference (Figure 5e). Indeed, among the false positive bins MethylPurify called from tumor alone, 25% to 32% have differential methylation support in TCGA lung adenocarcinoma data (Figure 5b). This suggests that these `false positives' should have been correct calls, but were missed by the tumor/normal comparison potentially due to tumor heterogeneity. This percentage is similar to the 24% to 29% true negative calls with TCGA support, implying that the differential methylation called by MethylPurify from the tumor samples alone is as good as the tumor/normal comparison.


    DISKUSIA

    BMPRII-LF is unique among the TGF-β superfamily receptors due to a C-terminal extension of 512 amino acids in its cytoplasmic domain. The functional significance of this extension was supported by demonstration of its binding to diverse cellular factors, including the endocytic protein EPS15R (Hartung a kol., 2006), the dynein light chain Tctex-1 (Machado a kol., 2003), the kinases cGKI (Schwappacher a kol., 2009) and LIMK (Lee-Hoeflich a kol., 2004), and Trb3, a regulator of Smurf1 stability and Smad-dependent signaling output (Chan a kol., 2007). In different cellular contexts, such interactions were proposed to influence BMPRII Smad-dependent and Smad-independent signaling, BMPRII trafficking, and BMP-induced differentiation of distinct cell types. Moreover, the lethality of mice homozygous for BMPRII-SF but lacking BMPRII-LF (Leyton a kol., 2013), the presence of disease-causing mutations within this C-terminal extension (exon 12) in PAH (Thomson a kol., 2000 Machado a kol., 2001), and the proposed role for differences in the expression ratio between BMPRII-SF and BMPRII-LF in determining the penetrance of PAH (Cogan a kol., 2012) further demonstrate the importance of this molecular domain. However, the role(s) of this C-terminal extension (either at the level of coding sequence or protein) in the synthesis, degradation, and trafficking of BMPRII had not been addressed. Here we show that molecular determinants within the mRNA sequence and/or encoded by exon 12 of BMPRII regulate its synthesis and clathrin-mediated internalization. This differential regulation of alternatively spliced forms of BMPRII has direct implications for the overall and plasma membrane–localized steady-state levels of the BMPRII receptor forms, the kinetics of their degradation, and the intensity of their ability to activate the Smad1/5/8 pathway in response to ligand.

    Our studies on the steady-state expression levels of BMPRII-SF, BMPRII-LF, and their mutants demonstrate that the C-terminal extension unique to BMPRII-LF has two elements that reduce its expression relative to BMPRII-SF. The major effects are contributed by the very C-terminal end of BMPRII-LF, accompanied by a contribution from the region between TC6 and TC7 (Figures 1 and 2). These differences are detected also at the level of the cell surface expression of the receptors, for which the contribution of the region between TC6 and TC7 is even more accentuated (Figure 4). To delineate further the mechanisms involved, we used an experimental setup based on metabolic pulse labeling of exogenously expressed isoforms and mutants of BMPRII (at equimolar levels) under the same promoter and with the same 5’-untranslated region (UTR) and 3’-UTR regions (Figure 2). This allowed us to identify the regulation of the synthesis of BMPRII isoforms at the level of translation. We show that the most-3’ region of exon 12 (99 nucleotides, numbers 4181–4279, encoding 32 amino acids and a stop codon), which is unique to BMPRII-LF and is predicted to fold into a stem-loop–based secondary structure (Figure 3B), attenuates the expression of BMPRII (Figures 2 and 3) on a translational level (Figure 2). Multiple molecular mechanisms have been proposed to regulate protein translation, including adaptation to the tRNA pool (codon usage), charge of amino acids that are incorporated in the polypeptide chain, mRNA folding energy, and different activities of RNA-binding proteins (Kozak, 1986 Wells, 2006 Ingolia a kol., 2011 Tuller a kol., 2011 Pop a kol., 2014). Here we show that the reduced expression of BMPRII-LF and BMPRII-SFM (the BMPRII-SF mutant extended by addition of 99 coding nucleotides, numbers 4181–4279, from the 3’ end of BMPRII-LF) correlates with the presence of an RNA sequence with structure-forming tendencies, which can also attenuate the expression of unrelated proteins such as GFP (Figure 3, E and F). Of note, such secondary RNA structures are the basis of recognition by numerous RNA-binding proteins (Draper, 1995). In addition, when translation is carried out in endoplasmic reticulum-tethered polysomes, negative regulation of elongation would be expected to result in an overall decrease in the level of the protein being synthesized (e.g., BMPRII-LF). Within the TGF-β superfamily of receptors and ligands, TGF-β1 and TGF-β3 have been suggested to be regulated at the level of translation (Arrick a kol., 1991 Fraser a kol., 2002). To our knowledge, the present study is the first to report on such regulation of a receptor from this superfamily. Note that the differences in expression of BMPRII-SF and BMPRII-LF are greater than those between BMPRII-SF and BMPRII-SFM, attesting to the additional regulatory element(s) (e.g., the endocytosis signal that enhances BMPRII-LF degradation Figure 8).

    Numerous studies on the endocytosis of receptors of the TGF-β superfamily suggested CME as the major internalization pathway a potential contribution by caveolar endocytosis has been contentious (Ehrlich a kol., 2001 Yao a kol., 2002 Di Guglielmo a kol., 2003 Mitchell a kol., 2004 Hartung a kol., 2006 Chen, 2009 Hirschhorn a kol., 2012 Shapira a kol., 2012). Moreover, conflicting results were obtained when addressing the roles for endocytosis of the receptors in the regulation of activation of Smad signaling pathways (Hayes a kol., 2002 Penheiter a kol., 2002 Di Guglielmo a kol., 2003 Hartung a kol., 2006 Chen a kol., 2009 Chen, 2009 Hirschhorn a kol., 2012 Kim a kol., 2012 Shapira a kol., 2012, 2014 Umasankar a kol., 2012). Such conflicts may reflect the reliance on treatments (chemical or genetic) that alter/inhibit altogether CME and/or caveolar endocytosis, since such general treatments affect not only the endocytosis of the respective receptors, but also the endocytosis, distribution, and trafficking of numerous cellular factors. In the present study, we identified CME as the major endocytosis pathway of BMPRII and reported marked differences in the endocytic potential of the alternatively spliced forms of BMPRII (i.e., lack of endocytosis of BMPRII-SF Figure 5). Moreover, we identified a previously unknown CME-targeting signal, of the dileucine class of endocytic motifs, localized at the C-terminal of BMPRII-LF (Figure 6). On the basis of this finding, we generated an endocytosis-defective BMPRII-LF mutant (BMPRII-LF-AA) and used it, together with the naturally alternatively spliced forms of BMPRII, to investigate the relationship between BMPRII endocytosis, expression level, degradation, and signaling (Figures 6–9).

    Note that the different endocytosis rates of BMPRII-LF and BMPRII-LF-AA affect their cell surface expression levels, as measured by the proteinase K digestion assay (Figure 7). The approximately twofold difference between their surface expression levels correlates with a similarly higher degradation rate for the endocytosis-capable BMPRII-LF (Figure 8). The slower degradation of BMPRII-LF-AA appears to be due to the fact that it does not undergo endocytosis, since it is similar to that of BMPRII-SF, which also lacks the endocytosis-targeting motif (Figure 8). This conclusion is in line with the very similar decrease in the cell surface expression level between TC6 (which lacks the endocytosis motif) and TC7 (Figure 4). Moreover, in contrast to the endocytosis-defective BMPRII-SF and BMPRII-LF-AA, the degradation of BMPRII-LF is sensitive to both proteasomal and lysosomal inhibitors, in line with its significantly faster endocytosis (Figure 8G). These results are in line with a report that chloroquine increases cell surface BMPRII-LF levels and restores BMP9 signaling in endothelial cells harboring PAH-related BMPRII mutations (Dunmore a kol., 2013). The notion of a positive correlation between the cell surface expression levels of BMPRII and the activation intensity of pSmad1/5/8 by BMP is also supported by the results depicted in Figure 9A, where BMPRII-SF higher surface expression correlated with increased levels of pSmad1/5/8. Because this BMPRII variant is hardly endocytosed, these findings may imply that endocytosis of BMPRII is dispensable for Smad1/5/8 activation. This notion is validated by the insensitivity of endogenous Smad1/5/8 activation by BMP2 to the CME inhibitor PitStop (Figure 9, B–D).

    Taken together, the data in the present study support the notion that the expression levels and plasma membrane levels of BMPRII are determined by two molecular processes—translational regulation of protein synthesis (which provides the major contribution) and endocytosis/degradation (mild modulatory effect). Both mechanisms enhance the expression of BMPRII-SF relative to BMPRII-LF at the cell surface (where the receptors are exposed to stimulation by exogenous ligands), resulting in activation of the Smad1/5/8 pathway at elevated intensities. Of interest, BMPRII-SF was reported to be incapable of associating with and activating at least a subset of non-Smad BMP signals (Foletta a kol., 2003 Lee-Hoeflich a kol., 2004), implying that the alternative splicing of BMPRII may be an important regulator of the balance of activation of canonical versus noncanonical signals by BMPs.


    Obsah

    There are two different types of DSC: Heat-flux DSC which measures the difference in heat flux between the sample and a reference and Power differential DSC which measures the difference in power supplied to the sample and a reference. [ potrebná citácia ]

    Heat-flux DSC Edit

    With Heat-flux DSC, the changes in heat flow are calculated by integrating the ΔTref- curve. For this kind of experiment, a sample and a reference crucible are placed on a sample holder with integrated temperature sensors for temperature measurement of the crucibles. This arrangement is located in a temperature-controlled oven. Contrary to this classic design, the distinctive attribute of MC-DSC is the vertical configuration of planar temperature sensors surrounding a planar heater. This arrangement allows a very compact, lightweight and low heat capacitance structure with the full functionality of a DSC oven. [4]

    Power differential DSC Edit

    For this kind of setup, also known as Power compensating DSC, the sample and reference crucible are placed in thermally insulated furnaces and not next to each other in the same furnace like in Heat-flux-DSC experiments. Then the temperature of both chambers is controlled so that the same temperature is always present on both sides. The electrical power that is required to obtain and remain this state is then recorded instead of the temperature difference of the two crucibles. [5]

    The basic principle underlying this technique is that when the sample undergoes a physical transformation such as phase transitions, more or less heat will need to flow to it than the reference to maintain both at the same temperature. Whether less or more heat must flow to the sample depends on whether the process is exothermic or endothermic. For example, as a solid sample melts to a liquid, it will require more heat flowing to the sample to increase its temperature at the same rate as the reference. This is due to the absorption of heat by the sample as it undergoes the endothermic phase transition from solid to liquid. Likewise, as the sample undergoes exothermic processes (such as crystallization) less heat is required to raise the sample temperature. By observing the difference in heat flow between the sample and reference, differential scanning calorimeters are able to measure the amount of heat absorbed or released during such transitions. DSC may also be used to observe more subtle physical changes, such as glass transitions. It is widely used in industrial settings as a quality control instrument due to its applicability in evaluating sample purity and for studying polymer curing. [6] [7] [8]

    An alternative technique, which shares much in common with DSC, is differential thermal analysis (DTA). In this technique it is the heat flow to the sample and reference that remains the same rather than the temperature. When the sample and reference are heated identically, phase changes and other thermal processes cause a difference in temperature between the sample and reference. Both DSC and DTA provide similar information. DSC measures the energy required to keep both the reference and the sample at the same temperature whereas DTA measures the difference in temperature between the sample and the reference when the same amount of energy has been introduced into both. [ potrebná citácia ]

    The result of a DSC experiment is a curve of heat flux versus temperature or versus time. There are two different conventions: exothermic reactions in the sample shown with a positive or negative peak, depending on the kind of technology used in the experiment. This curve can be used to calculate enthalpies of transitions. This is done by integrating the peak corresponding to a given transition. It can be shown that the enthalpy of transition can be expressed using the following equation:

    Differential scanning calorimetry can be used to measure a number of characteristic properties of a sample. Using this technique it is possible to observe fusion and crystallization events as well as glass transition temperatures Tg. DSC can also be used to study oxidation, as well as other chemical reactions. [6] [7] [9]

    Glass transitions may occur as the temperature of an amorphous solid is increased. These transitions appear as a step in the baseline of the recorded DSC signal. This is due to the sample undergoing a change in heat capacity no formal phase change occurs. [6] [8]

    As the temperature increases, an amorphous solid will become less viscous. At some point the molecules may obtain enough freedom of motion to spontaneously arrange themselves into a crystalline form. This is known as the crystallization temperature (Tc). This transition from amorphous solid to crystalline solid is an exothermic process, and results in a peak in the DSC signal. As the temperature increases the sample eventually reaches its melting temperature (Tm). The melting process results in an endothermic peak in the DSC curve. The ability to determine transition temperatures and enthalpies makes DSC a valuable tool in producing phase diagrams for various chemical systems. [6]

    Differential scanning calorimetry can also be used to obtain valuable thermodynamics information about proteins. The thermodynamics analysis of proteins can reveal important information about the global structure of proteins, and protein/ligand interaction. For example, many mutations lower the stability of proteins, while ligand binding usually increases protein stability. [10] Using DSC, this stability can be measured by obtaining Gibbs Free Energy values at any given temperature. This allows researchers to compare the free energy of unfolding between ligand-free protein and protein-ligand complex, or wild type and mutant proteins. DSC can also be used in studying protein/lipid interactions, nucleotides, drug-lipid interactions. [11] In studying protein denaturation using DSC, the thermal melt should be at least to some degree reversible, as the thermodynamics calculations rely on chemical equlibrium. [11]

    The technique is widely used across a range of applications, both as a routine quality test and as a research tool. The equipment is easy to calibrate, using low melting indium at 156.5985 °C for example, and is a rapid and reliable method of thermal analysis. [ potrebná citácia ]

    Polymers Edit

    DSC is used widely for examining polymeric materials to determine their thermal transitions. Important thermal transitions include the glass transition temperature (Tg), crystallization temperature (Tc), and melting temperature (Tm). The observed thermal transitions can be utilized to compare materials, although the transitions alone do not uniquely identify composition. The composition of unknown materials may be completed using complementary techniques such as IR spectroscopy. Melting points and glass transition temperatures for most polymers are available from standard compilations, and the method can show polymer degradation by the lowering of the expected melting temperature. Tm depends on the molecular weight of the polymer and thermal history. [ potrebná citácia ]

    The percent crystalline content of a polymer can be estimated from the crystallization/melting peaks of the DSC graph using reference heats of fusion found in the literature. [12] DSC can also be used to study thermal degradation of polymers using an approach such as Oxidative Onset Temperature/Time (OOT) however, the user risks contamination of the DSC cell, which can be problematic. Thermogravimetric Analysis (TGA) may be more useful for decomposition behavior determination. Impurities in polymers can be determined by examining thermograms for anomalous peaks, and plasticisers can be detected at their characteristic boiling points. In addition, examination of minor events in first heat thermal analysis data can be useful as these apparently "anomalous peaks" can in fact also be representative of process or storage thermal history of the material or polymer physical aging. Comparison of first and second heat data collected at consistent heating rates can allow the analyst to learn about both polymer processing history and material properties. [ potrebná citácia ]

    Liquid crystals Edit

    DSC is used in the study of liquid crystals. As some forms of matter go from solid to liquid they go through a third state, which displays properties of both phases. This anisotropic liquid is known as a liquid crystalline or mesomorphous state. Using DSC, it is possible to observe the small energy changes that occur as matter transitions from a solid to a liquid crystal and from a liquid crystal to an isotropic liquid. [7]

    Oxidative stability Edit

    Using differential scanning calorimetry to study the stability to oxidation of samples generally requires an airtight sample chamber. It can be used to determine the oxidative-induction time (OIT) of a sample. Such tests are usually done isothermally (at constant temperature) by changing the atmosphere of the sample. First, the sample is brought to the desired test temperature under an inert atmosphere, usually nitrogen. Then, oxygen is added to the system. Any oxidation that occurs is observed as a deviation in the baseline. Such analysis can be used to determine the stability and optimum storage conditions for a material or compound. [6]

    Safety screening Edit

    DSC makes a reasonable initial safety screening tool. In this mode the sample will be housed in a non-reactive crucible (often gold or gold-plated steel), and which will be able to withstand pressure (typically up to 100 bar). The presence of an exothermic event can then be used to assess the stability of a substance to heat. However, due to a combination of relatively poor sensitivity, slower than normal scan rates (typically 2–3 °C/min, due to much heavier crucible) and unknown activation energy, it is necessary to deduct about 75–100 °C from the initial start of the observed exotherm to navrhnúť a maximal temperature for the material. A much more accurate data set can be obtained from an adiabatic calorimeter, but such a test may take 2–3 days from ambient at a rate of a 3 °C increment per half-hour. [ potrebná citácia ]

    Drug analysis Edit

    DSC is widely used in the pharmaceutical and polymer industries. For the polymer chemist, DSC is a handy tool for studying curing processes, which allows the fine tuning of polymer properties. The cross-linking of polymer molecules that occurs in the curing process is exothermic, resulting in a negative peak in the DSC curve that usually appears soon after the glass transition. [6] [7] [8]

    In the pharmaceutical industry it is necessary to have well-characterized drug compounds in order to define processing parameters. For instance, if it is necessary to deliver a drug in the amorphous form, it is desirable to process the drug at temperatures below those at which crystallization can occur. [7]

    General chemical analysis Edit

    Freezing-point depression can be used as a purity analysis tool when analysed by differential scanning calorimetry. This is possible because the temperature range over which a mixture of compounds melts is dependent on their relative amounts. Consequently, less pure compounds will exhibit a broadened melting peak that begins at lower temperature than a pure compound. [7] [8]


    Pozri si video: Лекция 5: Скобки Пуассона, дифференциальные формы и поливекторы (August 2022).