PLOS ONE: Previsão das Regiões Cancer-risco potencial Baseado em transcriptoma de dados: Para uma View

Comprehensive

Abstract

Um novo gasoduto integrativa é apresentado para a descoberta de potenciais regiões câncer susceptibilidade (PCSRs) calculando o número de genes alterados em cada região cromossômica, utilizando conjuntos de dados de expressão de microarranjo de diferentes cancros humanos (HC). Nossa nova abordagem compreende prevendo principalmente PCSRs seguido pela identificação de genes-chave nessas regiões para obter possíveis regiões que abrigam novas variantes associadas a cancro. Além de encontrar novas variantes causais câncer, outra vantagem na previsão de tais regiões de risco é o estudo simultâneo de diferentes tipos de variantes genômicas em linha com foco em regiões cromossômicas específicas. Usando esta conduta extraímos número de regiões com níveis de expressão muito alterados em condição de cancro. redes reguladoras também foram construídos para diferentes tipos de cancros após a identificação de mRNA alterado e microRNAs. Curiosamente, os resultados mostraram que a GAPDH, LIFR, ZEB2, mir-21, mir-30a, mir-141 e miR-200c, todos localizados na PCSRs, são fatores alterados comuns em redes construídas. Encontramos um número de aglomerados de mRNAs alterados e miRNAs em PCSRs previstos (

por exemplo

.12p13.31) e seus reguladores comuns, incluindo KLF4 e SOX10. previsão de grande escala das regiões de risco com base em dados de transcriptoma pode abrir uma janela no estudo abrangente dos fatores de risco de câncer e outras doenças humanas

Citation:. Alisoltani A, Fallahi H, Ebrahimi M, Ebrahimi M, Ebrahimie E ( 2014) Previsão das Regiões Cancer-risco potencial Baseado em transcriptoma de dados: Rumo a uma visão abrangente. PLoS ONE 9 (5): e96320. doi: 10.1371 /journal.pone.0096320

editor: William B. Coleman, University of North Carolina School of Medicine, Estados Unidos da América

Recebido: 23 Janeiro, 2014; Aceito: 07 de abril de 2014; Publicado em: 05 de maio de 2014

Direitos de autor: © 2014 Alisoltani et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Os autores não têm apoio ou financiamento para relatar

Conflito de interesses:.. os autores declararam que não existem interesses conflitantes

Introdução

a alteração na mRNAs e miRNAs expressão e o importante papel de um grande número destas moléculas foram estudados no início, a progressão e metástase de vários tipos de cancros [1], [2], [3] _ENREF_1. Alterações na metilação do ADN e factor de transcrio (TF) regulação, genómico variação do número de cópias (CNV) [4], o polimorfismo único nucleótido (SNP) [5] e microssatélite alternância [6], bem como outras aberrações cromossómicas são caracterizados como principais mecanismos de alternância expressão em diferentes cancros humanos (HCs).

métodos diferentes, incluindo estudos de associação de genoma de largura (GWAS) identificaram um grande número de variantes associadas para diferentes tipos de câncer [7], [8], [9]. Por exemplo, as variantes comuns na região 19p13 foram encontrados para ser associado com cancro do ovário [10], CNVs em 6q13 e cinco loci de risco em 21q21.3, 5p13.1, 21q22.3, 22q13.32 e 10q26.11 estavam diretamente ligados ao câncer de pâncreas [4], [11]. Além disso, novos loci de risco em 10q25.2, 6q22.2 e 6p21.32 foram associados com câncer de pulmão [12], e vários loci de risco em 9q31.2, 19q13.4 e 8q24 foram mostrados para ser associado com o câncer de próstata [ ,,,0],13], [14], [15].

no entanto, os desafios em GWAS estão encontrando variantes causais e os efeitos funcionais, bem como inter-relação dessas variantes em câncer. Enquanto os estudos genéticos anteriores de cancro ter previsto um grande número de variantes associadas a cancro, [8], [9], [10], [15], [16], a identificação de variantes causais é grande obstáculo, porque as conhecidas variantes genéticas causais principalmente localizado no interior das regiões não codificantes ou localizados a várias distâncias físicas do gene influenciam [17]. Além disso, a estrutura de modelação linear empregue na GWAS frequentemente considera apenas um SNP de cada vez e ignora os efeitos dos outros SNPs genotipados [5]. Portanto, a progressão pode ser árdua de associação estatística obtida através GWAS à causalidade inferida e conseqüências funcionais para o câncer. Outro desafio em genômica investigações em grande escala é que algumas destas variantes, incluindo microssatélites foram menos estudados em comparação com os outros tipos (SNP e CNV). Além disso, muitos destes estudos estão focados em um tipo de cancro em variações genómicos; consequentemente, os impactos de outros fatores envolvidos são negligenciados.

O procedimento comum empregada em estudos anteriores é a detecção de variantes causais e buscando efeitos funcionais destas variantes, tais como associação de variantes com loci expressão de características quantitativas (eQTLs) [17]. No entanto, há também uma estratégia inversa compreende a previsão de regiões cancro risco potencial partilhados entre diferentes tipos de cancros com base em dados de expressão transcriptoma e, em seguida, à procura de variantes causais. A identificação destas regiões auxilia na descoberta de novas variantes, bem como estudo simultâneo de diferentes fatores que afetam a expressão do gene, limitando as cotas para região cromossómica específica. Aqui, nós desenvolvemos um oleoduto que era composta de predição PCSRs usando o cálculo das alterações transcrição-expressão sob o cancro para cada região cromossómica. Também extraído mRNAs comuns alterados e microRNAs usando microarray e etiquetas de seqüências expressas (ESTs) de dados seguintes por análise de rede para obter mais esclarecimentos sobre os PCSRs previstos. Usando este gasoduto, previmos regiões de risco potencial interagir com conjunto de alvos (mRNAs, miRNAs e /ou TFS) desvendando os potenciais candidatos para novos estudos de associação do genoma.

Resultados

Dados da expressão do gene vários tipos de cancros foram reanalisados ​​e os resultados foram combinados para prever regiões câncer de risco comuns. Outro objetivo deste estudo foi obter uma visão sobre inter-relação entre PCSRs e mRNAs alteradas, miRNAs e seus reguladores comuns. Uma visão geral do fluxo de trabalho é mostrado na Figura 1.

compreende a análise de dados de expressão de diferentes cancros humanos incluindo da mama, colorrectal, endometrial, gástrico, fígado, pulmão, ovário, pâncreas, próstata, testículos, bexiga, intestino neuroendócrino, colo do útero e cânceres renais, bem como glioblastoma. Esta análise preliminar seguido por extração de genes alterados, contar as regiões cromossômicas de genes alterados e predição de regiões de risco com base na frequência região.

Os resultados de expressão transcrição análises para cada conjunto de dados de câncer incluindo câncer de mama, colorretal, endométrio, gástrico, fígado, pulmão, ovário, pâncreas, próstata, testículos, bexiga, intestino neuroendócrino, cancros cervicais e renais bem como glioblastoma são apresentados na Tabela S1. Estes genes e miRNAs extraídos foram então usados ​​para análise posterior, conforme descrito abaixo.

Previsão de Regiões câncer susceptibilidade potencial usando Microarray conjuntos de dados de cancros diferentes

A percentagem de participação região foi calculado para cada cromossomo (chr) a partir de dados de microarranjos (com limite de mudanças 2 vezes) de 11 HCs. Detalhes do processo são descritos em Materiais e Métodos. Para cada cromossomo, cinco regiões que abrangem a maior frequência de genes alterados foram registrados como potenciais PCSRs (Tabela 1). Os resultados mostraram que, entre estas PCSRs, duas regiões contêm o maior número de genes sobre-expressos; chr1p31.2 (27,27%) e chr13q13.2 (20,45%) (Tabela 1, colunas 3 a 7). Enquanto no caso de genes expressos para baixo, o maior percentual foi registrado para as regiões situadas em chr13q13 (15,53%) e 4q34.2 (15,15%).

Para testar a confiabilidade dos PCSRs previstos , a percentagem de participação região no câncer foi calculado com limite diferente, onde foram identificadas as frequências dos 200 primeiros conjuntos de sondas com maiores variações de dobra para cada região (Tabela S2). Enquanto, um grande número destas regiões incluindo 1q31.3, 2p25.2,3q25.2, 12p13.31 e 22q12.1 partilhada em ambos os limiares (Tabela 1 e Tabela S2), algumas regiões foram registados como um PCSR por apenas um desses limites. Por exemplo 1p32.2 e 2q22.3 foram identificados para o limiar de mudanças 2 vezes, ao passo que, 1p22.3 e 2p12 foram registrados para as maiores variações vezes (Tabela 1 e Tabela S2).

Porcentagem do cromossoma participação também foi calculado para 11 HCs, para identificar qual cromossomo (s) está mais envolvido com as mudanças de expressão transcrição (Tabela S3). Os resultados mostraram que é CHR4 abrigando o maior número de genes alterados no cancro (com exclusão da próstata e cancros gástricos) (Tabela S3). Em contraste, chry tem o menor número de genes expressos no cancro. Um resumo da participação cromossômica de 11 HCs mostra diferenças significativas, como indicado pelo teste Geral qui-quadrado. Quatro cromossomos superiores abrigam os genes mais baixo-expressos foram chrs 4, 5, 13 e X, enquanto que no caso dos genes sobre-expressos os maiores números de alteração foram registrados para chrs 1, 7, 8 e 12 (figura S1).

mRNAs Altered compartilhados entre diferentes tipos de cancro

mRNAs expressos diferencialmente com as maiores alterações dobra em pelo menos 6 HCs foram selecionados como os mRNAs alterados comuns (Tabela 2 e Tabela 3). Estes mRNAs alterados comuns foram classificadas em três grupos de expressão diferentes. Classe I mostrou sobre-expressão na maioria dos tipos de cancro, tais como a tubulina alfa 1b (TUBA1B) e da desidrogenase do gliceraldeído-3-fosfato (GAPDH) (Tabela 2), de classe II representado estabelece-expressão na maioria dos HCs como aspartoacilase (ASPA) e quimiocina (CXC motivo) ligando 12 (CXCL12) (Tabela 2), enquanto que os restos (Classe III) mostrou um padrão de expressão misturadas em diferentes tipos de cancros, tais como a proteína quinase (dependente de cAMP, catalítico) beta inibidor (PKIB) ( tabela 3).

Curiosamente, um número de ARNm alterados comuns estão localizados nos PCSRs preditos (Coluna 3 da tabela 2 e tabela 3). Por exemplo, de GAPDH em 12p13.31 (como um PCSR previsto) mostrou sobre-expressão em todos os HCs (Tabela2). CKS2 (chr9q22.2), CEP55 (chr10q23.33), UHRF1 (chr19p13.3), RRM2 (chr2p25.1), AURKA (chr20q13.2), FLJ39632 (chr14q11.2), FAM83D (chr20q11.23), Nek2 (chr1q32.3) e MAD2L (chr4q27) foram todos localizados no PCSRs e mostrou sobre-expressão nas 9, 8, 10, 9, 8, 9, 9, 8 e 9 tipos de cânceres, respectivamente (Tabelas 2 e 3 ). Em contraste, o DCN (chr12q21.33), LIFR (chr5p13.1), ABCA8 (chr17q24.2), C7 (chr5p13.1) e ZEB2 (chr2q22.3) em PCSRs previstos foram expressos em baixo-9, 7, 8 , 8 e 8 tipos de câncer, respectivamente (Tabelas 2 e 3). O resto dos genes alterados em PCSRs exibiu tanto para baixo e sobre-expressão padrões (Tabela 3).

MiRNAs Altered compartilhados entre cancros diferentes

Vários tipos de miRNAs (como miR-93, mir -182, mir-196b e mir-1274b) apresentaram sobre-expressão na maioria dos cancros (Tabela 3). Um número de miARN (tais como o miR-30a e miR-30c-2) foram baixo-expressa em vários HCs, ao passo que, muitas outras miARNs exibiram um padrão de expressão misto (Tabela 4).

as localizações cromossômicas foram determinados para miRNAs alterados comuns. Curiosamente, miARNs localizadas na mesma região mostraram co-expressão em alguns tipos de cancro, tais como um conjunto em 19q13.41 (incluindo miR-99b e -125a). Este cluster (19q13.41) foi expressa em baixo-cervical, da próstata e cancros renais. Em contraste, o mesmo agrupamento foi sobre-expressa no cancro da bexiga. Outro conjunto de co-expressas foi observada em 12p13.31 (mir-141and miR-200c), que mostraram a sobre-expressão em cancros do ovário, da próstata e bexiga, e por outro lado, que foram baixo-expresso em cancro renal (Tabela 4). O resto de agrupamentos de co-expressos foram coletados para regiões em 6q13 (incluindo miR-30a e mir-30c-2), Xp11.23 (incluindo mir-362, mir-500, mir-501, mir-502 e mir-532 ), 14q32.2 (incluindo mir-134, mir-379 e mir-382), 14q32.31 (incluindo mir-127, mir-432 e miR-770), 9q22.32 (incluindo let-7d, mir-23b e miR-27b) e 7q22.1 (incluindo miR-93 e miR-106) (Tabela 3). Cinco dos nove miRNA clusters de co-expressa listados acima estão localizados em PCSRs previstos incluindo 6q13, 12p13.31, 14q32.2, 19q13.41 e Xq26.2 (Tabela 4).

Interação dentro e entre Comum mRNAs alterados e miRNAs revelada pela análise de rede

Quatro redes separadas foram construídos, incluindo uma rede de mRNAs alterados comuns (com 409 entidades e 1288 as relações) (figura S2), uma rede de mRNAs alterados comuns localizados em diferentes previu PCSRs (com 383 entidades e 1121 as relações) (figura S3), uma rede de miRNAs alterados comuns (com 322 entidades e 1041 as relações) (Figura S4) e uma rede de miRNAs alterados comuns localizadas nos diferentes PCSRs (with123 entidades e 409 relações ) (Figura S5). Além disso, uma rede combinada foi construído através da integração de ARNm alterados e dados miARNs, que tem 667 entidades e 2482 (Figura relações S6). Vários tipos de fatores de transcrição, proteínas quinases, pequenas moléculas, mRNAs e miRNAs servir tanto como reguladores validados ou putativos nessas redes. Detalhes adicionais de cada rede, incluindo o número de genes importadas e processos biológicos apresentados na Tabela S4.

identificado com redes de processos biológicos semelhantes, tais como o processo celular, regulação biológica, processo metabólico, processo do organismo multicelular, processo de desenvolvimento e resposta ao estímulo (Tabela S4 coluna 5). Esses processos comuns implicam existência de genes e miRNAs comuns em diferentes redes construídas conforme listado na Tabela S5. Por exemplo, homeobox ligação dedo E-caixa de zinco 2 (ZEB2), DEAD (Asp-Glu-Ala-Asp) caixa de helicase 5 (DDX5) e alfa do receptor do factor de inibição de leucemia (LIFR) foram divididos entre ambas as redes construídas de mRNAs alterados comuns e miARNs (Tabela S5). Entre miRNAs alterados comuns, mir-21, mir-30a, mir-141 e miR-200c foram compartilhados entre todas as quatro redes construídas (Tabela S5).

A sub-rede mais frequente observada nestas redes foi centrado em DDX5 (Figura 2). Este sub-rede compreende 5 entidades, incluindo DDX5, mir-20b, mir-21, mir-141 e miR-182. DDX5 é regulado negativamente por mir-20b e mir-141, enquanto a própria DDX5 regula mir-21 e mir-182. De Down-expressão de DDX5 foi observada em 7 tipos de HC, enquanto, miR-20b, Mir-21, miR-141 e miR-182 sobre-expressos em 3, 5, 3 e 4 HC, respectivamente (Tabela 3 e Tabela 4 ). Ele sugere a inter-relação negativa entre DDX5 e estes quatro miRNAs.

Rede está incluindo miR-21, mir-182, -mir20b e mir-141. Rede foi construído utilizando estúdio pathway 9 software. Rede foi montada com base em bioinformática e literatura, combinada com a interpretação biológica dos dados microarray e enriquecidos grupos funcionais Gene ontologia. Vermelho: entidades sobre-regulada na maioria dos tipos de câncer. Azul: entidades sub-regulada na maioria dos tipos de câncer. representa negativo regulado.

Outra sub-rede foi construída com base em mir-141, mir-200c, e GAPDH, que todos localizados no PCSRs previstos na 12p13.31 (Figura 3). Esta rede é composta por 17 entidades e 29 relações (Figura 3). Treze alvos a jusante foram observados para mir-141, mir-200c, e GAPDH. Por exemplo, o miR-141 e, miR-200c, que foram sobre-expressos em 3 HCS (mostrado como roxo na Figura 3), têm efeitos de miARN no ZEB2 (com baixo-expressão em 7 HCs). Curiosamente, esses RNAs alterados incluindo mir-141, mir-200c e GAPDH (pelo 12p13.31) e também ZEB2 (pelo 2q22.3) estão todos localizados na PCSRs previstos. No caso de os nós a montante, TP53 e MYC foram observados como reguladores a montante do miR-200c e GAPDH (Figura 3). TP53 é regulador positivo comum para ambos mir-200c e GAPDH, mas MYC só é regular GPADH (Figura 3).

Rede foi construído utilizando estúdio pathway 9 software. Shortest algoritmo de caminho foi aplicado para a construção de rede. Rede foi montada com base em bioinformática e literatura, combinada com a interpretação biológica dos dados microarray e enriquecidos grupos funcionais Gene ontologia. Roxo: entidades sobre-regulada na maioria dos cancros azuis: entidades reguladas para baixo na maioria dos tipos de câncer. O vértice representam TFs, representa positivo regulado, e representa negativo regulado.

Análise Promotor de mRNAs alterado e MiRNAs em todo cancros diferentes

Promotores de sobre-expressos e down- mRNAs e miRNAs expressos foram analisados ​​individualmente através de diferentes tipos de câncer. Uma lista de factores de transcrição comuns para cada conjunto de e sobre-expresso mRNAs são fornecidos nas Tabelas S6 e S7, respectivamente expresso para baixo. Entre 18 TFs previstos comuns para mRNAs sobre-expressos, Kruppel-Like Fator 4 (KLF4) localizado na PCSRs foi encontrado para ser down-expresso em 7 tipos de cânceres (Tabela S6). Enquanto que, do total de 13 reguladores comuns previstos para mRNAs expressos para baixo, 6 reguladores estão localizados no PCSRs. Entre estes 6 reguladores receptor órfão relacionado com o RAR A (RORA) foi down-expressa em 8 tipos de cânceres (Exceto que Glioblastoma com sobre-expressão e sem expressão significativa na próstata e câncer gástrico) (Tabela S7).

reguladores comuns também foram previstos para o conjunto de miRNAs alterados na mesma região (Tabela S8). Por exemplo, GATA2, GATA3, ETS1, MZF1_1-4, SOX10, YY1, ZNF354C e SPI1 foram previstos para miRNAs localizados em clusters à Xp11.23 (Tabela S8). No total, 22 reguladores comuns foram previstos para diferentes grupos de miRNAs que oito deles estão localizados em PCSRs incluindo YY1, SPIB, SOX10, NFIC, NR4A2, FOXD1, NFATC2 e HOXA5 (Tabela S9). Curiosamente, GATA2 foi previsto para ambas as baixo-expressa mRNAs e miRNAs alterados.

Discussão

Um gasoduto eficaz foi desenvolvido para prever PCSRs usando conjuntos de dados de microarranjos de diferentes estudos de câncer. Dois limites diferentes foram aplicados para prever PCSRs incluindo probsets com alterações, pelo menos 2 vezes e os primeiros 200 probsets com as maiores alterações dobra. A maioria dos PCSRs previstos em cada cromossoma foram semelhantes em ambos os limiares aplicados, que confirmam a fiabilidade destes PCSRs.

Além desta constatação, com base em revisão de literatura encontramos a presença de vários importantes variantes associadas ao câncer nos nossos PCSRs preditos. Estas variantes têm sido relatadas anteriormente para pancreático [4], [11] (6q13, 21q21.3, 5p13.1, e 21q22.3 22q13.32), pulmonar [12] (6p21.32), da próstata [13], [14], [15] (9q31.2, 19q13.4, 8q24 e 17q21-q22), ovário [10] (19p13), mama [18] (8q24, 12p13 e 20q13) e cancro colorectal [19] (11q23 , 8q24 e 18q21). Nossas descobertas em acordo com esses estudos região 8q24 identificadas como uma região de risco na variedade de HCs [8], [14], [19], [20], [21], o que mostra o envolvimento de algumas das regiões de risco em vários tipos de cancros, em vez de um câncer específico. Além disso, alguns dos PCSRs previstos neste estudo foram relatados em outros tipos de doenças humanas, incluindo vírus herpes simplex tipo 1 [22] (21q), síndrome do ovário policístico [23] (9q33.3), Diabetes tipo 1 e artrite reumatóide [ ,,,0],24] (ambos localizados no 18p11). Essa semelhança pode indicar a eficiência da nossa abordagem na previsão das regiões de risco associados a diferentes doenças humanas, além de câncer.

Nós também descobrimos que oito cromossomos abrigar os genes mais alterados em diferentes tipos de câncer, incluindo cromossomos 1, 4, 5, 7, 8, 12, 13 e X. Curiosamente, os cromossomos 1, 4 e 13 também foram registrados como os cromossomos com a maior percentagem de PCSRs previstos, o que sugere o papel importante destes cromossomos na biologia do câncer. Com base nestes resultados e daqueles previamente reportados em cromossomas anormalidade [7], [25], [26], [27], pode-se concluir que a tubagem é capaz de prever as regiões de risco, bem como cromossomas de risco numa variedade de doenças incluindo câncer. Este gasoduto também pode ser aplicado para os conjuntos de dados de RNA-seq de crescimento rápido (mas ainda número de limitadas) em estudos futuros.

A análise de redes indica que DDX5, LIFR, ZEB2, mir-21, mir-27b, mir -30, mir-141, mir-182 e miR-200c foram compartilhadas através de diferentes redes construídas, acusando o seu papel fundamental na biologia e na progressão do câncer, o que tem sido relatado anteriormente [28], [29], [30]. Por exemplo, o potencial utilidade clínica de DDX5 e seus miARNs associados (miR-21 e miR-182) são sugeridas como alvo terapêutico no cancro da mama [29], [31]. Além disso, a aplicação clínica de diferentes miRNAs em câncer, como deixá-7, mir-21 e mir-122 são discutidos em recente estudo de Nana-Sinkam e Croce [28].

Porque miRNAs não funcionam isoladamente [28], analisou-se o aglomerado de miARN no mesmas regiões de compreender a contribuição relativa das várias miARNs em vez de miARN indivíduo. Co-expressão de miRNA diferente implica a presença de reguladores de transcrição ordinárias e /ou variantes causais comuns para essas regiões. Também é previamente relatado que módulos comuns nos promotores podem causar a co-expressão dos genes [32].

Descobrimos que diferentes reguladores comuns para ARNm e miARNs alterados incluindo, KLF4 (a) e 9q31.2 RORA (15q22.2) estavam nas PCSRs previstos. Estes dois TFs mediar um conjunto de genes do ciclo celular e exposições ambas as funções supressoras tumorais oncogênicos e [33], [34]. Curiosamente, down-expressão de miR-30c-2 (em 6q13), bem como sobre-expressão de GATA3 foi observada em diferentes tipos de HCs neste estudo, que confirmam regulação do mir-30c-2 através de GATA3. Bockhorn e collogues demonstrado recentemente que mir-30c é transcricionalmente regulados com GATA3 [35].

Presença de outro nível de inter-relação entre as regiões do cancro risco foi sugerida, onde mRNAs e seus reguladores comuns em diferentes PCSRs interagir uns com os outros, bem como os seus objectivos. A sub-rede centrada em DDX5 com total de 5 nós e 4 relações (Figura 2) e a sub-rede de GAPDH, miR-141 e miR-200c confirmem essas interações (Figura 3). Nestas sub-redes, diferentes RNAs estão localizados no PCSRs incluindo GAPDH, ZEB2, mir-20b, mir-21, mir-141 e miR-200c apoiar os efeitos importantes desses RNAs e suas regiões em câncer.

Sub-rede centrado em DDX5 é compartilhada através de redes construídas para mRNAs alterados e miRNAs em diferentes tipos de câncer. DDX5 ARN helicase (também conhecida como p68) está envolvido no metabolismo de ARN e serve como um co-regulador da transcrição e tem sido relatada como regulador de miR-182 no cancro da mama [29]. associação significativa foi também relatada entre rs1991401 DDX5 (OP = 7,90 × 10-5) e tumor da bainha do nervo periférico maligno [36]. Nossos resultados mostraram que a regulação de miR-20b e mir-141 para baixo regula DDX5.

Segundo sub-rede (Figura 3) continha GAPDH, mir-141 e miR-200c, que estão localizados em 12p13.31 como PCSRs previstos . A amplificação da região 12p13 foi observada no cancro da mama [37], os linfomas de células T e leucemia linfocítica [38], [39], provocando a sobre-expressão de GAPDH, o miR-141 e -200C. reguladores a montante, pode envolver-se em-regulação destes ARN e um efeito positivo foi avaliado por TP53 localizado na região a montante de GAPDH [40]. Além disso, Yoshihara et al [41] relatou alguns CNVs câncer única ovário esporádicos em 12p13.31. Em geral, esses relatórios em combinação com a nossa

in silico resultados

indicam o papel crucial da 12p13.31 em HCs.

Curiosamente, alguns outros RNAs comuns entre cânceres deste relatório, são observadas em estudos anteriores de tumores e outras doenças [16], [42]. Por exemplo, a presença de sinónimo SNP (rs12948217) que afecta o local exônico potenciadores de splicing nas proximidades ASPA foi relatado para as doenças neurodegenerativas [43]. Perda de regiões incluindo 14q32.2 (localização do mir-127, mir-432 e miR-770) e 14q32.31 (mir-134, mir-379 e mir-382) foram relatados em estudos anteriores de câncer renal e osteosarcoma [16], [44]. Em nosso estudo, mirRNAs localizado na 14q32.2 e 14q32.31 mostrou down-expressão em vários tipos de câncer, o que implica baixo-expressão dos miRNAs seguintes perda cromossômica nessas regiões.

Em conclusão, previu PCSRs no presente estudo abre uma nova avenida em estudos de associação do genoma para encontrar diferentes tipos de variantes de cancro causais. Uma vez que várias variações acumulada num gene ou um conjunto de genes podem todos contribuir para o fenótipo, estudando os diferentes tipos de variações ou mecanismos de regulação ao longo de um gene, conjunto de genes ou região específica pode ser uma ferramenta útil para melhorar a detecção de associação. Os identificados RNAs alterados comuns a PCSRs em nossas redes construídas têm grande potencial para ser usado para encontrar associado SNPs, CNVs e /ou SSRs perto desses genes. Além disso, estes resultados sugerem a possibilidade de nova terapia do cancro (em vez de à base de gene) à base de regulador, a fim de restaurar o conjunto perturbado de ARNm e /ou miARNs. Em geral, nosso pipeline pode ser efetivamente usado para prever regiões câncer de risco e cromossomos câncer de risco.

Métodos

Expressão Análise de Dados

dados de expressão Raw CEL para diferentes HCs foram obtidos a partir de base de dados Gene Expression Omnibus (GEO) (Tabela S10). O (Robust Multichip Médio) algoritmo de RMA foi aplicado pela primeira vez aos dados brutos de microarranjos para obter dados normalizados usando Expression software Console (Affymetrix, CA, EUA). Os dados foram então analisados ​​utilizando software FlexArray (https://genomequebec.mcgill.ca/FlexArray/). padrão de expressão diferencial de genes para cada experimento (câncer vs. normal) foi avaliada utilizando teste empírico Bayes (um teste t moderado) (p 0,05). foram seleccionados genes que exibem alterações de pelo menos 2 vezes na expressão de genes e alterações 1,5 vezes na expressão de miARN para análise posterior. Além disso, 1,2 vezes a mudança foi considerado para traçar mRNAs alterados comuns e miRNAs em diferentes tipos de câncer.

A exibição diferencial digitais (DDD) ferramenta (https://www.ncbi.nlm.nih.gov/UniGene/ddd.cgi) foi utilizado para rastrear os genes relacionados ao câncer em diferentes HCs. bibliotecas de EST seleccionadas para comparações DDD de diferentes tecidos (cancro vs normal) estão listados na Tabela S11. Piscinas A e B foram atribuídos para as bibliotecas normais e cancerosas em cada cancro, respectivamente. A saída fornecida um valor numérico de cada grupo que denota a fracção de sequências dentro do conjunto que mapeada para o cluster UniGene. sucessos estatisticamente significativa (teste exato de Fisher), mostrando diferenças de 10 vezes foram compilados, e um banco de dados preliminar foi criado. Fold diferenças foram calculadas usando a proporção de piscina B /piscina A, de acordo com o método descrito anteriormente [45].

Entre probsets com maiores variações dobra, mRNAs alterados comuns e miRNAs (pelo menos em 6º de 11 HCs) foram extraídos usando ferramentas DDD juntamente com conjuntos de dados de microarranjos. Estes RNAs alterados comuns depois usado para construções de rede.

Detecção de Shared-Cancer suscetibilidade Regiões

O número de genes diferencialmente expressos foram contados para cada região (como a frequência da região) usando um em -house script python desenvolvido (O script Python está disponível em Script S1). A frequência de região envolvida na expressão foi calculada para probsets com alterações, pelo menos, 2-simétricos vezes (Tabela S12) e 200 primeiros probsets com as maiores alterações vezes (Tabela S13). Em seguida, para cada região, a percentagem de participação região probsets diferencialmente expressos em todos os 11 tipos de HCs foi calculada usando equações: Onde PARA é a frequência da região por sobre-expressos probsets (somatório de 11 HCs), n é o número de cancros (aqui é 11) e FTP é a frequência da região para probsets totais (Tabela S14 e S15) .Where FDR é a frequência da região para probsets expressa-down (somatório de 11 HCs), n é o número de cânceres (aqui é 11 ) e FTP é a frequência da região para probsets totais (Tabela S14 e S15). . Finalmente, cinco regiões com a maior relação foram selecionados como regiões câncer de risco potenciais para cada cromossomo

Além disso, a porcentagem de participação de cromossomo em probsets diferencialmente expressos no total 11 HCs foi calculada usando equações seguintes: Onde FOC é a frequência do cromossomo para sobre-expressos probsets (somatório de 11 HCs), n é o número de cânceres (aqui é 11) e FCTP é a frequência do cromossomo para probsets totais (Tabela S16) .Where FDC é a frequência do cromossomo para baixo-expressa (soma de 11 CS), n é o número de cancros (aqui é 11) e FCTP é a frequência do cromossoma para probsets totais (Tabela S16). Além disso, as percentagens de participação para cada cromossoma do cancro (Tabela S17) foram calculados usando fracção de frequência cromossoma para probsets alterados na frequência cromossoma para probsets totais (Tabela S17). As diferenças de cromossomos foram investigadas com base em teste geral chi quadrado.

construção de redes de mRNAs Altered comuns e MiRNAs

Pathway Studio 9 software (Ariadne Genomics, Rockville, MD) foi usado para construir redes diferentes. Caminho Studio usa o banco de dados RESNET Mamífero, que é um caminho abrangente e banco de dados de interação molecular [46]. Esta base de dados inclui novos apelidos para os genes humanos, miRNAs e entradas de outros mamíferos. O algoritmo de caminho mais curto foi utilizado para construir quatro redes diferentes com base em ARNm e miARNs [47] alterados. Cinco redes foram construídas com base em RNAs alterados comuns, incluindo a rede de mRNAs comumente alterados, rede de mRNAs comumente alteradas em PCSRs, rede de miRNAs comumente alterados, rede de miRNAs comumente alteradas em PCSRs e rede integrada de mRNAs alterados comuns e miRNAs. O processo biológico de cada rede foi identificada usando o conjunto DAVID (https://david.abcc.ncifcrf.gov/tools.jsp) de ferramentas de bioinformática. recursos de bioinformática DAVID consiste de um sistema integrado de ferramentas da base de conhecimento e analíticas biológicas destinadas a extrair sistematicamente significado biológico a partir de listas de genes /proteínas grandes [48].

Análise Promotor de RNAs Altered

análise Promoter foi realizado durante mRNAs co-expressos em diferentes tipos de câncer usando pscan [49]. Os fatores de transcrição (TFS) foram previstos nas regiões promotoras (-1 kb a 0) de mRNAs que utilizam banco de dados de Jaspar (TFS com valor P 0,1 foram selecionados). No caso de miRNAs, os reguladores comuns foram previstos para miRNAs alterada a mesma região usando a ferramenta web Jaspar (https://jaspar.genereg.net/). TFs foram previstos nas regiões promotoras putativos (-3 kb a 1 kb) de microARNs com limite da pontuação de perfil em relação, pelo menos, 99%. Expressão de TFs previsto foi determinada utilizando dados de expressão de transcrição-micromatriz de 11 cancros diferentes, incluindo mama, colorectal, endométrio, gástrico, fígado, pulmão, ovário, pâncreas, próstata, testículos, bexiga, neuroendócrino intestino, do colo do útero e cancro renal, bem como o glioblastoma .

Informações de Apoio

Figura S1.

percentual de participação cromossomo na expressão do gene

doi:. 10.1371 /journal.pone.0096320.s001

(PDF)

Figura S2.

Deixe uma resposta