PLOS ONE: transcriptoma Profiling do Câncer, Adjacente não tumorais e tecidos normais distante de um paciente com câncer colorretal por Deep Sequencing

Abstract

O câncer colorretal (CRC) é um dos cânceres mais comumente diagnosticados no mundo. A triagem do genoma da desregulação transcriptoma entre o câncer eo tecido normal seria fornecer uma visão sobre a base molecular da CRC iniciação e progressão. Em comparação com a tecnologia de microarray, que é comumente utilizada para identificar alterações de transcrição, a técnica de ARN-SEQ recentemente desenvolvido tem a capacidade de detectar outros regulamentos anormais no transcriptoma do cancro, tais como splicing alternativo, novos transcritos ou fusão de genes. Neste estudo, foi realizada de alto rendimento de sequenciação transcriptoma em ~ 50 × cobertura no CRC, adjacente não-tumoral e tecido normal distante. Os resultados revelaram específico do cancro, os genes expressos diferencialmente e de processamento alternativo diferencial, sugerindo que a matriz extracelular e vias metabólicas são activados e os genes relacionados com a homeostase celular são suprimidas no CRC. Além disso, uma fusão de genes restrita a um tumor, PRTEN-NOTCH2, também foi detectada e confirmada experimentalmente. Este estudo revela algumas características comuns na invasão tumoral e fornece um completo levantamento do transcriptoma CRC, o que proporciona uma melhor visão sobre a complexidade das mudanças regulatórias durante tumorigênese

Citation:. Wu Y, Wang X, Wu F, Huang R, Xue F, G Liang, et ai. (2012) transcriptoma Profiling do Câncer, Adjacente não tumorais e tecidos normais distantes de um paciente com câncer colorretal por Sequenciamento profundo. PLoS ONE 7 (8): e41001. doi: 10.1371 /journal.pone.0041001

Autor: Antonio Moschetta, Universidade de Bari Consorzio Mario Negri Sud, Itália |

Recebido: 13 de dezembro de 2011; Aceito: 15 de junho de 2012; Publicação: 08 de agosto de 2012

Direitos de autor: © Wu et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelo Projeto de Inovação Medical da província de Fujian (2012-CXB-6). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal (CRC) é um dos cânceres mais comumente diagnosticados com mais de um milhão de novos casos em todo o mundo em cada ano [1]. Metastático CRC é geralmente incurável; como resultado, CRC é a principal causa de mortes relacionadas ao câncer [1], [2]. CRC surge a partir de pólipos adenomatosos e desenvolve-se em cancro localmente invasivo e metastático posteriormente. A progressão de CRC é um processo de passos múltiplos e podem ser classificados em quatro fases (sistema de armazenamento temporário Dukes) com base no grau de invasão tumoral [3], [4]. Em estudos anteriores, vários mecanismos moleculares, tais como a instabilidade genómica [5], [6], [7], a perda de genes de reparação do ADN [8], [9] e modificações epigenética aberrantes [10], [11] (ver revisão em [12]), foram mostrados para contribuir para o desenvolvimento de CRC. Além disso, uma abordagem imparcial de high-throughput screening das mudanças de expressão entre CRC e tecido normal revelados vários biomarcadores de diagnóstico e prognóstico [13], [14], [15]. No entanto, a compreensão abrangente da progressão da CRC eo prognóstico correcto ainda estão desafiando tarefa devido à heterogeneidade genética do CRC e alterações genômicas complexos encontrada com este tipo de câncer [12], [16].

Antes estudos de alterações genómicas revelaram que alterações somáticas, incluindo mutações pontuais, rearranjos de ADN e as variações do número de cópia (revisto em [12]), podem resultar em mutações que conduzem ao desenvolvimento de CRC. Como consequência das mudanças no genoma do câncer, a reprogramação do transcriptoma leva a um comportamento celular anormal e, portanto, contribui diretamente para o câncer progressão [17], [18]. Estudar o transcriptoma câncer não só nos permite preencher a lacuna entre as mutações motorista e comportamento de células cancerosas, mas também nos permite identificar mutações relacionadas ao câncer candidatos adicional e as bases moleculares da regulação gênica [17]. O recente desenvolvimento de sequenciamento paralelo em massa (RNA-seq) oferece uma abordagem poderosa para traçar o perfil do transcriptoma com maior eficiência e maior resolução [19]. A vantagem da ARN-seq é que esta técnica torna possível o estudo do transcriptoma complexidade do cancro, incluindo splicing alternativo, a utilização da isoforma, fusões de genes e transcritos de novos (revisto em [20], [21]). Apesar da prevalência do uso de RNA-seq para estudar vários câncer transcriptomes [22], [23], [24], [25], não foi realizada a anotação profunda do CRC perfil de expressão gênica.

Nesta estudo, procurou para anotar cuidadosamente as transcriptomes de tecido CRC, o tecido não tumoral adjacente e tecido normal distante de um único paciente por RNA-seq. Em primeiro lugar, encontramos vários genes desregulados específicos do cancro e splicing alternativo. Em segundo lugar, a seguir Gene Ontology (GO) e análise de caminho dos genes desregulados e isoformas, identificamos um caminho potencial candidato e uma classe funcional de genes que são relevantes para a progressão da CRC, que não tem sido relatado previamente. Em terceiro lugar, nós detectamos um evento de fusão novo gene especificamente no tecido CRC e confirmada experimentalmente o produto de fusão. Por fim, para validar os nossos resultados de sequenciamento, quantitativa PCR em tempo real (qPCR) foi usado para confirmar a diferença entre a expressão do gene CRC e do tecido normal.

Resultados

Caracterização de sequenciação e mapeamento

Três amostras de tecido – CRC (fase III), de tecido não tumoral adjacente e tecidos normais distante – foram coletadas de um paciente do sexo feminino de 57 anos de idade. A informação clínico-patológico do paciente é mostrada na Fig. S1. Todas as três amostras foram submetidas a sequenciação do ADNc de gama emparelhado paralelo em grande escala. No total, foram obtidos 36,5 milhões, 33,1 milhões e 29,9 milhões de pares lidos a partir do CRC, adjacente não-tumoral e tecido normal distante, respectivamente. Usamos TopHat para alinhar o lê ao UCSC (Universidade da Califórnia em Santa) de referência do genoma humano Hg19. O alinhados exclusivamente lê para as três amostras variou de 20,8 milhões para 25,9 milhões de pares. A proporção de leituras que mapeada para os genes de referência ENSEMBL variaram de 75% a 86% para as três amostras. O rendimento médio de profundidade a sequenciação foi de aproximadamente 50 vezes de transcriptoma humano (cerca de 113 pb Millon, com base no comprimento total da região do exão exclusivamente anotada na base de dados Ensembl). Além disso, apenas ~ 1% leituras foram mapeados para rRNA, indicando que as nossas bibliotecas estão devidamente construído e representar fielmente a expressão do RNA com caudas ployA. Os detalhes dos resultados do mapeamento estão listados na Tabela 1.

Análise dos genes diferencialmente expressos

Para medir a expressão do gene e para identificar os genes expressos diferencialmente (degs) entre as amostras , foi utilizado o método de Cuffdiff [26] para estimar a expressão dos genes e para identificar genes significativamente desregulados. O nível de expressão normalizada de cada gene foi medida por fragmentos por quilobases do exão por milhão de fragmentos mapeadas (FPKM). Ao exigir que o FPKM foi maior do que um, foi detectada 14854-15168 genes expressos em cada amostra, que incluía a maioria dos genes de referência humanos anotados (Ver Tabela S1 para detalhes). Analisou-se ainda mais a correlação da expressão do gene entre as amostras. Os perfis globais de expressão do gene foram em geral altamente correlacionado com o coeficiente de correlação de Pearson, variando 0,90-0,94 (Fig. 1A). Além disso, a análise de agrupamento indica que o transcriptoma CRC é distinto dos de tecido não-tumoral e tecido normal adjacente distante (Fig 1B).

A:. O gráfico de dispersão para a expressão global entre as amostras; o coeficiente de correlação de Pearson é mostrada; B: agrupamento hierárquico de genes diferencialmente expressos (degs) entre as amostras; C: Venn diagrama para ilustrar os degs sobrepostas entre as amostras; D: parcelas do vulcão por todos os genes em cada comparação. Os pontos vermelhos e azuis indicam que degs cima e para baixo-regulados foram significativas em valores de q inferior a 0,01.

Detectamos 1660, 1528 e 941 degs significativas entre o CRC e tecido adjacente, o CRC e o tecido normal e o tecido adjacente e normais, respectivamente (as listas completas dos degs estão resumidos na Tabela S1). A sobreposição dos degs entre as três amostras é mostrado como um diagrama de Venn na Fig. 1C. Vale ressaltar que CRC produz genes mais desregulados (1660 genes em CRC vs. adjacentes, 1528 genes no CRC vs. normal) do que os outros dois tecidos, que são 1,5 vezes mais abundante do que os encontrados em outros tecidos (941 genes em condições normais vs . adjacente), indicando a reprogramação específico do cancro do transcriptoma CRC, como mostrado no “lote vulcão” dos perfis de expressão de gene (Fig. 1D). Quando se compara a direcção das degs, o número de genes a montante e a sub-regulada identificados entre CRC e as outras duas amostras foi quase igual. Em contraste, um ligeiro aumento nos genes regulados por baixo foi observado no tecido adjacente não-tumoral quando comparado com o cancro e tecido normal adjacente. A MA-enredo dos perfis de expressão gênica (Fig. S2) mostra que o número significativo de genes desregulados não está inclinado para genes altamente expressos.

Em estudos anteriores, vários genes-chave relevantes para CRC foram identificados. Para determinar se os nossos resultados estão de acordo com resultados relatados, nós sistematicamente comparou as alterações na expressão de genes relacionados com o CRC específicos com aqueles identificados em outros estudos. Verificou-se que 15-prostaglandina desidrogenase (15-PGDH), uma enzima limitante da velocidade que catalisa a degradação da prostaglandina [27], é significativamente regulada negativamente em CRC em tecidos de cancro em comparação com tecidos normais. A activação de COX-2 e a perda de 15-PGDH são eventos comuns oncogénicas que são observadas em ~ 80% dos casos de CRC [28]. Além disso, encontramos um outro supressor de tumor,

TGFBR2

[29], que foi regulada para baixo em ambos os CRC e tecidos cancerosos-adjacente. Uma vez que a inactivação de TGFBR2 é coordenada com a transição de adenomas para carcinomas, é esperado que a inactivação gradual da TGFBR2 em tecidos de cancro e de tumores adjacentes. Nós também detectados outros genes que foram desregulados no CRC, incluindo APC [30], MYH [31], CD133, IDH1 e MINT2 [10]. Em contraste, vários factores de driver conhecido que são frequentemente mutados no CRC, incluindo MINT3 [32], [33], MSH2 [34] e MSH6 [9], não mostrou qualquer alteração na expressão neste estudo, sugerindo que a heterogeneidade genética da CRC ou os produtos de mutantes pode ser prejudicial mesmo se o nível de expressão não é afetado.

análise de enriquecimento funcional de genes diferencialmente expressos

Para entender melhor a função de degs, foi realizada uma análise de enriquecimento da ontologia gênica para os genes desreguladas. Para identificar as categorias funcionais específicas do cancro, nós realizada pela primeira vez testes de enriquecimento paralelas para significativamente para cima e para baixo-regulamentado genes que foram detectados por comparações sensatas de pares no CRC, não tumoral adjacente e tecido normal utilizando ferramentas on-line a partir de David [35 ]. As categorias GO que foram significativamente enriquecidos nos genes desregulados a partir da comparação de CDC contra o cancro adjacente de tecido não-tumoral e CRC versus tecido normal, mas não não-tumoral versus tecido normal adjacente, foram selecionados. No total, os genes para cima e para baixo-regulados em CRC foram classificados em 47 categorias funcionais específicas do cancro (Fig. 2). Curiosamente, embora nós identificada números iguais de genes a montante e a sub-regulada no CRC, observou-se um excesso de categorias GO significativas para CRC-regulada de genes, o que sugere que a sobre-regulação de genes específicos do cancro é funcionalmente mais importante para o cancro progressão. Por exemplo, os termos GO significativas para genes up-regulamentados, que incluem “a migração celular”, “motilidade celular” e “ligação matriz extracelular”, são relevantes para a invasão de câncer [15], [36], [37]. Além disso, os genes relacionados com alterações metabólicas, incluindo “processo de colagénio metabólica”, “processo metabólico do organismo multicelular macromolécula” e “processo catabólico do organismo multicelular”, reflectir a alteração do metabolismo do tumor [38], [39] e também são sobre- representado na CRC. Pelo contrário, os genes que são regulados negativamente na CRC são enriquecidas em vários processos funcionais relacionadas à homeostase.

Nós só escolheu GO categorias que enriqueceram genes desregulados relacionadas com o cancro, mas não enriquecem genes desregulados que foram identificados quando comparação com o tecido normal do tecido não tumoral adjacente. Os genes específicos do cancro desreguladas foram categorizados como significativamente para cima ou para baixo-regulado genes em tecido de cancro. O nível de significância é indicado por cores diferentes. O “S1”, “S2” e “s3” indicadores denotam “câncer”, “não-tumoral adjacente” e tecidos “normais distantes”, respectivamente.

Uma análise mais informativa de anotação funcional pode ser conseguida através da análise do enriquecimento de genes diferencialmente expressos em uma via particular. Usamos DAVID [35] para analisar quais via de KEGG foi enriquecida com genes desregulados CRC-específicas. As vias enriquecidos com degs estão listados na Tabela 2. A matriz extracelular (ECM) via de interacção com o receptor foi acometido em todas as comparações aos pares, e tais alterações de regulação do gene da via de ECM foram muito mais graves no tecido CRC. Além disso, o circuito de adesão focal foi enriquecido nos degs identificados a partir do tecido de CRC.

Para confirmar experimentalmente os genes diferencialmente expressos identificados por ARN-SEQ, os níveis de expressão de genes seleccionados foram validados em cada por exemplo quantitativa PCR em tempo real (qRT-PCR). Nós escolhemos cinco genes candidatos (COL1A1, COL3A1, FN1, SPP1, e ITGB5) a partir da via de ECM (de acordo com o nível de expressão do gene e dobre as alterações entre a CRC e tecido normal), que foram diferencialmente expressos por Cuffdiff (Tabela S2). Foi utilizado GAPDH como um controlo endógeno nestas reacções. Os resultados qRT-PCR confirmou que todos estes genes candidatos mostraram alterações quase idênticos na expressão de genes para os detectados pela via da técnica de ARN-SEQ, como mostrado na Fig. 3.

qRT-PCR foi realizado por cinco genes que são identificados como genes expressos diferenciais entre CRC e outros dois tecidos. O nível de expressão de cada gene foi normalizado para o nível em tecido normal. O “S1”, “S2” e “s3” indicadores denotam “câncer”, “não-tumoral adjacente” e tecidos “normais distantes”, respectivamente.

Para examinar se esses genes foram sempre -regulated no cancro colo-rectal, foi realizado o qRT-PCR para testar as mudanças de expressão para os cinco genes entre o câncer emparelhados e tecido normal em dez pacientes adicionais. O resultado de um amostras pareadas de um paciente foi excluído devido à grande variação dentro de repetições técnicas. O resultado dos pacientes permaneceram mostrou que, com exceção de ITGB5, os outros três genes COL1A1, FN1and SPP1were-regulada em seis amostras de câncer, eo COL3A1 foi regulado para cima em quatro amostras de câncer (Tabela S3), sugerindo a ECM-pathway genes são geralmente up-regulada no cancro colorectal. Além disso, as amostras de cancro de cinco pacientes podem ser agrupados de acordo com os níveis de expressão destes cinco genes (Fig. S3).

Análise de splicing alternativo e o uso diferencial das isoformas

Uma locus do gene pode expressar múltiplas isoformas de splicing alternativo (AS). A diversidade transcrição conduz a transcrição redes de plástico no cancro, que são importantes para gerar as propriedades incomuns de células cancerosas [40], [41]. Dos numerosos mecanismos moleculares que pode gerar isoformas, exão pular para truncar o domínio funcional, é a forma mais comum de gerar produtos de proteínas com funções alternativas em mamíferos [41]. Nós, portanto, realizada a triagem do genoma para identificar o exão com restrição de câncer de pular eventos usando MISO software (a mistura das isoformas) [42]. No total, foram detectados 14072, 14537 e 13865 salto de exon eventos no CRC, o tecido não tumoral adjacente e tecido normal, respectivamente. A seguir, os eventos em comparação exon skipping diferencial (DES) (Tabela S4) entre as amostras, tal como mostrado na Fig. 4A. Descobrimos que: i) apenas uma pequena proporção de eventos DES foi compartilhado em três comparação forma, sugerindo que uma parte considerável dos genes estão sob regulamentação específica do cancro por splicing alternativo; e ii) o número de SEDs entre o tecido normal e adjacente é menor que o número de eventos DES entre a CRC e o tecido adjacente ou a CRC e tecido normal, indicando a utilização aumentada de isoformas diferenciais no cancro. Como os eventos ES são susceptíveis de alterar a função da proteína, afectando o domínio funcional, o número de eventos DES em tecido CRC é aproximadamente duas vezes a de um tecido não-cancro, indicando que a via de splicing pode ser significativamente activado em CRC para gerar diversos produtos funcionais. Nós verificamos a expressão dos fatores de corte derivados do NCBI e SpliceAid 2 (https://www.introni.it/spliceaid.html), e constatou que quatro fatores de splicing, incluindo RBFOX1, SPRK1, MBNL1 e SRRM2, foram significativamente desregulada entre o tecido canceroso e do tecido não-câncer (Tabela S1), sugerindo que a atividade de splicing anômalo em tecido de câncer pode estar relacionado com a desregulação dos factores de splicing.

(DES) eventos entre as amostras. A: diagrama de Venn de o número de eventos DES; B:. A sobreposição entre os genes expressos diferencialmente e de genes com eventos DES

Enquanto os degs já foram mostrados para ser significativa no CRC, seria interessante determinar o grau de sobreposição entre os degs e genes com eventos DES. Como mostrado na Fig. 4B, apenas três genes (3/752, ~0.4%) foram simultaneamente afetados por mudanças na regulação da transcrição e regulação pós-transcricional (ie, splicing alternativo).

Para identificar genes associados ao câncer altamente confiáveis ​​com DES eventos, filtrada os eventos DES por uma série passos (material e Métodos) de todos os eventos DES (Tabela S4) e obtidos 20 eventos DES de confiança de 14 genes associados ao câncer (Tabela 3). Seis genes, incluindo ADD3, CTNND1, EPB41L3, F3, MUC4 e PDGFA, mostrou eventos DES-cancro específicos de tecidos. Como mostrado na Fig. 5. A relação de junção lê-número para a inclusão exão versus a exclusão exão era, obviamente, menor no tecido de cancro do que nos outros dois tecidos. A lê o mapeamento de outras cinco genes foram mostrados na Fig. S4-S8, respectivamente.

O RNA-Seq lê foram mapeamento para o genoma de referência UCSC (hg19) de ADD3. As faixas de tecido CRC foram mostrados em vermelho, a não tumoral adjacente em verde e o tecido normal em azul. As contagens de leituras que atravessa a junção de exons foram mostrados.

O splicing diferencial da ADD3 foi encontrado no câncer de pulmão de não pequenas células [43] e o tumor de mama murino [44 ]. Curiosamente, ADD3 mostrou uma cassete de inclusão exão nestes dois estudos, mas mostrou uma cassete de exclusão exão no mesmo local no nosso estudo. Em outro estudo de células estaminais embrionárias humanas (hESCs), a cassete de exclusão exão também tem sido encontrada em hESCs relativos aos progenitores derivados cardíacas [45]. Mesmo no estudo do cancro do pulmão anterior, havia também evidências heterogêneo para os padrões de splicing alternativo de ADD3 (quatro de 18 pacientes com câncer de pulmão mostrou uma exclusão cassete exão para ADD3) [43]. Portanto, mais estudos sobre ADD3 deve ser feito para compreender a relação do seu splicing alternativo com câncer.

Bioinformatics predição de eventos de fusão de genes

Foram utilizados dois algoritmos, desarmar e TopHat-Fusion, a detectar fusão de genes com base nos fins-de-par lê em amostras diferentes. Embora vários resultados foram gerados por desarmar e TopHat-Fusion (Tabela S5), um evento de fusão entre PTGFRN e NOTCH2 foi o único evento de fusão específico do cancro identificados por ambos os algoritmos. Como mostrado na Fig. 6A, PTGFRN e NOTCH2 são separados no cromossomo 1 em 3 milhões de bps, e as formas de tipo selvagem são transcritos a partir de direções opostas. No nosso exemplo o cancro, verificou-se que o primeiro intrão de PTGFRN é fundida com a junção de 3 ‘do exão 17 do NOTCH2 para gerar uma transcrição quimérica PTGFRN-NOTCH2. Vale a pena notar que uma região intrônica parcial de PTGFRN está presente no mRNA maduro, devido a este evento de fusão (Fig. 6B). Concebemos assim, separadamente, um par de iniciadores que coordenam com o primeiro intrão da região PTGFRN e o exão de NOTCH2 para confirmar esta fusão em, não tumoral adjacente normal e tecido de cancro por RT-PCR. Os resultados indicaram que este evento fusão é restrita-câncer (Fig. 6C), o que é consistente com as conclusões de nossa análise RNA-seq. Além disso, examinou-se o gene de fusão PTGFRN-NOTCH2 em dez amostras adicionais por RT-PCR, mas nenhum deles mostrou a fusão de genes, o que sugere que o PTGFRN-NOTCH2 pode ser um gene de fusão rara em cancro colo-rectal.

a: o gene de fusão inter-cromossómica envolve a PTGFRN (mostrada em amarelo) e NOTCH2 (mostrado em verde) loci; a distância entre estes dois loci é cerca de três MBP. Os eventos de fusão foram detectados por par-end lê que atravessava a região de fusão e lê que cruzou a região de fusão; B: A comparação das leituras os resultados do mapeamento para os transcritos de fusão entre as três amostras. A estrutura do gene de fusão é na parte inferior. A lê contagens para “não-tumoral adjacente” e tecido “normal”, “câncer” são indicadas como “verde”, “azul” e “vermelho” bares, respectivamente. C: O RT-PCR com os resultados da sequenciação do transcrito de fusão nas três amostras. O iniciador de PCR é marcado no painel A. D: A previsão da ORF de e para a sua função PTGFRN-NOTCH2 por bioinformática, o codão de iniciação estava usando o codão de iniciação de NOTCH2 e o codão de paragem (vermelho “*”) localizado na fusão sequência de PTGFRN. O peptídeo de fusão continha os domínios (previstos pelo CD-Search no NCBI) em sua região de NOTCH2, como domínios EGF, mas alguns domínios-chave no NOTCH2 proteína, tais como domínio NOTCH e Ankyrin repete, estavam faltando.

Usando-eixos específicos transcrição reversa e PCR, descobrimos que o gene de fusão transcrito com o promotor de NOTCH2. Nós previu a ORF do gene de fusão, utilizando o codão de iniciação de NOTCH2 (Fig. 6D). Esta proteína prevista corresponde à sequência de um péptido com o primeiro 934aa 917aa de NOTCH2 (estas sequências foram listados em Suplementar S1). Nós anotada a sequência da proteína usando ferramentas CD-pesquisa no NCBI (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi, banco de dados: CDD), e encontrei alguns domínios EGF nas regiões peptídicas de NOTCH2. No entanto, alguns domínios essenciais em NOTCH2, tais como o domínio de entalhe e repetições de anquirina, foram perdidos na proteína de fusão (Fig. 6D). Por isso, inferir que a fusão do gene PTGFRN-NOTCH2 neste estudo parecia ser mais como um mutações de perda de função, de acordo com os recentemente descrito para leucemia mielóide [46], cabeça e carcinoma de células escamosas do pescoço [47], [ ,,,0],48]. No entanto, a expressão total de tipo selvagem PTGFRN, NOTCH2 e os seus alvos (PTCRA, HES1, HES5) são menos afectadas no cancro (Tabela S6), o que indica que 1) a fusão PTGFRN-NOTCH2 poderia ocorrer em um subconjunto de células cancerosas ou 2) que a fusão é heterozigótico em tecido de cancro e o alelo de fusão pode ser expressa num nível muito mais baixo. Investigações adicionais são necessárias para compreender o mecanismo particular deste evento de fusão e sua conseqüência funcional.

Discussão

Usando a tecnologia de RNA-seq, nós perfilado todo o transcriptomes de CRC, adjacente não-tumoral e com tecido normal extremamente bem. No total, cerca de 50-70000000 leituras foram gerados por amostra, o que nos permitiu quantificar a abundância expressão do gene em uma ampla gama [49]. O número de genes expressos (FPKM 0) detectados no nosso estudo é de aproximadamente 67% do total de genes de referência UCSC por amostra, representando a maioria do transcriptoma

Alternativa regulação da expressão de genes pode ser conseguida por. transcrição e regulação pós-transcricional. A primeira classe de desregulação da CRC ao nível da transcrição tem sido bem estudada utilizando a tecnologia de microarray [14], [15], [50]. Quantificação da segunda classe de mudança reguladora permanece um desafio apesar da invenção a matriz de exão [51]. A tecnologia de ARN-SEQ permite o estudo simultâneo destes dois mecanismos diferentes [19], [26], [52], [53]. Em nosso estudo, nós investigamos desregulação transcricional analisando os degs. Em seguida, utilizou-se par-fim de sequenciação de ADNc para identificar de forma mais eficiente o splicing alternativo. Além disso, através da utilização do algoritmo de miso, fomos capazes de medir o nível de expressão relativa das diferentes isoformas produzidas pelos acontecimentos-exon, que são medidas quantitativas de splicing alternativo. Curiosamente, os genes afectados por estes dois mecanismos reguladores diferentes são amplamente independentes (Fig. 4B), sugerindo formas versáteis para reprogramar o transcriptoma câncer.

A invasão local e metástases à distância do câncer tem sido considerado um processo de várias etapas compostas da mudança regulatória do circuito intracelular e a complexa interação entre as células cancerosas e seu microambiente [36], [54], [55]. Durante a invasão e metástases, remodelação frequente da matriz extracelular permite que as células cancerosas para difundir a partir de tumores primários e invadir o tecido normal. Em nosso estudo, descobrimos que muitos genes relacionados à interação do receptor de matriz extracelular (MEC) são altamente desregulada de forma restrita-câncer. A ECM é composta por vários tipos de macromoléculas, incluindo as proteínas do tipo do colagénio, lamininas, tenascina e outras moléculas de adesão [55]. Todos os genes do tipo colagénio, incluindo colagénio do tipo I-IX, são sobre-regulada de 10 a 1000 vezes em tecido de cancro (Tabela S7). Embora haja alguma concordância entre nossas observações e estudos anteriores sobre o aumento da regulação do mRNA colágeno no tecido do cancro colorectal [56], a indução penetrante de mRNAs de colágeno é exclusivo para o nosso estudo. Estes achados sugerem que a reprogramação da rede família de proteínas de colágeno durante o desenvolvimento do cancro do cólon pode ser muito mais complexo do que se pensava anteriormente. Além disso, também notar-se que os membros da família da metaloproteinase de matriz (MMP), que degradam as estruturas ECM [55], [57], são também significativamente induzida em tecidos de cancro, de acordo com um relatório anterior [58]. A mudança vezes na expressão das MMPs variou de 10 vezes (MMP1, MMP3 e MMP14) e 554 vezes (MMP7). Entretanto, outras moléculas relacionadas com a adesão célula-célula, tais como lamininas (LAMA4, LAMA5, LAMB1, LAMB2 e LAMC2) e integrinas (ITGA5, ITGA5, ITGB5, ITGA11 e ITGBL1), são elevados em tecidos de cancro. Nós também detectada a sobre-regulação do factor de crescimento endotelial vascular (VEGF), o que sugere que o “interruptor angiogénese” está activado no tecido de cancro. Tomados em conjunto, o up-regulação global da via ECM e do fator de crescimento angiogênico indica que a progressão CRC leva a enorme remodelação ECM ea expansão de novas redes de vasos. Além disso, estudos anteriores demonstraram que os genes na via de ECM são sob modificação epigenética intensiva [59] e, portanto, podem ser novos biomarcadores prognósticos; Assim, o nosso estudo fornece um maior conhecimento sobre usando alterações de expressão em membros da via de ECM como biomarcadores candidatos.

fusão do gene, o que muitas vezes resulta de uma aberração genómico, tem sido mostrado para ser o mecanismo chave para a geração de “oncogenes” quiméricos que iniciam a tumorigénese ou contribuem para a progressão do tumor (revisto em [60]). Usando a técnica de ARN-SEQ, o transcrito de fusão de genes expressos que é mais provável para produzir um produto funcional pode ser detectada [23], [61]. Dado que a fusão do gene comum é raro no CRC [5], identificando fusão de genes específicos para cada caso pode ajudar a entender a complexidade da base molecular do desenvolvimento CRC. Neste estudo, nós detectamos um gene de fusão com restrição de câncer entre PTGFRN e NOTCH2 no CRC. Além disso, as fusões de genes entre as variáveis ​​de imunoglobulina lambda e IGLL5 foram detectados no resultado da filtragem de TopHat-Fusion (Tabela S5), que pode representar rearranjos imunitárias em células associadas a tumores B. Estudos anteriores sugeriram que a consequência de fusão de genes pode ser i) uma alteração da expressão do gene de [62]; ou ii) a geração de uma proteína truncada ou quimérico com uma função diferente [63]. Porque a transcrição PTGFRN-NOTCH2 inclui apenas uma pequena porção de PTGFRN ea expressão de PTGFRN e NOTCH2 não são regulados negativamente no CRC, nós raciocinar que as funções originais destes dois genes não são afetados por este evento de fusão, e, portanto, o ganho de função desta construção de fusão será particularmente interessante para o estudo futuro. Dado que a maior parte do gene de fusão é composta por NOTCH2, a função deste produto de fusão poderia estar mais relacionado com que para NOTCH2. NOTCH2 é um homólogo de NOTCH1 e desempenha um papel numa variedade de processos de desenvolvimento, controlando decisões destino celular. NOTCH2 expressão tem sido demonstrado ser um indicador de prognóstico e está relacionada com o estado de diferenciação tumoral em CRC [64], [65]. Além disso, o ganho de função de NOTCH2 truncado com mutações nonsense provoca um distúrbio autossómico dominante esquelético [66]. Portanto, NOTCH2 pode desempenhar um papel importante no desenvolvimento da CRC, e a fusão do gene PTGFRN-NOTCH2 poderia introduzir efeitos negativos dominantes sobre o programa de desenvolvimento normal.

Materiais e Métodos

Amostra informações

foi obtido consentimento informado por escrito dos pacientes, e esta série de estudos foi revisto e aprovado pelos Comitês de Fujian Hospital Provincial (Fuzhou, China) ética institucional. Três amostras utilizadas no RNA-Seq, incluindo mucosa distante normais do cólon, mucosa do cólon adjacente e câncer, foram coletadas de um paciente chinês que foi diagnosticado com estágio III cólon adenocarcinoma. A distância entre adjacente não-tumoral e tecido de cancro limites é de cerca de 1 centímetro, enquanto que a do tecido normal e tecido de cancro distante é cerca de 10 cm. FIG. S1 fornece a micrografia da amostra câncer utilizado em nosso estudo. Dez amostras normais e cancerosas emparelhados utilizados na validação adicional foram obtidos a partir de dez doentes com estádio III de adenocarcinoma do cólon.

Biblioteca preparação

O ARN total foi extraído a partir de, adjacente não-tumoral e tecidos normais do cólon cancerosas

Deixe uma resposta