PLOS ONE: Cancer Reduz transcriptoma Specialization

Abstract

Um objectivo central da biologia do câncer é entender como as células desta família de doenças genéticas sofrer alterações morfológicas e fisiológicas específicas e regredir para um estado desregulado do ciclo de célula. O fato de que os tumores não são capazes de executar a maioria das funções específicas do tecido original leva à hipótese de que o grau de especialização do transcriptoma de tecidos cancerosos deve ser menor do que suas contrapartes normais. Com o auxílio de ferramentas teoria da informação, analisou-se quatro conjuntos de dados provenientes de transcriptomes de tecidos normais e tumorais para testar a hipótese de que quantitativamente cancro reduz especialização transcriptoma. Aqui, mostramos que a especialização da transcrição de um tumor é significativamente menor do que o tecido normal correspondente e comparável com a especialização de células estaminais embrionárias indiferenciadas. Além disso, demonstra-se que a queda na especialização em tecidos cancerosos é em grande parte devido a um decréscimo na expressão de genes que são altamente específicos para o órgão normal. Esta abordagem dá-nos uma melhor compreensão da carcinogênese e oferece novas ferramentas para a identificação de genes que são altamente influente na progressão do cancro

Citation:. Martínez O, Reyes-Valdés MH, Herrera-Estrella L Câncer (2010) reduz transcriptoma Especialização. PLoS ONE 5 (5): e10398. doi: 10.1371 /journal.pone.0010398

editor: Shin-Han Shiu, Michigan State University, Estados Unidos da América

Recebidas: 3 de março de 2010; Aceito: 07 de abril de 2010; Publicado em: 03 de maio de 2010

Direitos de autor: © 2010 Martínez et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este trabalho foi apoiado pelo Consejo Nacional de Ciencia y Tecnología (Conacyt), Consejo de Ciencia y Tecnología del Estado de Guanajuato (Concyteg), Centro de Investigación y de Estudos Avançados del Instituto Politécnico Nacional (CINVESTAV) e Universidad Autónoma Agraria Antonio Narro (UAAAN). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

o cancro é uma família complexa de doenças genéticas adquiridas em que um único clone de células e a sua progenitura acumulam alterações hereditárias que causam um fenótipo maligno de crescimento celular desregulado e diferenciação [1]. Numerosos estudos têm sido realizados para melhor compreender as alterações que ocorrem no perfil de transcrição durante a progressão do cancro [2]. Estas experiências foram realizadas por meio da contagem directa das etiquetas de genes expressos usando a análise em série da expressão genética (SAGE) [3], Expressed Sequence Tag (EST) [4], e outras estratégias de contagem, ou indirectamente medindo os níveis de transcrição usando DNA microarrays [5]. Em muitos casos, estas experiências foram detectados genes que são preferencialmente expressos em um tumor de cancro e podem servir como marcadores moleculares de tumores malignos. Além disso, eles também podem detectar alterações significativas no nível de transcrição de conjuntos de genes que participam em redes de sinalização complexas. Mudanças nessas redes representam distorções das vias que regulam a fisiologia das células normais [6].

As células cancerosas perdem a capacidade de executar as funções normais do tecido original, e, ao mesmo tempo, ganhar características que permitir-lhes sobreviver como um tumor independente e frequentemente invasivo. Como linhas celulares evoluem a partir de um estado normal para um canceroso, mutações conduzir um aumento na diversidade genética [7]. Este processo ocorre em paralelo com a selecção de fenótipos e genótipos que permitam as células pré-cancerosas de prosperar em seu microambiente [8]. As células de tumor muitas vezes não têm a diferenciação que está presente no tecido normal que eles originam. Desde meados da década de 19

th século, este fato tem patologistas levam a sugerir que os tumores surgem de células embrionárias-like [9]. Dado que o cancro deve surgir a partir de uma célula que tem o potencial de se dividir, duas hipóteses não-exclusivos de origem celular de tumores historicamente têm sido propostos. A primeira hipótese estabelece que malignidade surge a partir de células estaminais por parada de maturação; os segundos estados que o cancro surge da desdiferenciação de células maduras [10]. Mais recentemente, no entanto, o conceito de “células-tronco cancerosas”, ou células raras com um potencial ilimitado de auto-renovação, ganhou aceitação como uma subpopulação de células que impulsiona tumorigênese. Esta hipótese baseia-se na constatação de que têm mostrado que, em alguns casos, apenas um subconjunto das células dentro de um tumor tem ilimitado potencial proliferativo [11]. No entanto, esta hipótese permanece controverso, uma vez que o crescimento de certos tumores malignos é impulsionado por uma percentagem substancial das células tumorais que não sejam células estaminais cancro (maior do que 10%) [12]. Independentemente disso, há uma evidência clara de que o fenótipo indiferenciado de muitas células de tumor se assemelha o fenótipo de células normais não diferenciados, tais como células estaminais embrionárias. Além disso, o estudo da expressão do gene em tumores de cancro revelou que os tumores pouco diferenciados mostram a sobre-expressão preferencial de genes normalmente enriquecidas em células estaminais embrionárias, apoiando a possibilidade de que estes genes contribuem para os fenótipos semelhantes a células estaminais demonstrado por muitos tumores [13].

Anteriormente, descrevemos o desenvolvimento de índices com base na teoria da informação de Shannon para medir a diversidade transcriptoma, especialização e especificidade gene de órgãos e tecidos normais [14]. Nesse estudo, foi obtido um índice de especificidade do gene,

S

i

, que tem um valor de zero para genes que são igualmente expressos em todos os tecidos e tem um valor máximo definido quando um gene é expresso em apenas um tecido. especialização transcriptoma,

δ

J

, por conseguinte, é definido como a média especificidade gene expresso em transcriptoma (ver Materiais e Métodos). Em geral, um tecido é mais especializado se os genes específicos estão altamente expresso na mesma. Também demonstramos que os órgãos humanos têm um determinado grau de diversidade e especialização que está relacionada com a sua funcionalidade. Neste estudo, foram aplicadas ferramentas de teoria da informação para comparar a diversidade transcriptoma e especialização de tumores cancerosos versus os seus homólogos normais. Mostramos que a especialização de tecidos de câncer geralmente diminui quando comparado com os seus homólogos normal, que é principalmente devido à diminuição da expressão de genes altamente específicos.

Resultados

Nossa hipótese é que o morfológica e alterações funcionais que ocorrem durante a progressão do cancro levaria a alterações substanciais do transcriptoma do cancro, incluindo uma redução na especialidade, quando comparada com a de tecidos normais análogas. Para testar esta hipótese em uma estrutura ampla, foram selecionados três coleções de etiquetas de genes e um experimento de microarray. Conjuntos de dados

A

e

B

são selecionados coleções de bibliotecas de cDNA do “Genome Anatomy Cancer Project” [15] para os tecidos humanos e de rato, respectivamente. Dataset

C

consiste de bibliotecas SAGE de tecidos humanos e tumorais normais obtidos a partir do projeto “transcriptoma humano Map” [16] e conjunto de dados

D

é um estudo microarray de tecidos humanos em condições normais e pré estados -cancerous que foram pareados por paciente [17]. Conjuntos de dados

A

e

B

incorporar cinco células embrionárias estaminais (ESC) e bibliotecas de uma célula-tronco hematopoiéticas (HSC) e foram incluídos na análise com base no seu grau de desdiferenciação. Estes conjuntos de dados foram submetidos à análise de propriedades de informações do transcriptoma como previamente descrito [14]. Nos conjuntos de dados tag de contagem, avaliamos a significância estatística das diferenças de especialização. Em cada caso, obtivemos a especificidade (

S

i

) e Target Especificidade (

TS

ij

) para os genes estudados nos conjuntos de dados, o que permitiu a seleção dos genes sobre-expressos putativos em câncer ou tecidos normais, bem como a discriminação de genes expressos preferencialmente em uma determinada condição.

Avaliando especialização transcriptoma em tecidos normais e cancerosos

a análise de conjuntos de dados

a

e

B

para estimar a diversidade transcriptoma (

H

j,

) e especialização (

δ

j

) índices foram realizadas no três níveis de biblioteca de cDNA de agrupamento com a seguinte denominação: bibliotecas de cDNA individuais foram definidos como “não agrupada”; bibliotecas de cDNA reunidos provenientes do mesmo tipo de órgão e tecido estado (normal ou cancro) foram definidos como “agrupados”; e um outro agrupamento das bibliotecas de cDNA que só considerados o estado do tecido e não o órgão de origem foram definidos como “agrupamento completa” (ver Materiais e Métodos).

H

j

mediu a variabilidade das distribuições de transcrições e

δ

j

avaliou a especificidade média dos genes expressos no transcriptoma. Visualização das posições dos transcriptomes na (

H

j

,

δ

j

) coordenadas nos permitiu avaliar efetivamente as diferenças relativas nestes parâmetros significativos. Resultados para a análise não agrupada, a análise do conjunto de dados D, tabelas de intervalos de confiança para os parâmetros relevantes, e dissecção das diferenças de especialização transcriptoma são discutidos no texto de apoio S1.

A Figura 1 apresenta dispersar parcelas para os níveis de transcriptoma diversidade,

H

j

, e especialização,

δ

j

, ao nível agrupados para conjuntos de dados

a

e

B

. Ao comparar 12 pares de tecidos análogos humanos, 11 tecidos cancerosos tinham significativamente menor grau de especialização do que suas contrapartes normais, com câncer de olho sendo o único tecido que tinha uma especialização estimou que era maior que sua contraparte normal (Figura 1A, Tabela S4, e texto de apoio S1). No entanto, após uma análise mais aprofundada, concluiu-se que a amostra de tecido do olho é mais provável distorcida devido ao menor tamanho da amostra da biblioteca olho normal (10,679 etiquetas) em comparação com a biblioteca olho cancerosos (42,029 Tag) (ver Apoio S1 texto). Isso provavelmente impediu a estimativa correcta de genes específicos de olho na biblioteca normal. Todas as mudanças na especialização dos transcriptomes são estatisticamente significativas (Tabela S4 e S5 Tabela; P 0,01). A Figura 1A mostra também que a diversidade transcriptoma, medida por

H

J

, aumentaram nos estados cancerosos de todos os tecidos, com excepção dos testículos e placenta. O aumento em

H

J

indica uma distribuição mais uniforme dos níveis de transcrição de genes expressos, o que é provavelmente devido a uma diminuição na expressão de genes predominantes nos tecidos normais. Como mostrado na Figura 1A, observou-se que a especialização das bibliotecas ESC agrupados está no mesmo nível que a maioria dos tecidos de cancro. Isto está de acordo com a baixa especialização morfológica dos CES.

conjuntos de dados comparáveis ​​estão ligados por uma linha descontínua.

A Restaurant – Dados em seres humanos de 53 bibliotecas de 13 tecidos diferentes com um total de 671,197 tags para 28,087 genes; análises agrupadas.

B Restaurant – dados mouse de 29 bibliotecas de 5 tecidos distintos e com um total de 541,453 etiquetas expressas de 25,044 genes distintos; análises agrupadas. Os dados para

A

e

B Quais são do “Genome Anatomy Cancer Project” (https://cgap.nci.nih.gov/). intervalos de confiança de 95% aproximados para a diversidade e especialização são representados como linhas coloridas contínuas. Ver texto de apoio S1 bem como Figura S1, S2 Figura, Figura S3, S4 Figura, Figura e Figura S5 S6 que ilustram detalhes e comparações individuais.

De forma a avaliar a queda na especialização do tecidos cancerosos, comparou-se a especificidade média de genes que foram sobre-expressos em tecidos normais para que em tecidos cancerosos. Em geral, verificou-se que houve um número significativamente maior especificidade média de genes sobre-expressos em tecidos normais, sugerindo que o decréscimo na especialização era devido à redução ou eliminação da expressão de genes altamente especializados em tecidos normais durante a carcinogénese (ver Tabela S11 e S11 Figura). Também foram analisadas as dez genes mais influentes que causaram a redução da especialização em todas as onze tecidos do conjunto de dados

A. Compra de cada tecido, encontramos exemplos de genes específicos de órgãos que foram desligados no tecido canceroso correspondente, incluindo Chondroadherin (

CHAD)

no osso, Uromodulin (

UMOD)

no rim, o ácido específico da fosfatase próstata (

ACPP)

gene na próstata, e um gene para a proteína associada a espermatogênese nos testículos (Tabela S12).

Para confirmar a nossa hipótese de que a especialização diminui em tecidos cancerosos, examinamos um modelo completamente independente de tecidos de camundongos (conjunto de dados

B

). Nesta análise, todos os tecidos normais mostrou significativamente maior especialização do que os tecidos cancerosos correspondentes (Figura 1B, Tabela S6 e S7 Tabela; P 0,01). Conjunto de dados

B

também incluída uma biblioteca de HSCs obtidos a partir de medula óssea. Estas células mostraram um nível de especialização comparáveis ​​com pulmão normal e pele mesmo quando indiferenciado (Figura 1B). Em quatro dos cinco órgãos estudados no conjunto de dados

B

, a especificidade média dos genes que foram sobre-expressos em tecidos normais foi significativamente maior do que o valor correspondente para tecidos cancerosos, com a excepção da glândula mamaria ( tabela S11). No entanto, os genes relacionados com a produção de leite, que estavam dentro dos genes mais influentes da glândula mamária e têm uma elevada especificidade da expressão neste tecido (Tabela S13 e S14 Tabela), mostrou uma queda no extremo expressão no tecido canceroso. Estes resultados explicam a queda geral no especialização visto na glândula mamária. Além disso, os gráficos de dispersão de mudança de frequência de genes entre tecidos normais e cancerosos versus especialização mostrou uma prevalência de genes altamente específicos, sobre-expressos em tecidos normais dos cinco órgãos estudados (Figura S12). Conclui-se que os genes altamente específicas que diminuíram a expressão nos tecidos cancerosos conduzir a queda na especialização, semelhante ao observado no conjunto de dados A.

Os dados do “Mapa do transcriptoma humano” (conjunto de dados

C

) consistem em um conjunto de tags de genes SAGE que pertencem aos tecidos normais e tumorais heterogêneos que são agrupados por cromossomo. Nós ignorado as diferenças óbvias na perfis de transcrição entre órgãos distintos e apenas testou a hipótese de que a especialização diminui nas transcriptomes tumorais. Vale a pena notar que, em contraste com as análises de conjuntos de dados

A

e

B

, onde a especificidade gene foi estimado para a combinação de tecido e condição, no conjunto de dados C a especificidade é estimado apenas com em conta o estado do tecido (normal versus de tumor) e ignora o tecido de origem. Por conseguinte, a especificidade do gene neste conjunto de dados refere-se apenas aos tecidos normais ou tumorais, e implica que uma especialização muito menor estimativa seria observado. Uma mudança grande e significativa na especialização transcriptoma entre os tecidos normais e de tumor foi observada para todos os cromossomas (Figura 2, Figura S7, Figura S8, Figura S9 Figura S10, Tabela S9, e texto de apoio S1), com a excepção do cromossoma Y, para os quais a diferença não é significativa. A maioria das diferenças que são significativas (23 em 24) são na direção esperada e têm menos especialização nos transcriptomes tumorais. Uma exceção foi cromossomo 18, para o qual a mudança de especialização é no sentido oposto (ver Apoio S1 texto). No entanto, a análise de todos os loci juntos (Figura 2 e Tabela S9) apoia fortemente a hipótese de que o câncer reduz especialização dos tecidos

Os dados expressão humana são provenientes do projeto “Human transcriptoma Map” (http: //. bioinfo.amc.uva.nl/HTMseq/controller), conjuntos de dados “Todos os tecidos normal” e “Todos os tecidos do tumor”. Os dados consistem de 18,609,073 etiquetas para um total de 62,916 loci através cromossoma. Veja a Figura S7, S8 Figura, Figura S9 e S10 Figura que amplificam as caixas desta figura apresentando os intervalos de confiança de 95% para as estimativas.

Em nosso estudo anterior, mostramos que o posto estimado de variação da diversidade e especialização no transcriptoma humano é muito menor quando se usa microarrays do que quando a contagem etiquetas de genes [14]. Isto é devido à gama dinâmica relativamente mais estreita de microarrays comparação com tag contando estratégias [18], o que distorce ambos os genes expressos de alta e baixa. Apesar destas deficiências, a análise do normal (TDLUs) e tecidos pré-cancerosos (HELUs) pareados por paciente (conjunto de dados

D

) mostrou uma grande queda na especialização em tecidos pré-cancerosos em sete dos oito casos estudados (Figura S13) .

genes detectados somente em câncer

a abordagem da teoria da informação para o estudo do transcriptoma tem a vantagem de permitir uma estimativa do grau de especificidade gene global,

S

i

, de cada gene estudado, bem como a sua especificidade alvo,

TS

ij

, um parâmetro que mede a especificidade de um determinado gene para um transcriptoma seleccionado (ver adenda de Matemática, em texto de apoio S1) . Estas ferramentas permitem a fácil seleção de genes que são expressos preferencialmente em tecidos de câncer e, portanto, têm o potencial de servir como marcadores moleculares de malignidade. Além disso, estes índices pode auxiliar na identificação de genes que são específicas para um tipo particular de cancro ou de genes que não são significativamente alteradas durante o desenvolvimento do cancro e, portanto, podem servir como controlos marcadores durante a medição de diferentes genes de expressão. É importante notar que quando um gene em particular, um conjunto de dados é detectado apenas em tecidos de cancro, não pode ser inferida a ser exclusivamente no cancro, uma vez que também podem estar presentes em tecidos normais em níveis não detectáveis. No entanto, os genes com níveis elevados de expressão que apenas são encontradas em tecidos de cancro são bons candidatos para serem significativamente sobre-regulada no cancro.

Para identificar genes que são expressos diferencialmente em tecidos de cancro, determinou-se a especificidade do gene (

S

i

) e alvo especificidade (

TS

ij

) no conjunto de dados

a

utilizando a análise de agrupamento completa. A Tabela 1 mostra exemplos de genes representados em tecidos de cancro na proporção mais elevada do nível de expressão (mais de 1 em 10000) e ausente de todos os tecidos normais. Estes genes foram detectados apenas nos tecidos de cancro, com um número de tags (variando 54-535) em tecidos de câncer e sem etiquetas em tecidos normais (máximo

S

i

na análise). Para validar estatisticamente a freqüência regulada positivamente desses genes, foi aplicado o teste exato de Fisher [19] com a correção de Bonferroni para testes de múltipla [20] (ver Métodos). A tabela 2 apresenta genes que foram detectadas em apenas um tipo de cancro. A identificação desses tipos de genes foi possível (trough

S

i

e

TS

ij

) devido à inclusão de vários tipos de tecidos de câncer na análise. Tabela S10 mostra exemplos de genes expressos exclusivamente em taxa relativamente alta em tecidos tumorais na análise do conjunto de dados

C

.

Discussão

O uso de ferramentas da teoria da informação para avaliar quantitativamente mudanças nas constantes abundâncias transcrição estaduais nos permitiu examinar quatro conjuntos de dados diferentes para determinar se tecidos cancerosos têm menos especialização transcriptoma do que suas contrapartes normais. Os resultados obtidos a partir destas análises mostraram que a especialização do transcriptoma cancro diminuída quando comparado com o equivalente de tecido normal. A diminuição na especialização transcriptoma foi principalmente devido a uma redução no nível de genes que são e, normalmente, expresso em níveis elevados no tecido normal específica do tecido (ver texto de apoio S1 e Tabela S11, Tabela S12, Tabela S13, Tabela S14, Tabela expressão S15 e S16 Tabela). Estes resultados estão em concordância com a observação de que os tumores frequentemente mostram tipos de células morfologicamente desdiferenciadas de um modo semelhante ao observado nas células estaminais [21]. Além disso, provas molecular demonstrou que os tumores pouco diferenciados de cancro sobre-expressar genes que são enriquecidas em células estaminais embrionárias [13]. Não é completamente claro se inicia o cancro por um processo de de-regulação das células estaminais por um órgão ou de desdiferenciação de-novo de células de órgãos accionados pelas mutações que surgem durante o desenvolvimento do tumor [7].

Todos os estudos de transcriptoma de alto rendimento que usado tanto estratégias de tag de contagem ou microarrays medido apenas mudanças relativas nos níveis de transcrição. Esta abordagem torna o pressuposto universalmente aceite que todas as células têm a mesma actividade transcricional absoluto. No entanto, esta suposição não tem validação experimental, especialmente no caso de células cancerosas. O método utilizado neste estudo mediu os níveis relativos de expressão de genes (o conjunto de

p

ij

) para avaliar a especificidade genética, diversidade transcriptoma, e especialização. Por conseguinte, não se pode descartar a possibilidade de que todos os genes poderia ter um nível de expressão mais elevado em absoluto o cancro do que em tecidos normais. No entanto, um aumento geral da transcrição em células cancerosas não terá um grande impacto na especialização transcriptoma ou na especificidade da expressão do gene.

especialização transcriptoma, δ

i, é medido exclusivamente no contexto de os órgãos ou tecidos incluídos na análise e reflecte a polarização órgão ou tecido para a expressão de genes específicos. Para estimar a “verdadeira” especialização de um tecido, todos os tipos de células distintos de um determinado órgão deve ser incluído separadamente na análise. Isto não foi cumprida na análise realizada aqui devido a limitações dos dados utilizados neste estudo. Um segundo factor que afecta a estimativa de especialização, é a dimensão da amostra, ou mais especificamente, o número de etiquetas de genes empregues. genes altamente específicas tendem a ser expresso num pequeno subconjunto de células que formam um órgão e, portanto, possuem uma elevada probabilidade de não ter quaisquer etiquetas de genes e não estar presente, se a amostra é relativamente pequena. Como resultado, a especialização tende a ser subestimado em amostras pequenas. No caso do conjunto de dados

Um

, o número total de etiquetas era 620.696, com 131,623 (21%) etiquetas correspondentes para os tecidos normais e os restantes 489,073 (79%) etiquetas correspondentes a tecidos cancerosos. Por conseguinte, o potencial para subestimar a especialização foi mais elevado para os tecidos normais do que para os tecidos cancerosos. No entanto, a figura 1A mostra uma forte evidência de menos especialização nos tecidos cancerosos. Este foi observada em conjuntos de dados

B Comprar e

C

também.

órgãos humanos são compostos de diferentes números e tipos de células e, portanto, têm diferentes níveis de complexidade. Um órgão mais complexo irá ter um maior número de tipos de células diferentes, e, como resultado, a estimativa da sua diversidade e especialização será menos preciso e requer uma amostra maior de precisão. Em contraste, os tumores são formados por um pequeno número de tipos de células distintos e a estimativa da sua diversidade e especialização será mais precisa com um dado tamanho de amostra. Isto é evidente pelo tamanho dos intervalos de confiança para cada ponto na Figura 1 (ver também Figura S1, S2 Figura, Figura S3, S4 Figura, Figura e Figura S5 S6). Em ambos os casos (conjuntos de dados

Um

e

B

), o tamanho dos intervalos de confiança é maior para os tecidos normais analisados ​​do que para os seus homólogos cancerosas. No entanto, as diferenças de especialização entre tecidos normais e cancerosos vários intervalos de confiança separados, demonstrando que as conclusões são estatisticamente robusta (Tabela S4, S5 Tabela, Tabela S6, S7 tabela e Tabela S8).

É bem conhecido que as células tumorais são frequentemente indiferenciado e se assemelham a células estaminais embrionárias [9]. Para comparar o nível de especialização dos tecidos cancerosos com a do CES, que incluiu cinco bibliotecas dos CES no conjunto de dados

A

e analisou-los individualmente (Figura S1) ou em grupo (Figura 1A). A posição do CES na Figura 1 e Figura S1 corrobora que o nível de especialização das células estaminais é comparável com a maioria dos tecidos de cancro analisadas. Estes dados confirmam a correlação entre a desdiferenciação fenotípica e a queda na especialização em ambos os CES e as células cancerosas. Infelizmente, os dados que mostram o grau de desdiferenciação nos tumores distintos analisados ​​conjuntos de dados

A

,

B, Comprar e

C

não estavam presentes nas bases de dados e, portanto, poderíamos não se inferir a existência de uma relação entre o grau de desdiferenciação do tumor e a sua queda na especialização. No entanto, se a hipótese de que esta relação é provável que exista, uma vez que o grau de desdiferenciação do tumor parece correlacionar com a expressão dos conjuntos de genes que são enriquecidos em CES [13].

Analisamos uma biblioteca de HSCs como parte do conjunto de dados

B

. Esta biblioteca foi feita a partir de células estaminais purificadas por FACS, hematopoiéticas obtidas a partir de medula óssea e representa células que podem diferenciar-se em células mielomonocíticas, células B ou células T. Em contraste com os CES da Figura 1, estas células originadas de um órgão adulto especializado. Como mostrado na Figura 1B, HSCs têm um nível de especialização estimado comparável à de pulmão normal e maior do que a pele normal. Isto indica que os tipos de células relativamente indiferenciadas pode apresentar uma relativamente elevada especialização do transcriptoma. Nossa conclusão é também apoiada pela análise do transcriptoma de tecidos linfáticos normais (linfa e Lymphr; Figura 1A).

Propomos que a aptidão de uma célula pré-cancerosa, no contexto de um tumor, será aumentado Se os genes relacionados com a função original do tecido parental está desligado, porque este conjunto altamente expressa e específica de genes representa um custo elevado em energia e recursos que seria desvantajoso no contexto do tumor. A nossa hipótese sugere que, se a expressão desses genes altamente expressos e específicos é reduzida ou desligada, em seguida, uma diminuição na especialização do tecido deve ser observada. Dissecar a redução na especialidade através da análise dos componentes genéticos individuais vai proporcionar uma melhor compreensão da carcinogénese. Além disso, se a queda na expressão de, pelo menos, alguns destes genes precede alterações morfológicas nas células pré-cancerosas, a queda pode ser explorada para propõe diagnóstico. Nossa hipótese não é contrariada pela observação de desdiferenciação em tecidos de câncer, mas sim paralelos esta conclusão:. Tecidos com maior fenótipo desdiferenciado vai expressar um transcriptoma menos especializado

A análise no conjunto de dados

C

foi realizada em loci que foram agrupados por cromossomas a partir de uma mistura heterogénea de tecidos classificados somente como “normais” ou “tumor”. Por conseguinte, a especificidade dos loci só é estimada com respeito a este critério e não no que diz respeito ao órgão de origem como em conjuntos de dados

Um

e

B.

Como consequência, a especialização estimado para a tecidos tumorais “” “normal” e é muito menor do que o grau de especialização estimado quando o órgão de origem é levado em conta (comparar figuras 1 e 2). Apesar das diferenças menores na especialização entre tecidos normais e cancerosos no conjunto de dados

C

, os dados são estatisticamente significativos para todos os cromossomos (exceto para o cromossomo Y) e todos os casos, exceto para cromossomo 18, indicam que uma queda na especialização ocorre em tumores (Tabela S8). Curiosamente, o cromossomo 18 contém genes vários supressores de tumor incluindo

DDC

,

DPC4,

e

JV18-1 /MADR2

[22] e, portanto, a alta expressão destes genes poderia dirigir o aumento observado na especialização (ver Tabela S15). Tomados em conjunto, estes dados servem uma confirmação independente da hipótese de que a especialização transcriptoma diminui em tumores. Prevemos que melhor compreensão dos mecanismos responsáveis ​​pela queda na especialização que ocorre em tumores através de uma melhor caracterização dos perfis transcriptoma câncer vai levar ao desenvolvimento de novas ferramentas de diagnóstico molecular e técnicas de intervenção.

A partir da análise agrupada tecidos normais e cancerosos no conjunto de dados

a

( “agrupamento completa”; ver Métodos) detectamos 14,573 genes (52%) de um total de 28,087 genes que foram representados nos tecidos normais ou cancerosas somente (gene estimado especificidade

S

i

= 1). Destes genes com especificidade máxima, 6,220 (43%) foram detectadas exclusivamente em cancro e os restantes 8.353 (57%) foram detectadas exclusivamente em tecidos normais. As nossas observações de que os genes específicos foram encontrados em apenas um grupo específico (tecidos normais ou cancerosas) foram dependente do tamanho da amostra e, portanto, necessária a análise estatística para determinar a significância. O teste exato de Fisher com correção de Bonferroni (ver Métodos) concluiu que apenas 17 dos genes que foram detectadas exclusivamente em tecidos cancerosos foram significativamente regulada. Estes genes são apresentados na Tabela 1. Tabela S17 apresenta as classificações Gene Onto- para os genes apresentados na Tabela 1.

Se os índices da teoria da informação são eficazes na identificação de genes regulados positivamente em cancro, eles devem também detectar genes que têm anteriormente foi relatado para ser associada com o cancro. Este foi realmente o caso, como a lista de genes detectados exclusivamente no câncer (Tabela 1), incluindo

TRAF7,

PRPS1

,

CDT1,

e

ZWINT ,

foram anteriormente descritos como genes marcadores de cancro [23], [24], [25], [26]. Mais importante, esta abordagem quantitativa identifica genes potencialmente envolvidos no câncer que não tenham sido previamente identificados, tais como

KLHL21

,

KIFC1

, e

XAB2

(Tabela 1). Uma descrição dos genes listados na Tabela 1 são apresentadas em textos Apoiando S1.

Os genes listados na Tabela 2 foram encontrados estar presente em apenas um tipo de cancro em níveis significativamente elevados de expressão (análise agrupados, conjunto de dados

a

) e exemplificar as ricas possibilidades de mineração de dados usando especificidade (

S

i

) e alvo especificidade (

TS

ij

) do gene expressão. Entre estes genes, encontramos exemplos de marcadores de cancro (

MLANA)

(também apresentados na Tabela 1), um oncogene descrito recentemente (

OTX2

) [27], e um gene usado como um

Deixe uma resposta