PLOS ONE: identificação de diferencialmente Comum genes expressos em Bexiga Cancer

Abstract

Fundo

diagnóstico e tratamento de cancro da bexiga urinária (BC) atual tem mostrado grande progresso com a utilização de microarrays .

Purpose

Nosso objetivo foi identificar genes diferencialmente expressos comuns (dE) entre subclasses clinicamente relevantes do BC utilizando microarrays.

Metodologia /Principais achados

amostras e controlos BC, conjuntos de dados experimentais e acessíveis ao público, foram analisados ​​por microarrays do genoma inteiro. Nós agrupadas as amostras de acordo com a sua histologia e definidos os genes De em cada amostra individual, bem como em cada grupo de tumor. A estratégia de análise dupla foi seguido. Primeiro, amostras experimentais foram analisados ​​e as conclusões foram formuladas; e, segundo, conjuntos experimentais foram combinados com conjuntos de dados de microarranjos acessíveis ao público e foram ainda analisados ​​em busca de genes comuns DE. O conjunto de dados experimental identificou 831 genes que estavam DE em todas as amostras de tumor, simultaneamente. Além disso, 33 genes foram regulados positivamente e 85 genes foram regulados negativamente em todas as amostras 10 BC em comparação com os 5 tecidos normais, simultaneamente. agrupamento hierárquico dividido grupos de tumor de acordo com sua histologia. K-means de todos os genes e todas as amostras, assim como o agrupamento dos grupos de tumor, apresentou 49 aglomerados. K-means agrupamento de genes comuns De em todas as amostras revelaram 24 clusters. Genes manifesta vários padrões diferenciais de expressão, com base no PCA. YY1 e NFkB estavam entre os fatores de transcrição mais comuns que regulavam a expressão dos genes DE identificados. Cromossomo 1 contém 32 genes DE, seguido de cromossomas 2 e 11, que continham 25 e 23 genes DE, respectivamente. Cromossoma 21 teve o menor número de genes DE. análise GO revelou a prevalência de transporte e genes obrigatório em todos os comuns genes DE down-regulados; a prevalência de metabolismo de RNA e de processamento de genes nos genes regulados positivamente de; , bem como a prevalência dos genes responsáveis ​​para a comunicação celular e a transdução de sinal em que os genes DE foram regulados negativamente em T1-Grau III e tumores supra-regulados em tumores /T3-T2 grau III. Combinação de amostras de todas as plataformas de microarray revelou 17 genes comuns DE, (BMP4, CRYGD, DAP, GJB1, KRT83, MPZ, NHLH1, TACR3, ACTC1, MFAP4, SPARCL1, TAGLN, TPM2, CDC20, LHCGR, TM9SF1 e HCC) 4 de que participam em numerosas vias.

Conclusões /Significado

a identificação dos genes comuns entre as amostras dE BC de histologia diferente pode fornecer uma visão mais aprofundada a descoberta de novos marcadores putativos.

Citation: Zaravinos a, Lambrou GI, Boulalas I, Delakas D, Spandidos dA (2011) Identificação de diferencialmente comum genes expressos em urinário cancro de bexiga. PLoS ONE 6 (4): e18135. doi: 10.1371 /journal.pone.0018135

Autor: Michael Polymenis, Texas A M University, Estados Unidos da América

Recebido: 9 de setembro de 2010; Aceito: 26 de fevereiro de 2011; Publicação: 04 de abril de 2011

Direitos de autor: © 2011 Zaravinos et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. O Departamento of Urology, Asklipieio Hospital Geral, 16673 Voula, Atenas, Grécia financiou o estudo. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

Cancro da bexiga urinária (BC) é o quinto câncer mais comum em homens. O pico de prevalência da doença é entre pacientes 60-70 anos de idade. BC é curável se for diagnosticado durante as fases iniciais da doença. Tumores da bexiga urinária desenvolver através de dois distintos, mas um pouco sobrepostas vias: papilar e não-papilar. Aproximadamente 80% dos BCs consistem em lesões papilares exofíticas superficiais que se originam de hiperplasia urotelial. Estes tumores papilares tipicamente de baixo grau podem reaparecer, mas raramente invadem a parede da bexiga ou metástase. Os restantes 15-20% de tumores de grau elevado representam BCs não papilares sólidos que surgem de neoplasia de alto grau intraurothelial. Estes tumores invadem agressivamente a parede da bexiga e têm uma alta propensão para metástases à distância [1].

monitoramento gene-expressão paralela é uma ferramenta poderosa para analisar as relações entre os tumores de bexiga, descobrindo novos subgrupos de tumores, a atribuição de tumores pré as classes -definida, a identificação de genes específicos de fase co-regulados ou de tumor e prever a evolução da doença [2], [3], [4], [5], [6], [7], [8]. Até à data, muito esforço tem sido gasto, de modo a identificar genes que apresentam expressão diferencial (ED) entre diferentes tipos de tumor versus outros grupos de tecidos, tais como tecidos fenotipicamente normais. No entanto, os genes DE relatados variam entre os diferentes grupos de estudo, de acordo com a metodologia baseada no micro-arranjo e o número de casos. Uma questão intrigante que não tenha ainda sido contemplado envolve possível de dados que pode ser recolhida sobre genes que são diferencialmente expressos simultaneamente em todos os casos de tumor estudo.

No presente estudo, foi realizada a análise cDNA microarray, compreendendo in- casa experimental, bem como dados disponíveis publicamente, para analisar o perfil de BC a expressão do gene e determinar os genes dE entre o câncer eo tecido saudável. A detecção de genes de DE foi realizada em cada amostra individual, assim como do tumor em cada grupo, conforme definido pelo exame histológico e os dados reportados. Os dados foram agrupados com diferentes algoritmos e funções dos genes DE conhecidos foram adicionalmente definidos pelo Gene Ontology. Além disso, não procurou apenas para diferenças entre os tipos de tumor, mas sim por semelhanças. A razão para esta abordagem foi a de que, embora diferentes tipos de tumores são esperados ter diferenças nos seus perfis de expressão, mesmo entre indivíduos com o mesmo subtipo de tumor, a hipótese de que os tumores possuem características semelhantes que podem, eventualmente, levar ao conhecimento das etiologias da carcinogénese. Em um trabalho significativo pela

Goldstein et al.

Tentativa de detectar uma célula comum de origem para os cancros da próstata foi relatado. Eles implícito que, apesar das diferenças que as células tumorais fazer partes, existe uma possibilidade de uma origem comum [9]. No mesmo sentido buscou-se identificar perfis de expressão genética comum entre os diferentes tecidos tumorais. Neste ponto, devemos mencionar que a expressão do gene, particularmente a partir de biópsias de tumores, representa literalmente uma “snap-shot” do estado-espaço do comportamento de outra forma dinâmica da doença. No entanto, este “snap-shot” pode ser adequada a fim de obter informações úteis sobre a dinâmica do sistema de estudo. Particularmente no caso de tumores, é a única ferramenta que temos para extrair informações no

ex vivo

nível.

Os dados dão suporte ao valor das assinaturas de expressão gênica baseada em microarrays uma vez que estes identificar propriedades celulares clinicamente importantes.

Materiais e Métodos

Amostra de tecido tumoral e Procedimento cirúrgico

Dez amostras de cancro da bexiga urinária de pacientes com BCs recém-diagnosticados submetidos tumor da bexiga transuretral ressecção do Departamento de Urologia “, Asklipieio” general Hospital, Atenas, bem como cinco amostras de tecidos normais, foram adquiridos depois de a quantidade de tecido necessário para exame de rotina patologia tivesse sido removido. Os pacientes estudados eram de idade avançada (73,9 ± 12,0 anos). A maioria (10/06, 60%) eram fumantes ou ex-fumantes, ao passo que quatro (40%) foram caracterizados por algum nível de exposição ocupacional a agentes associados BC (tintas, produtos químicos, etc.). Todos os espécimes de tumores foram classificados e classificado pelo mesmo patologista. graduação histológica foi realizada utilizando tanto o 1973 Organização Mundial da Saúde (OMS) e pela OMS Society 2004 /Internacional de Urologia Patologia (ISUP) classificações [1]. estágio do tumor foi avaliada de acordo com o sistema de estadiamento 2002 Comité Misto Americana do Cancro [10]. consentimento informado por escrito foi obtido de todos os pacientes incluídos neste estudo. O protocolo do estudo foi aprovado pelo Comitê da Universidade de Creta Ética. critérios de elegibilidade utilizados foram eletivamente dissecados BCs primários e a disponibilidade de DNA a partir de tecido normal e tumor para análise biomolecular. Os critérios de exclusão foram história de neoplasias anteriores e quimioterapia ou radioterapia antes da cirurgia

As amostras de tecido foram obtidos no momento da cirurgia do tumor e os seguintes três locais selecionados grosseiramente normais (biópsias copo frio):. parede posterior, trígono e área adjacente ao tumor. Partes das amostras normais dissecados foram enviadas para análise histopatológica. Tecidos tumorais e normais foram congeladas imediatamente em azoto líquido, transportado e armazenado a -80 ° C até à extracção de ADN.

Pacientes com BCS-não-invasivos musculares foram acompanhados com exames periódicos cistoscópicas e tratamento intravesical como indicado. Pacientes com BCs invasivas foram oferecidos cistectomia radical com ou sem quimioterapia sistêmica.

Imunohistoquímica

Secções, 3 mm de espessura, de tecido fixado em formol e embebido em parafina foram cortados e colocados em lâminas revestidas com 3-aminopropyltriethoxysilone. As lâminas foram secas a 56 ° C durante 1 h antes da coloração imuno-histoquímica. As secções de tecido foram desparafinados em xileno antes de re-hidratação em álcoois graduados, e a actividade da peroxidase endógena foi bloqueada por tratamento com 3% H

2O

2, à temperatura ambiente durante 15 min. Antigen desmascaramento foi realizada por 30 min de incubação a 80 ° C em citrato trissódico 10 mM (pH 6,1). Imunocoloração e de revelação foram realizados em automatizar Dako. As lâminas foram incubadas à temperatura ambiente com anticorpos de cabra policlonais primárias contra o anti-ErbB2 (1:800; Dako), ciclina D1 (1:100; SP4; Epitomics), anticorpo monoclonal contra o anti-p53 (1:250; E26; Epitomics) e o anticorpo monoclonal contra o anti-Ki-67 (1:100; SP6; Epitomics). Os epitopos do anticorpo primário foram localizados pela técnica de imunoperoxidase utilizando o kit de anticorpo secundário complexo avidina-biotina com peroxidase e substrato (kit de 5001, Dako), de acordo com o protocolo do fabricante. As secções foram então tratadas com Chromagen 30-30 diaminobenzidene tetracloridrato para identificar locais de imunoprecipitação por microscopia de luz. Finalmente, as secções foram lavadas, contrastadas com hematoxilina e montadas sob lamelas. Nenhuma coloração específica foi observada quando o anticorpo primário foi omitido do protocolo (controlo negativo). Especificidade da imunocoloração foi adicionalmente controlado por coloração simultânea de amostras de câncer de mama com ErbB2 conhecida, ciclina D1, p53 e padrões de expressão Ki67. Um patologista experiente marcou a intensidade da coloração em quatro níveis (negativos, fracas, moderadas e fortes), considerando tanto a intensidade da cor e número de células coradas.

Microarray Experimentação e Inclusão de publicamente disponíveis Microarray conjuntos de dados

fichas Oligos microarray (~57 k genes) foram obtidos de GE Healthcare (IL) e AppliedMicroarrays (MA) (ex Amersham Biosciences) (CodeLink 57 k Human Whole Genome) [11], [12], [13]. A hibridação foi realizada com o kit de amplificação de ARN e Rotulagem CodeLink como descrito pelo fabricante, utilizando o corante fluorescente Cy5. As lâminas foram digitalizadas com um scanner de microarray (ScanArray 4000XL). Imagens foram gerados com software de aquisição ScanArray microarray (GSI Lumonics, EUA). ARNc a partir de três montagens experimentais foram utilizados em experiências individuais com picos internos como controlos. As montagens experimentais consistiu em 10 amostras urinárias BC de histologia diferente (ver amostras de tecido e na secção Procedimento Cirúrgico) e 5 amostras de controlo. As imagens digitalizadas foram posteriormente tratados com o Analysis Expression v5.0 Software CodeLink de Amersham Biosciences (presentemente GE Health Care Inc.). A montagem experimental foi analisada com base no referencial-design como descrito anteriormente [14], [15], [16] conforme apresentado na Figura S1A. Todas as amostras de tumor foram comparados com o valor médio das amostras de controlo. dados de microarranjos-primas estão disponíveis no banco de dados de microarray GEO. Todos os dados de microarranjos são Miame compatível

A fim de expandir o número de amostras BC sob investigação, que incluiu os seguintes conjuntos de dados disponíveis publicamente microarray em nossa análise:. 1) GSE89 conjunto de dados (GDS183) [17], compostos por 40 amostras aC; 2) GSE3167 conjunto de dados (GDS1479) [18], composta de 60 amostras (9 controles e 51 amostras BC); 3) GSE7476 conjunto de dados [19], composto por 12 amostras (3 controles e amostras 9 BC) e 4) do conjunto de dados GSE12630 [20], composto por 19 amostras de BC. No total, a nossa análise de microarray reunida foi composto por 17 amostras de controlo (n = 5, para a plataforma CodeLink; e n = 12, para as plataformas restantes microarray) e 129 amostras de BC (N = 10, para a plataforma CodeLink; e n = 119, para os restantes plataformas de microarray). Os dados públicos foram utilizados na sua forma normalizada disponível, uma vez que a correcção de fundo e normalização já havia sido realizada.

Processamento de Dados Microarray

Microarray Filtrando dados e correção de fundo da Plataforma CodeLink.

a filtragem é realizada com base na intensidade do sinal e no critério de saber se este sinal está acima de um certo nível. Na nossa análise, filtragem foi realizada utilizando a equação: onde S é a intensidade do sinal medido, B

L é o local de fundo medido e σ

BL é o desvio padrão do fundo local. Os sinais com menor intensidade do que a medida acima, obtida uma bandeira. Correcção de fundo foi realizada subtraindo-se o fundo global de médio a partir do fundo locais mediana da intensidade do sinal. Um limiar de 2 foi definido como ponto de corte, o que significa que a intensidade local para pelo menos um canal deve ser o dobro do que a do fundo.

Microarray Normalização de dados da Plataforma CodeLink.

Microarray dados foram normalizados pelo procedimento padrão do software CodeLink, isto é, intensidades de mancha foram divididos por a mediana global (normalização mediana global) [13]. dados normalizados foram extraídos, pré-processadas e classificadas com o Microsoft Excel ®. Para uma análise mais aprofundada dos dados foi utilizado o Matlab ® (The Mathworks Inc.) ambiente de computação. Os dados foram examinados para seu padrão de distribuição para posterior escolha do método de teste estatístico.

Microarray dados Cross-Normalização.

dados de microarranjos foram cross-normalizada, usando um algoritmo de quantil, a fim de conta para o preconceito que foi incluído devido à experimentação, diferentes plataformas e amostragem diferentes (Figura S2). Normalização de dados multi-plataforma foi previamente descrito [21], [22], [23] com muito boas correlações e consistência entre as plataformas CodeLink e Affymetrix [24], [25].

Criando um Comum lista gene e Grupos BC

a fim de garantir que os resultados de nossa análise foram comparáveis, criamos uma lista gene comum entre todas as plataformas de microarray. Para este efeito, o número de genes NCBI identificação foi usado como uma referência comum. Depois de comparar os genes DE entre todos os conjuntos de dados, apenas aqueles presentes em todas as plataformas foram seleccionados para posterior análise. No total, esta abordagem filtragem produziu um conjunto de genes de 11,837 registros exclusivos, simultaneamente presente em todas as plataformas de microarray. Os conjuntos de dados foram utilizados como amostras individuais, bem como em grupos de tumor. A distribuição dos grupos é apresentada na Tabela S1.

Microarray Estatística Os dados para a plataforma CodeLink eo Microarray conjuntos de dados publicamente disponíveis

No que diz respeito à plataforma CodeLink, a nossa abordagem consistiu na seguinte metodologia. Cada gene foi testado quanto à sua importância na expressão diferencial usando um teste-z. Os genes foram considerados significativamente expresso diferencialmente se obtido um valor de p 0,05. As comparações foram feitas entre ambas as experiências, bem como dentro de experimentos. manipulação conjunto foi então usada a fim de descobrir novos subconjuntos que se caracterizam, se possível, todas as amostras de tumor. . Para mais análises foram utilizados os genes que foram diferencialmente expressos entre amostras tumorais

Em relação à comparação entre os genes de todos os conjuntos de dados de microarrays disponíveis, foi utilizada a seguinte metodologia:

Em primeiro lugar, procurou para as diferenças, comparando todas as amostras de controlo (considerados como um grupo), contra todas as amostras de tumor (considerado como um outro grupo), utilizando um teste t de duas amostras de duas caudas. Uma vez que estes grupos continha amostras que variaram em etnia e grau do tumor, que controlava toda viés, comparando-os como grupos unificadas.

Em segundo lugar, separou as amostras em grupos (11 grupos no total) (Tabela S1), e cada grupo foi comparado contra todas as amostras de controlo, utilizando um teste t de duas amostras de duas caudas.

em terceiro lugar, nós comparamos as amostras individualmente para genes significativas entre cada experimento, utilizando um teste z de duas caudas, que é referido como “intra-experimental”. Este tipo de comparação tinha uma particularidade. Uma vez que a expressão dos genes foi comparada com a média da expressão de genes dentro da mesma experiência, os genes DE iria significar a diferença de que cada amostra de tecido exposta em comparação com os tecidos normais. Isto significa que os genes comuns entre eles seriam os genes que são comuns ao tecido do tumor.

Foram comparadas amostras individualmente para genes significativas, ou seja, os rácios de genes, entre montagens experimentais, utilizando um teste z de duas caudas, ao qual nos referimos como “inter-experimental”. Em outras palavras, temos procurado por genes que exibiram expressão diferente de uma amostra para a próxima, mas não contra as amostras de controlo. Curiosamente, os genes significativos derivada destes genes incluídos que não eram DE. Em outras palavras, estes genes foram identificados entre aqueles cuja expressão permaneceu a mesma em todas as amostras.

A fim de identificar os genes diferencialmente expressos, foram utilizados dois métodos. Os genes foram considerados significativamente expresso diferencialmente se obtido um valor de p 0,05. As comparações foram feitas entre ambas as experiências, bem como dentro de experimentos. manipulação conjunto foi então usada a fim de descobrir novos subconjuntos que se caracterizam, se possível, todas as amostras de tumor. Para mais análises foram utilizados os genes que foram diferencialmente expressos entre amostras de tumores, com base na necessidade de usar. No caso em que os grupos de amostra foram comparados, a média de cada um dos genes foi feita contra a média de todas as amostras de controlo. No caso das comparações individuais de amostras, os rácios de genes foram calculados contra a média de todas as amostras de controlo.

False Taxa Discovery (FDR)

A taxa de detecção falso foi calculada como descrito anteriormente [26 ], [27], [28].

análise Clustering

a análise de agrupamento foi realizada com o algoritmo k-means. No total, 81 conjuntos de o conjunto de dados completo da plataforma CodeLink e 100 clusters para todos os conjuntos de dados disponíveis, foram formadas e genes DE foram classificados utilizando duas vias (genes contra-amostras)-ligação média de agrupamento hierárquico com distância Euclidiana [29 ]. análise de agrupamento e mapeamento de cromossomas eram, em parte, realizada com Genesis 1.7.2 (Technische Universitaet-Graz, Áustria) através da correlação de Pearson (

r

) e correlação ordem de classificação de Spearman (

ρ

) [30 ], [31], [32].

TFBM Análise

a fim de identificar os fatores de transcrição de condução as mudanças observadas na expressão do gene, nós investigamos o factor de transcrição de ligação motivos (TFBMs) na transcrição Elemento de banco de dados Ouvir System (Telis) (www.telis.ucla.edu) [33]. O banco de dados factor de transcrição TRANSFAC foi utilizado para a identificação de locais de ligação do factor de transcrição de genes [34].

mapeamento de cromossomas

mapeamento do cromossoma parece ser um método promissor para identificar padrões entre os genes. A idéia principal relatado inicialmente por

Cohen et al

. é para mapear genes no regiões cromossómicas e, desta forma, se existem correlações que aparecem através da localização de genes no regiões cromossómicas, uma vez que os genes consecutivos são frequentemente expressas de forma semelhante [30]. Para a análise de mapeamento de cromossomas, foi utilizado o web-ferramenta Gene Ontology Árvore Machine, WebGestalt (Universidade Vanderbilt, Holanda, https://bioinfo.vanderbilt.edu/gotm/) [35] eo Matlab ® (The Mathworks Inc.) ambiente de computação.

Gene Ontology (GO) análise

Gene Ontology (GO) a análise foi realizada inicialmente usando a ferramenta on-line Egon para Gene Ontology (a Universidade norueguesa de Ciência e Tecnologia, Trondheim, Noruega , https://www.genetools.microarray.ntnu.no/egon/), a fim de encontrar símbolos gene em falta [36]. WebGestalt foi usada web-ferramenta (Universidade Vanderbilt, Holanda, https://bioinfo.vanderbilt.edu/gotm/) [35], [37] para as classificações a função do gene. Relações dos genes diferencialmente expressos e os motivos de ligação do factor de transcrição foram investigados usando o banco de dados Pubgene Ontologia (www.pubgene.org). definições e funções dos genes foram baseados no Instituto Nacional de bases de dados de saúde (https://www.ncbi.nlm.nih.gov/sites/entrez/).

números de acesso GEO

array dados foram depositados no Gene Expression Omnibus (National Center for Biotechnology Information) com números de adesão GSM678186 através GSM678385 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE27448).

Results

Immunohistochemistry

Tumor As amostras foram coradas com anticorpos para ErbB2, ciclina D1, p53 e Ki-67. Se presente, a coloração anti-ErbB2 em amostras de tumor é uma coloração da membrana, difusa no urotélio (Figura 1). Todas as amostras de CTP (100%) apresentaram imunocoloração moderada /forte (++, +++), enquanto que nenhuma amostra não mostrou nenhum TCC imunocoloração /fraco (0, +). Limiares para altos índices de rotulagem foram estabelecidos para Ki-67 em ≥10% núcleos de tumor positivo e para p53 em 10 e 20%. Os tumores T1 /2-Grau III exibiu a imunocoloração forte (+++, 70%). T1-classe I /II tumores mostrou fraca coloração para anticorpos anti-Ki-67 (40% e 7,5%, respectivamente), ao passo que os tumores T1 /2-Grau III exibiu a imunocoloração forte (54%). Da mesma forma, os tumores T1-classe I /II mostrou fraca coloração para anticorpos anti-p53 (10% e 35%, respectivamente), ao passo que os tumores T1 /2-Grau III exibiu a imunocoloração forte (53%). Por outro lado, os tumores T1-de grau I /II apresentaram coloração intensa para anti-ciclina D1 (80% e 80%, respectivamente), ao passo que os tumores T1 /2-Grau III apresentaram imunocoloração fraco (31,8%).

por outro lado, os tumores T1-Grade II mostrou coloração intensa de anti-ciclina D1 (80%), enquanto que os tumores T1-grau III exibiu imunomarcação fraco. Representante H E lâminas denotar a histologia do T1-Grade II, T1-Grau III e T2-Grade III tumores

Distribuição CodeLink Plataforma de Dados e Análise

dados de microarranjos foram investigados. para a sua propriedade de distribuição normal. Os dados normalizados seguido de uma distribuição normal, tal como apresentado na Figura S1B e S1C. estatísticas Z-ensaio foram aplicados sobre os dados, tanto em amostras individuais, bem como em grupos de tumor. No caso de grupos de tumores, genes que obtiveram um valor de p 0,05 foram consideradas diferencialmente expressas. Na Figura S3A-C é apresentada a distribuição dos valores de p. FDR foi calculada como relatado anteriormente [27], [28]. FDR foi calculada como sendo de 9,3% para um valor de p 0,05 para tumores do T1-Grau grupo II, 8,6% para o valor de p 0,05 para os tumores do grupo T1-Grau III e 11,03% para o valor de p 0,05 para os tumores do grupo T2 e T3-Grau III (Figura S3D-F). O mesmo procedimento foi seguido para cada amostra individual. Genes foram plotados em box-plots, a fim de examinar as distribuições de expressão em mais detalhes. Box-plots de grupos de tumor, bem como aqueles para amostras individuais estão representados na Figura S4A e Figura S4B, respectivamente

Análise de diferencialmente comum expresso Genes:. Plataforma CodeLink

A fim de identificar genes padrões de expressão em BC urinária, analisou-se ainda mais a nossa dados de microarray de tal modo que foram identificadas padrões comuns de expressão entre as diferentes amostras. Nós focado nossa análise, não só sobre as diferenças entre as amostras de tumor, mas também nas suas semelhanças. Não era de estranhar que existiam tais semelhanças. Intersecções das amostras tumorais individuais revelou 831 genes que foram diferencialmente expressos simultaneamente em todas as amostras de tumor (tanto para cima, ou para baixo-regulada). Destes genes DE, foram identificados 33 genes com expressão aumentada simultânea e 85 genes com simultânea redução da expressão em todas as amostras BC, em comparação com o tecido normal.

Entre os genes regulados positivamente, aqueles que apresentam a mais alta expressão dobra ( média ± DP) foram: proteína hypoxia-inducible 2 (HIG2; NM_013332.1) (2,70 ± 0,54); APC11 anafase promover subunidade complexa 11 (ANAPC11; NM_001002245.1) (2,50 ± 0,60); zo54e12s1 Stratagene pâncreas (# 937208) IMAGE clone de cDNA: 590734 3 ‘semelhante ao TR: G1022718 G1022718 RECEPTOR NUCLEAR CO-repressor (NCOR1; AA156336.1) (2,01 ± 1,13); UI-1 BB1p atp e-01-0—-UIs1 cDNA NCI_CGAP_Pl6 clone UI-1-BB1p-ATP-e-01-0-UI 3 ‘, (BU754189; BU754189.1) (1,89 ± 0,56). Da mesma forma, os genes que apresentaram as menores taxas de expressão vezes (média ± SD) foram: tn52a12.x1 cDNA NCI_CGAP_Kid11 clone IMAGE: 2171998 3 ‘semelhante ao contém PTR5.b2 MER22 elemento repetitivo (AI565993; AI565993.1) (-3,13 ± 0,66 ); cDNA Soares_testis_NHT zx51b02r1 clone IMAGE: 795.723 5 ‘(AA461577; AA461577.1) (-2,75 ± 0,86); lactotransferrina (LTF) (ANKRD29; NM_173505.2) (-2,28 ± 1,17); HUMNK566 clone de ADNc humano de queratinócitos da epiderme 566 (ODZ2; D29453.1) (-2,15 ± 1,02); necrose tumoral superfamília do receptor do factor, membro 17 (TNFRSF17) (TNFRSF17; NM_001192.2) (-2,07 ± 0,73); e no músculo esquelético LIM-proteína mRNA FHL1 (FHL1; U60115.1). (-2,06 ± 0,87)

Em relação aos três grupos de tumores (T1-Grade II, T1-grau III e T2 /T3-Grade III ), a análise não mostrou um subconjunto de genes comuns a todos os grupos. Por conseguinte, foram investigados os genes comuns DE entre pares de grupos tumorais (Tabelas S2, S3, S4). genes DE comuns a todos os indivíduos, independentemente do grupo de tumor, foram ainda agrupados usando agrupamento hierárquico com a distância euclidiana. Grupos de genes comuns em diversas combinações são apresentados na Tabela S5

agrupamento hierárquico com Euclidiana Distância:.. Plataforma CodeLink

Foi realizada nos dois sentidos-ligação média de agrupamento hierárquico com distância Euclidiana para ~57 k genes. Uma vista pormenorizada do conjunto dendrograma amostra é apresentado na Figura 2. Nós particionado os tumores em dois grupos principais e vários subgrupos com base na expressão diferencial do seu genoma. O primeiro ramo continha um tumor T1-Grade II eo outro continha tumores T1-3-Grade II /III, que foram posteriormente agrupadas em subgrupos adicionais

K-means clustering:. Plataforma CodeLink.

K-means clustering algoritmo é uma outra maneira de classificar os dados a fim de encontrar padrões de expressão. Nossa análise foi organizada da seguinte forma:

k-médias de todos os genes e de todas as amostras. O resultado de K-means agrupamento de todos os genes e todas as amostras é apresentada na Figura 3A. Nós agrupados os dados em 49 grupos, juntamente com os seus centroides (Figura 3B). Para cada grupo de clusters houve vários genes que caracterizaram o cluster ou seja caracterizada a amostra que os genes pertencia.

k-médias de genes comuns De em todas as amostras. Os genes comuns DE entre todas as amostras foram promoveu cluster (Figura 4A e 4B).

k-médias de grupos tumorais. Para concluir a análise com base em k-means clustering os grupos de tumor foram analisados ​​como definido acima. Os resultados são apresentados na Figura 5A e 5B para agrupar e centroides, respectivamente. Clusters de grupos tumorais revelou tanto as diferenças, bem como semelhanças entre os diferentes grupos. Por exemplo, certas categorias de genes revelou constitutiva infra-regulação em um grupo tumor vs. o grupo de maior fase /série, enquanto outras categorias de genes exibiu constitutiva up-regulação entre os grupos correspondentes (clusters de 11, 24, 27, 30, 33, 41, 46). Ao mesmo tempo, vários clusters incluídos genes que permaneceram inalteradas entre os grupos de tumor (clusters 21, 26, 35, 37, 45, 47, 48).

K-significa agrupamento deu alguns padrões distintos entre as amostras , como em grupos 1, 3, 4, 5, etc.

Clusters (a) e centroids (B) são apresentados, onde pode ser feita qualquer distinção clara entre amostras individuais.

Análise de componentes Principais (PCA):. CodeLink Plataforma

PCA de todos os genes em todas as amostras. A análise PCA de nossos dados foi ainda realizada, a fim de procurar outros padrões potenciais entre os genes. A primeira análise foi realizada com genes que foram geralmente dé entre todas as amostras. componentes principais calculadas foram representados graficamente contra o outro em diagramas de dispersão, tal como apresentado na Figura 6. A análise dos genes APC foi realizada a fim de encontrar novos padrões nos dados de expressão. Para executar a presente análise com todos os genes e em todas as amostras, o passo inicial era traçar gráficos de dispersão de todas as combinações dos componentes principais (Figura 6A, B). Os genes que se manifesta vários padrões como observado nas áreas circulado na Figura 6B. Em seguida, as amostras foram analisadas para a percentagem de variância que atribuíram aos componentes principais (Figura 6C, D). Finalmente, um biplot foi construído de forma a examinar classificação das amostras em relação ao total de expressão de gene (Figura 6E). Conforme apresentado nas áreas circulado na Figura 6E, as amostras foram agrupados em duas categorias principais: Amostras 22A (T2 /T3-Grade III), 27A (T1-Grade III) e 29A (T2 /T3-Grau III), por um lado, e o resto das amostras foram agrupadas. A fim de resolver ainda mais as diferenças com base na análise PCA comparamos a expressão do gene da seguinte forma.

PCA de genes comuns De em todas as amostras. análise de APC dos genes comuns DE é apresentada na Figura 7. O agrupamento das amostras com base em componentes principais mostrou diferentes classificações. Amostras do tumor 2A, 3A e 4A foram agrupadas distintamente como por os primeiros três componentes principais (Figura 7E). Estas três amostras foram agrupados quando o conjunto de dados completo foi considerada. Resolver este resultado com os genes comuns DE mostrou uma diferença entre os grupos tumorais. De modo semelhante, vários grupos diferentes foram obtidos por análise de APC dos genes DE comum entre todas as amostras, tais como entre as amostras de tumor 22A, 10A, as amostras 2A, 4A, 16A que formaram um separada grupo e amostras 3A, 17A, 26A, 27A, 29A que formou um outro (Figura 7F). Da mesma forma, plotagem da 3A componentes agrupados amostras e 16A, bem como amostras 2A, 4A e 10A em um grupo separado.

PCA dos grupos tumorais.

Deixe uma resposta