PLOS ONE: identificação de genes do piloto Câncer druggable amplificados através TCGA conjuntos de dados

Abstract

O Cancer Genome Atlas (TCGA) projectos têm avançado nossa compreensão das mutações motorista, origens genéticas, e as vias principais activada em todos os tipos de câncer. Análise de conjuntos de dados TCGA, na sua maioria incidiu sobre mutações somáticas e translocações, com menos ênfase na amplificações de genes. Aqui nós descrevemos uma estratégia de triagem de bioinformática para identificar genes motorista câncer putativos amplificados através de conjuntos de dados TCGA. Foram realizadas análises de conjuntos de dados GISTIC2 TCGA abrangendo 14 subtipos de câncer e identificou 461 genes que foram amplificados em dois ou mais conjuntos de dados. A lista foi reduzida para 73 genes associados ao câncer com potenciais propriedades “druggable”. A maioria dos genes foram localizados a 14 amplicões espalhados por todo o genoma. Para identificar genes potenciais motorista câncer, analisamos número de cópias do gene e expressão de mRNA de dados a partir de amostras de pacientes individuais e identificados 40 genes motorista câncer putativos ligados a diversos processos oncogênicos. actividade oncogénica foi ainda validado pelo siRNA /knockdown shRNA e referenciando os conjuntos de dados Projeto de Aquiles. Os genes amplificados representado um certo número de famílias de genes, incluindo reguladores epigenética, genes associados do ciclo celular, resposta a danos no ADN /genes de reparação, reguladores do metabolismo, e os genes ligados ao Wnt, Notch, ouriço, JAK /STAT, NF-KB e MAPK vias de sinalização. Entre os 40 genes motorista putativos eram conhecidos genes motorista, tais como

EGFR

,

ERBB2

e

PIK3CA

. Do tipo selvagem

KRAS

foi amplificado em vários tipos de cancro, e

KRAS

linhas celulares de cancro -amplified foram mais sensíveis à

KRAS

shRNA, sugerindo que

KRAS

amplificação foi um evento oncogénico independente. Um certo número de adaptadores de MAP-cinase foram co-amplificadas com as suas tirosina-quinases receptoras, tais como o adaptador de FGFR

FRS2

e o adaptador família EGFR

GRB7

. A ubiquitina ligase-como

DCUN1D1

eo metiltransferase histona

NSD3

também foram identificados como novos genes motorista câncer putativos. Discutimos as implicações paciente alfaiataria para alvos de drogas câncer existente e vamos continuar a discutir possíveis oportunidades novas para os esforços de descoberta de drogas

Citation:. Chen Y, McGee J, Chen X, Doman TN, Gong X, Zhang Y, et ai. (2014) Identificação de genes do piloto Cancer druggable amplificados através TCGA conjuntos de dados. PLoS ONE 9 (5): e98293. doi: 10.1371 /journal.pone.0098293

editor: Masaru Katoh, National Cancer Center, Japão

Recebido: 06 de março de 2014; Aceito: 30 de abril de 2014; Publicado em: 29 de maio de 2014

Direitos de autor: © 2014 Chen et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi financiado pela Eli Lilly and Company. O financiador forneceu apoio sob a forma de salários para todos os autores, mas não tinha nenhum papel adicional no desenho do estudo, recolha e análise de dados, decisão de publicar ou preparação do manuscrito. Os papéis específicos destes autores são articuladas na seção autor contribuições

Conflito de interesses:. Este estudo foi financiado integralmente pela Eli Lilly and Company, o empregador de todos os autores. Não há patentes, produtos em desenvolvimento ou produtos comercializados a declarar. Isto não altera a adesão dos autores para todas as políticas de PLoS One sobre os dados e materiais de compartilhamento, como detalhado em linha no guia para os autores.

Introdução

Os recentes avanços na tecnologia de sequenciamento de DNA têm permitido o sequenciamento de genomas do câncer integrais e identificação de genes comumente mutados, amplificados, e excluídas em todos os tipos de câncer. O (TCGA) esforço Cancer Genome Atlas foi criado para sequenciar e analisar vários milhares de cânceres individuais, dando um instantâneo de origens genéticas de doenças específicas e motoristas de câncer [1] – [6]. análise integrada de conjuntos de dados TCGA identificados 127 genes associados ao câncer significativamente mutantes que representam vias biológicas distintas e processos celulares [6]. O número médio de mutações do controlador por amostra do tumor foi 2-6, o que sugere que um pequeno número de genes mutados do controlador poderia induzir a carcinogénese [6]. Em cânceres de mama, apenas três genes (

GATA3

,

PIK3CA

, e

TP53

) foram encontrados para ser mutado em 10% de incidência em todos os tumores de pacientes. Uma análise posterior revelou mutações motorista genético específico da via em subtipos de câncer de mama, tais como

BRCA1 /2

alterações e

PIK3CA

alterações nos cancros da mama basal-like e luminais, respectivamente [4]. No cancro colorectal, vinte e quatro genes foram geralmente mutada e a maioria dos genes mapeados para o Wnt, TGF-b, PI3K, p53 RAS e vias de sinalização [3]. Em cancros do pulmão, onze genes eram comumente mutado, incluindo

TP53

, genes de resposta ao estresse oxidativo e genes diferenciação escamosa [1]. Estes estudos lançar luz sobre os principais factores genéticos dos subtipos de câncer e também identificaram potencialmente vias druggable ligadas a estes subtipos. Os avanços vai acelerar o desenvolvimento de medicamentos através da oferta de novas estratégias de adaptação de pacientes para os inibidores específicos da via. No entanto, os estudos TCGA, na sua maioria incidiu sobre mutações e translocações raros, com menos atenção colocada em amplificações genéticas em cânceres. Desde a amplificação do gene é um importante mecanismo de carcinogênese, procuramos explorar os conjuntos de dados TCGA para identificar novos alvos e motoristas amplificados em todos os tipos de câncer.

A amplificação do gene em células cancerosas fornece um meio para superexpressão de genes motorista promotoras do câncer , como

EGFR

e

ERBB2

nos cromossomos 7 e 17, respectivamente. A amplificação do gene ocorre somaticamente numa região restrita do genoma do cancro através de vários mecanismos, tais como ciclos de quebra-Fusion-Bridges [7]. Estas regiões amplificadas, conhecidos como produtos de amplificação, pode abranger kilobases a dezenas de megabases e pode incluir vários genes oncogênicos, assim como genes de passageiros nas regiões amplificadas [8]. O comprimento dos fragmentos amplificados podem variar substancialmente com base no locus de tipo genómico e cancro. Por exemplo, a amplificação do gene único de

KIT

no cromossomo 4 pode ocorrer em tumores testiculares [9], ainda amplicons maiores contendo

KIT

,

PDGFRA

, e

Causadas

são amplificados no glioblastoma [10]. Porque amplicões frequentemente contêm vários genes, incluindo genes passageiros não relacionados com a oncogénese, é muitas vezes difícil identificar o gene (s) condutor cancro responsável pela amplificação. Estratégias para identificar os genes do cancro de condução incluem um amplicão mapear a região mínima de amplificação (MRA) através de muitas amostras de tumor, a identificação de correlação positiva entre o número de cópias e a expressão de ARNm de genes, e validação experimental com ARNsi /shRNA knockdown em células. Tais análises até à data genes amplificados identificados com um papel demonstrado na carcinogênese [7]. No entanto, a maioria das análises até à data têm contado com pequenos tamanhos de amostras, que resultam em grandes ARM e potenciais genes falsos positivos. Os conjuntos de dados TCGA oferecer uma colecção única de amostras de tumor com grandes tamanhos de amostra para identificar genes motorista câncer amplificados em tipos de câncer distintas.

Aqui nós descrevemos uma estratégia de triagem de bioinformática para identificar genes de driver de câncer potencialmente druggable amplificados através de conjuntos de dados TCGA. Utilizou-se análise de conjuntos de dados GISTIC2 TCGA (portal CBio) e identificaram 461 genes que foram estatisticamente amplificados em dois ou mais conjuntos de dados TCGA composto por 14 tipos de câncer. Genes com funções putativas ou verificados em câncer foram identificados usando genes do câncer de banco de dados CBio. Nós atribuída uma pontuação druggability para cada gene através da integração de dados de quatro índices druggability externas. Dos 461 genes, foram identificados 73 genes amplificados potencialmente druggable com um papel conhecido ou putativa na carcinogênese. Em seguida, usamos análise de correlação com o número de cópias e os dados de expressão de mRNA de vários milhares de amostras de pacientes TCGA para identificar genes potenciais motorista câncer entre a lista. Isto resultou na identificação de 40 genes do controlador de cancro putativo ligado a diversos processos oncogénicos, incluindo reguladores epigenética, genes associados do ciclo celular, resposta a danos no ADN /genes de reparação, reguladores do metabolismo, e os genes ligados ao Wnt, Notch, ouriço, JAK /STAT, NF-KB e vias de sinalização MAPK. A actividade do condutor câncer putativo foi ainda validado, acessando a atividade hairpin shRNA em linhas celulares de cancro que utilizam o banco de dados do Projeto de Aquiles [11]. validação adicional foi realizada num subconjunto de genes utilizando siRNA /shRNA knockdown em linhas celulares de cancro contendo a amplificação do gene de interesse. Entre os 40 genes motorista putativos foram conhecidos genes motorista, tais como

EGFR

e

ERBB2

, bem como novos alvos, tais como

DCUN1D1

e

NSD3

.

KRAS

, um motorista de câncer proeminente com mutação ativadora conhecido no câncer [12], foi encontrada a ser amplificado em um subgrupo de cânceres de ovário, gástrico, pulmão e útero. Discutem-se as implicações para os esforços de descoberta de drogas e identificar estratégias paciente de adaptação da novela para alvos terapêuticos existentes.

Materiais e Métodos

Bioinformatics análise

conjuntos de dados TCGA de 14 subtipos de câncer foram analisada para a amplificação do gene utilizando o algoritmo GISTIC2 no portal CBio (https://www.cbioportal.org). Os 14 subtipos de câncer incluem BLCA – urotelial de bexiga Carcinoma, BRCA – Breast carcinoma invasivo, CRC – Câncer Colorretal (COAD e ler estudos combinados), GBM – Glioblastoma multiforme, HNSC – Cabeça e carcinoma de células escamosas Neck, KIRC – células claras renal rim carcinoma, LGG – Cérebro de grau inferior glioma, LUAD – adenocarcinoma pulmonar, LUSC – carcinoma do pulmão de células escamosas, OV – cystadenocarcinoma seroso do ovário, o PRAD – próstata adenocarcinoma, SKCM – pele melanoma cutâneo, STAD – adenocarcinoma de estômago, e UCEC – uterina Corpus endometrioid carcinoma . Os genes que foram amplificados em dois ou mais estudos TCGA foram agrupados em conjunto para fazer uma lista de 461 genes. Nível 3 SNP6 e os dados de RNA-Seq versão 2 foram recuperados a partir do site TCGA e 3 SNP6 dados de nível foram ainda mapeado para nível gene usando CNTools pacote R. Os coeficientes de correlação de Pearson para o número de cópias do gene (SNP6) versus a expressão gênica (RNA-Seq) foram calculados para genes de interesse utilizando a função cor () em R. O código de análise de dados em R e GAWK pode ser fornecido mediante solicitação. Cada gene foi atribuída uma pontuação druggability com base em dados dos bancos de dados externos ENSEMBL, InterPro-explosão, BioLT-drugbank e lista Qiagen Druggability. Para cada banco de dados, um gene foi atribuída uma pontuação 0-4 druggability, sendo 0 undruggable e 4 sendo um alvo de drogas estabelecido. Um gene com uma pontuação de “1” druggability em qualquer uma das quatro bases de dados foi considerado “potencialmente druggable” e incluído na lista de genes final. A lista gene também foi carregado para o banco de dados genes do cancro (portal CBio) e genes ligados a oncogênese foram incluídos na lista gene final.

Projeto Achilles

O banco de dados do Projeto Achilles consiste de esgotamento shRNA contagens de uma biblioteca genómica reunidas testado através de um painel de linhas celulares de cancro [11]. Foi desenvolvido um método para marcar a dependência do gene em cada linha celular mediante a ponderação de cada gancho de cabelo de acordo com o grau de compatibilidade com outros grampos concebidos contra o mesmo gene, de um modo semelhante ao descrito por Shao et. al [13]. Nós argumentou que, se linhagens de células tumorais variaram em sua dependência de um gene motorista particular, em seguida, hairpins visando efetivamente esse gene deve dar resultados semelhantes exaustão shRNA nas linhas dependentes. Calculou-se correlações entre pares de pontuação de depleção entre o painel para todos os grampos do grupo de construções shRNA concebidos para direccionar um determinado gene. Em seguida, cada shRNA foi ponderado pelo número de outros shRNAs do conjunto de genes que foram altamente correlacionadas a ele (Spearman coeficiente de correlação é maior do que 0,35 com um valor de p 0,01). A pontuação composta de nível gene (pontuação shRNA) foi então obtido pela soma ponderada das pontuações de depleção shRNA. Esses perfis de dependência de genes foram usadas para calcular a pontuação de razão de verossimilhança para a associação de mutação genética ou do número de cópias com sensibilidade shRNA, comparando o modelo de mutação genética a um “modelo nulo” (sem qualquer mutação genética).

Células

As células foram obtidas da American Type Culture Collection (ATCC) e foram cultivadas em meio de Eagle modificado por Dulbecco (DMEM) meio suplementado com 10% de soro fetal de bovino. Amplificado e linhas de células não amplificados foram escolhidos para cada gene de cancro amplificado de interesse. Para cada gene de cancro amplificado, as linhas de células utilizadas para estudos de validação e os seus números de cópias do gene correspondente são como se segue: (1)

NSD3

: H1581 (7 cópias), H1703 (6 cópias), SW48 (5 cópias ), SW837 (não amplificado); (2)

DCUN1D1

: KYSE (6 cópias), T47D (4 cópias), SW48 (não amplificado), HCT15 (não amplificado). Os valores do número de cópias foram obtidos a partir de conjuntos de dados LECC publicados [14].

Gene knockdown

Para gene genes knockdown, usamos shRNA partículas de transdução lentiviral adquiridos de Sigma (Mission, SHCLNV).

DCUN1D1

construções shRNA foram TRCN0000133666, TRCN0000134440, TRCN0000134715, TRCN0000136858 e TRCN0000137482. Para

NSD3

estudos knockdown, usamos On-Targetplus SmartPool siRNA segmentação Nsd3 humana (Thermo Scientific). As células foram infectadas com partículas shRNA lentivirais a multiplicidade de infecção (MOI) variando 5-10 na presença de 10 ug /ml de polibreno. siRNA /shRNA experiências foram realizadas de acordo com protocolos estabelecidos [15].

ensaios baseados em células

Os anticorpos usados ​​para a análise de Western Blot incluem coelho anti-DCUN1D1 (Sigma, HPA035911), anti-coelho WHSC1L1 (Proteintech, 11.345-1-AP). Western blot foi realizada de acordo com protocolos convencionais. Os ensaios de proliferação celular e apoptose foram realizadas com o Cell Titer Glo e caspase ensaios Glo (Promega) de acordo com as instruções do fabricante. análise do ciclo celular foi realizada com coloração com iodeto de propídio de linhas celulares de cancro utilizando protocolos convencionais [15].

Resultados

Identificação de amplificações de genes em TCGA conjuntos de dados

conjuntos de dados TCGA compreendendo 14 tipos de câncer foram analisados ​​com o algoritmo GISTIC2 (portal CBio) para identificar amplificações de genes em amostras de tumores de pacientes. Os genes foram marcados para probabilidade estatística de amplificação, e estes genes mostrando amplificação em dois ou mais conjuntos de dados foram identificados (Figura 1). Um total de 461 genes foram identificados como genes potencialmente amplificados (Tabela S1). Em alguns casos, vários genes (por exemplo,

CD274

e

NDUFC2

) foram amplificados em dois ou mais conjuntos de dados que se originou a partir de um único subtipo de cancro (Figura 1, Tabela S1). A lista gene foi ainda mais limitado, identificando o subconjunto de genes com funções estabelecidas ou putativos na oncogênese, bem como genes que eram potencialmente druggable. Em primeiro lugar, a lista de genes foi cruzada com o banco de dados de genes do cancro (portal CBio), que mostrou que menos de 25% dos 461 genes foram ligados à oncogénese. Em seguida, os genes foram atribuídos uma pontuação druggability com base nos índices druggability de quatro bancos de dados externos (ENSEMBL, InterPro-explosão, BioLT-drugbank e lista Qiagen Druggability). Para cada banco de dados, um gene foi atribuída uma pontuação 0-4 druggability, sendo 0 undruggable e 4 sendo um alvo de drogas estabelecido. Um gene com uma pontuação de “1” druggability em qualquer uma das quatro bases de dados foi considerado “potencialmente druggable” e incluído na lista de genes final. A partir da análise, foram identificados um total de 73 cancerosas amplificados genes potencialmente druggable entre os conjuntos de dados TCGA (Figura 1).

conjuntos de dados TCGA foram minadas para amplificação do gene (análise GISTIC2, portal CBio) e 461 amplificações de genes foram identificados . A lista foi reduzida para 73 genes genes relacionados com o cancro que eram potencialmente “druggable” com base em bancos de dados druggability externas. A partir dos 73 genes, 40 genes motorista câncer putativa foram identificados com base em número de cópias versus análise de expressão de mRNA dos dados TCGA.

Os genes amplificados 73 cancerosas foram localizados em todo o genoma e a maioria dos genes agrupados em loci doença (Figura 2). Dos 73 genes, 57 genes agrupados em 14 loci em todo o genoma e os restantes 18 genes eram amplificações focais. Dentro de um conjunto, os genes tendiam a ser amplificado em tipos de cancro semelhantes. Por exemplo, um cluster cromossomo 20q compreendendo quatro genes (

PTK6

,

SRMS

,

RTEL1

, e

PRPF6

) foram todos amplificado em uterina /endometrial cancro e adenocarcinomas do pulmão. Um cluster cromossomo 1q continha 12 genes, tais como

SETDB1

,

BCL9

,

PIAS3

, e

MCL1

, e 11 dos 12 genes foram amplificados em cancros pulmonares escamosas e cancros da bexiga (Figura 2). Um conjunto bem estudado no cromossoma 4q contendo

PDGFRA

,

KIT

, e

KDR

foi amplificado em glioma e melanomas [10]. Devido ao rigor utilizado na análise Gistic2, que provavelmente subestimado os tipos de cancro em que um gene de amplificação ocorreu. Por isso, é provável que os 73 genes do câncer que identificamos foram amplificados em tipos adicionais do cancro não representados aqui (Figura 2).

A partir da lista inicial de 461 genes amplificados em um ou mais conjuntos de dados TCGA, 73 genes amplificados foram identificado com propriedades potencialmente “druggable”, bem como estabelecidos papéis /putativos na oncogênese. Genes /amplicons são organizados por localização cromossômica, com a sua localização genômica marcada como mostrado (Mb = Megabase). Caixas coloridas indicam os tipos de câncer com designações TCGA, como segue: BLCA – urotelial de bexiga Carcinoma, BRCA – Breast carcinoma invasivo, CRC – Câncer Colorretal (COAD e LER estudos combinados), GBM – Glioblastoma multiforme, HNSC – Head and Neck carcinoma de células escamosas , KIRC – carcinoma de células claras do rim renal, LGG – Cérebro de grau inferior glioma, LUAD – adenocarcinoma pulmonar, LUSC – carcinoma de células escamosas do pulmão, OV – ovário cystadenocarcinoma serosa, PRAD – próstata adenocarcinoma, SKCM – pele melanoma cutâneo, STAD – estômago adenocarcinoma, UCEC – uterina Corpus endometrioid Carcinoma

Entre os 73 genes do cancro amplificados foram um número de alvos de medicamentos estabelecidos, tais como

EGFR

,

ERBB2 Comprar e

KIT

(Figura 2).

ERBB2

no cromossomo 17 foi amplificado em 5 tipos de câncer e foi co-amplificado com o adaptador MAP quinase

GRB7

e

PPP1R1B

.

EGFR

no cromossomo 7 foi amplificado como um único gene em 7 tipos de câncer, validando a importância deste alvo da droga no cancro [16]. A lista também incluiu uma série de metas atualmente em desenvolvimento clínico em todo o setor, como

CDK6

,

PIK3CA

,

PIK3C2B

e

NOTCH2

.

CDK6

no cromossomo 7q foi amplificado como um único gene no câncer escamoso de pulmão e glioblastoma, enquanto

PIK3CA

residia em um cluster cromossomo 3q com 6 outros genes e foi amplificado em vários tipos de câncer (Figura 2) [17]. Vários câncer amplificados genes previamente validadas, tais como

FAK

/

pTK2

, não foram identificados na análise, em parte devido ao elevado rigor que foi aplicado à análise bioinformática para reduzir acessos falsos positivos [18].

Identificação de genes de câncer amplificados com a actividade do condutor câncer putativo

uma vez que alguns dos genes identificados como genes de câncer amplificado pode ser genes de passageiros nos amplicons, analisamos ainda mais o conjunto de genes para identificar genes putativos do controlador de cancro. Isso foi feito por meio do cálculo do coeficiente de correlação de Pearson entre número de cópias eo valor expressão de mRNA a partir de dados de tumor do paciente TCGA. Os coeficientes de correlação foram calculados para cada um dos 14 tipos de câncer e as correlações médias em todos os tipos de câncer foram calculados (Figuras 3-4). A análise revelou uma vasta gama de número de cópias de mRNA contra correlações de expressão para os genes. genes motorista câncer putativos eram esperados para mostrar o número de cópias alto contra mRNA correlação expressão. motoristas câncer validado, como o

ERRBB2

,

EGFR

, e

KRAS

demonstrado elevado número de cópias contra correlação expressão de mRNA nos tipos de câncer correspondentes que regulam (

ERBB2

r = 0,9 no cancro da mama,

EGFR

r = 0,8 em adenocarcinoma de pulmão,

KRAS

r = 0,9 no cancro do ovário) (Figura 3-4).

Os coeficientes de correlação de Pearson foram calculadas através da análise do número de cópias do gene e expressão de mRNA a partir de amostras individuais derivadas de pacientes em conjuntos de dados TCGA. São mostrados os coeficientes de correlação para cada subtipo de câncer de TCGA ea correlação média em todos os tipos de câncer (vermelho denota alta correlação, azul denota baixa correlação). Abreviações de conjuntos de dados TCGA estão listados na Figura 1.

Os coeficientes de correlação de Pearson foram calculadas através da análise do número de cópias do gene e expressão de mRNA a partir de amostras individuais derivadas de pacientes em conjuntos de dados TCGA. São mostrados os coeficientes de correlação para cada subtipo de câncer de TCGA ea correlação média em todos os tipos de câncer (vermelho denota alta correlação, azul denota baixa correlação). Abreviações de conjuntos de dados TCGA estão listados na Figura 1.

O número de cópias versus análise de expressão revelou os genes motorista potenciais que foram amplificados nos agrupamentos de genes. Por exemplo, o cluster cromossomo 1q com 12 genes amplificados continha 4 genes com número de cópias vs. correlação expressão superior a 0,5 (

SETDB1

,

ARNT

,

APH1A

e

CHD1L

), sugerindo que estes podem ser os genes do controlador no fragmento amplificado (Figura 3). Entre os 12 genes,

SETDB1

apresentou a maior correlação geral, de acordo com relatórios recentes que

SETDB1

é um gene amplificado cancro com actividade demonstrada motorista [19], [20]. Os outros três genes também podem desempenhar papéis potencialmente significativas na carcinogênese –

APH1A

é uma subunidade complexo gama secretase na via Notch,

ARNT

é uma subunidade do complexo HIF1, e

CHD1L

é uma helicase de ADN em via de resposta a danos no ADN [21]. Quatro genes do amplicon exibido número de cópia contra correlação expressão inferior a 0,3 (

PDE4DIP

,

S100A11

,

S100A9

, e

S100A8

) (Figura 3). A 3 de cluster cromossomo com 7 genes independentes 2 genes com número de cópia contra correlação expressão superior a 0,5 (

DCUN1D1

e

PRKCI

) e 4 genes com número de cópia contra a expressão inferior a 0,3 (

TERC

,

SKIL

,

GNB4

, e

SOX2

).

PRKCI

é uma serina /treonina quinase na via de NF-KB e dados tissue microarray anteriores validaram este gene como um potencial gene de novo condutor cancro [22].

DCUN1D1

é uma ubiquitina ligase subunidade complexo E3 com potencial actividade do condutor câncer, que ainda validado com shRNA knockdown (abaixo). Enquanto

PIK3CA

exibido um coeficiente de correlação geral 0,4, é apresentado alta correlação no cancro da mama (r = 0,9), câncer de cabeça e pescoço escamoso (r = 0,8), e uterinas /câncer de endométrio (r = 0,7) ( Figura 3).

O cluster cromossomo 11q continha 5 genes, incluindo

CCND1

, um regulador do ciclo celular bem estabelecida e motorista oncogênico. Enquanto

CCND1

exibido elevado número de cópias contra correlações expressão no câncer de fígado (r = 1,0), cancro da bexiga (r = 0,8), câncer epidermóide de pulmão (r = 0,7), cabeça e pescoço Caner (r = 0,7) e cancro da mama (r = 0,7), as correlações foram menores em outros tipos de cancro, sugerindo que

CCND1

amplificação é um condutor oncogénica específica da doença (Figura 3). Dois outros genes do amplicon,

FADD

, e

PPFIA1

, apresentaram maior correlação geral entre os tipos de câncer, implicando estes genes como potenciais motoristas romance câncer para uma investigação mais aprofundada.

FADD

, uma molécula efectora apoptótica, foi previamente identificado como um gene motorista câncer de romance em um painel de cancros da laringe 167 /faringe, garantindo uma investigação mais aprofundada em seu mecanismo de oncogênese [23]. É importante notar que a correlação da expressão de mRNA para o número de cópias não é essencial, em princípio, para que um gene seja um gene controlador do cancro. Portanto, genes com baixa expressão de mRNA versus o número de cópia de correlação não são necessariamente genes de passageiros. Por exemplo, o agrupamento de cromossoma 1q continha

MCL1

, um gene com uma assinatura do controlador do cancro baseado em Projecto de Aquiles (dados não mostrados), mas com uma expressão de ARNm de correlação média versus número de cópias de 0,31.

Para identificar os genes do cancro amplificados com maior actividade global motorista câncer, que classificou os genes em ordem de maior número de cópias contra correlação expressão de mRNA em todos os tipos de câncer. Foram identificados 40 genes com r global superior a 0,3 (Tabela 1). A r = 0,3 cutoff foi usado porque vários genes demonstrou alta r em um pequeno número de tipos de câncer. Por exemplo,

FGFR3

exibido r 0,7 em quatro tipos de câncer (câncer de bexiga, glioblastoma, escamosas de pulmão e melanoma), mas r 0,5 em outros tipos de câncer. Da mesma forma,

CDK6

demonstrado r 0,7 em apenas 4 tipos de câncer (glioblastoma, cabeça e pescoço, adenocarcinoma de pulmão e câncer escamoso de pulmão), enquanto

IGF1R

teve r 0,7 em apenas um câncer ( cancro da mama) (Figura 3-4). Entre os 40 genes com maior actividade do condutor câncer, os dois principais genes mais bem classificados foram

NSD3

/

WHSC1L1

e

SETDB1

, dois importantes metiltransferases histonas (Tabela 1) . Enquanto

SETDB1

foi recentemente estabelecida como um driver de boa-fé amplificado câncer em melanoma e câncer de pulmão [19], [20], o papel da

NSD3

/

WHSC1L1

tem não foram bem caracterizados e por isso, ainda mais o seu papel validado oncogénica in vitro (em baixo). Dois outros reguladores de cromatina, o leitor cromatina Brd4 e acetiltransferase histona

YEATS4

, foram também altamente classificados como genes motorista câncer putativos. Outras famílias de genes que foram representados na lista incluem genes da via Notch (

NOTCH2

,

APH1A

), genes reguladores metabólicos (

NDUFC2

,

PRKAB2

), genes da via Hedgehog (

DCUN1D1

), genes via Wnt (

BCL9

), genes da via NF-kB (

ERC1

,

PRKCI

,

IKBKB

), genes JAK /STAT (

PIAS3

), MAPK efetores sinalização (

KRAS

,

FRS2

,

GRB7

), receptores tirosina-quinase (

FGFR3

,

EGFR

,

ERBB2

,

IGF1R

), DNA danos resposta /genes de reparação (

RAD51AP1

,

RTEL1

,

ERCC5

,

RAD52

,

CHD1L

), genes associados a p53 (

MDM2

,

MDM4

,

GTPBP4

), e os genes reguladores do ciclo celular (

CCNE1

,

TPX2

,

CCND3

,

CDK6

) (Tabela 1).

as faixas de número de cópias dos genes de câncer amplificados foram analisados ​​em tumores de pacientes TCGA individuais para determinar a extensão da amplificação do gene (Fig. S1, S2) . Alguns genes exibido amplificação nível elevado correspondente a 10-20 cópias do gene, enquanto que outros genes exibida baixo nível de 3-8 número de cópias amplificações. O amplicon cromossomo 1q, que continha

PRKAB2

,

APH1A

,

ARNT

, e

SETDB1

, apresentaram amplificação de baixo nível (3-10 cópias) , enquanto o amplicon cromossomo 12q, que continha

MDM2

,

YEATS4

, e

FRS2

, apresentaram amplificação de alto nível (10-20 cópias) (Fig. S1, S2 ). Outros genes com amplificações de alto nível incluem

PRKAB2

(6-10 cópias em câncer de ovário),

MDM4

(10-30 cópias em glioblastoma),

MDM2

(10- 15 cópias em adenocarcinoma de pulmão),

PIK3CA

(5-20 cópias em câncer escamoso de pulmão),

DCUN1D1

(5-15 cópias em câncer escamoso de pulmão),

FADD

e

PPFIA1

(cada um com 5-10 cópias em câncer de cabeça e pescoço),

NDUFC2

(5-15 cópias em câncer de ovário), e

RAP1B

(5- 15 cópias em adenocarcinoma de pulmão). MAP-quinase genes associados também apresentaram amplificação de alto nível, com receptores tirosina-quinase

ERBB2

,

IGF1R

, e

EGFR

todos altamente amplificada, como esperado. As proteínas adaptadoras MAP quinase

FRS2

e

GRB7

também foram altamente amplificado (10-20 cópias em adenocarcinoma de pulmão e câncer de mama, respectivamente). reguladores do ciclo celular, tais como

CCNE1

(10-20 cópias em câncer de ovário), foram também altamente amplificada, como esperado. Além de copiar faixas de número, a frequência de amplificação do gene em tumores de pacientes foi calculada usando cópia número 4 como ponto de corte para a amplificação (Fig. S4). Um número significativo de genes foram amplificados em mais do que 30 por cento dos doentes com cancro, incluindo

DCUN1D1

(43% dos cancros do pulmão escamosas),

FADD

e

PPFIA1

(~ 30% dos cânceres de cabeça e pescoço), e

PRKCI

(36% dos cancros do pulmão escamosas) (Fig. S4). Enquanto amplificação foi a mudança genômica primário para esses genes, uma série de genes também carregava mutações somáticas, tais como

PIK3CA

,

KRAS Comprar e

NOTCH2

. Nestes casos, as amplificações e mutações foram em grande parte mutuamente exclusivos (Fig. S4).

Actividade do condutor

via MAPK genes amplificados

Os 73 genes do cancro amplificados foram analisados ​​pela validação shRNA para verificar o cancro . Projeto de Aquiles é um grande esforço para catalogar vulnerabilidades genéticas em linhas celulares de cancro usando uma biblioteca de shRNA de todo o genoma para identificar genes que afetam o câncer de sobrevivência /proliferação celular [11]. Nós extraído da base de dados de Aquiles para determinar qual dos genes amplificados 73 cancerosas podem desempenhar um papel na célula cancerosa sobrevivência /proliferação. A biblioteca de Aquiles é composta de vários grampos shRNA e calculada uma pontuação shRNA síntese com base nos efeitos de múltiplos grampos shRNA Lentivirus em linhas celulares de cancro infectados. Genes que demonstram uma baixa pontuação de shRNA em linhas de células infectadas são consideradas importantes para a sobrevivência de células cancerosas e pode representar motoristas câncer putativos. As pontuações shRNA só são válidos quando vários grampos shRNA consistentemente demonstrar a inibição de células de câncer (denominado “grande correlação”). O banco de dados de Aquiles foi consultado com os 73 genes e esses genes com “grande correlação” atividade shRNA foram identificados e suas pontuações shRNA foram calculados através de várias centenas de linhas celulares de cancro (Fig. S3). Vários genes tinham pontuações shRNA negativos na maior parte das linhas celulares de cancro e presumivelmente eram críticos para a sobrevivência de células de cancro /proliferação. Estes genes incluídos

KRAS

,

PRKAB2

,

GRB7

,

BRD4

,

PRPF6

,

BCL9

,

PPFIA1

e

NOTCH2

. Outros genes apresentaram escores shRNA negativos em um subconjunto de linhas celulares de cancro, tais como

CCND1

,

NDUFC2

,

YEATS4

,

GTPBP4

e

CHD1L

(Fig. S3).

Deixe uma resposta