PLOS ONE: Epidemiologia da Doublet /Multipleto mutações em cancros do pulmão: A prova de que um subconjunto Surge por Chronocoordinate Eventos

Abstract

Fundo

A evidência sugere fortemente que as mutações espontâneas doublet em tecidos de camundongos normais geralmente surgem a partir de eventos chronocoordinate. Estas mutações chronocoordinate vezes refletem “chuveiros de mutação”, que são múltiplas mutações chronocoordinate abrangendo muitas quilobases. No entanto, pouco se sabe sobre a mutagénese de gibão e mutações multipleto (domuplets) no câncer humano. O cancro do pulmão é responsável por cerca de 25% de todas as mortes por câncer. Aqui, analisamos a epidemiologia da domuplets no

EGFR

e

TP53

genes no câncer de pulmão. O

gene EGFR

é um oncogene em que dupletos são geralmente de condutor, do controlador de mutações, enquanto que o

gene TP53

é um gene supressor de tumor com uma situação mais típica em que dupletos derivar a partir de um condutor e mutação de passageiros.

Metodologia /Principais achados

EGFR

mutações identificadas por sequenciação foram coletados de 66 artigos publicados e nosso atualizados

EGFR

banco de dados de mutação (www .egfr.org).

TP53

mutações foram coletados a partir da versão IARC 12 (www-p53.iarc.fr). Para

EGFR

e

TP53

dobletes, há diferenças claramente significativas na raça, foram observados etnia, sexo e tabagismo. Parelhas no

EGFR

e

TP53

genes no câncer de pulmão humano são elevados sobre oito e três vezes, respectivamente, em relação ao dobletes espontâneas em rato (6% e 2,3% versus 0,7% ).

Conclusões /Significado

Embora ninguém característica é definitiva, as propriedades agregadas de gibão e mutações multipleto no câncer de pulmão são consistentes com um subconjunto derivada de eventos chronocoordinate no

EGFR

gene: i) os oito dobletes frameshift (presente em 0,5% dos pacientes com

EGFR

mutações) estão agrupados e produzir um líquido-frame mudança; ii) cerca de 32% de dobletes são muito espaçados (≤30 nt); e iii) multipletos conter duas ou mais espaçadas mutações.

TP53

mutações no câncer de pulmão são muito espaçados (≤30 nt) em 33% dos doublets, e multipletos geralmente contêm dois ou mais mutações muito espaçados. Trabalho em sistemas modelo é necessário para confirmar o significado dos acontecimentos chronocoordinate no pulmão e outros cancros

Citation:. Chen Z, Feng J, Buzin CH, Sommer SS (2008) Epidemiologia da Doublet /Multipleto Mutações em cancros do pulmão : a prova de que um subconjunto Surge por Chronocoordinate Eventos. PLoS ONE 3 (11): e3714. doi: 10.1371 /journal.pone.0003714

editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos da América

Recebido: 04 de agosto de 2008; Aceito: 10 de outubro de 2008; Publicação: 13 de novembro de 2008

Direitos de autor: © 2008 Sommer et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Instituição.

Conflito de interesses:. Os autores declararam que não existem interesses conflitantes

Introdução

O cancro é uma heterogênea, multi-passo, doença genética complexa que resulta de mutações acumuladas. Cancros em geral foram consideradas para surgir pela acumulação de cerca de 5-7 mutações causais [1], [2]. Recentemente, no entanto, Vogelstein e outros mostraram em cancros da mama e colo-rectal que os tumores individuais acumulam -90 genes mutados somaticamente [3]. Contudo, um número muito menor (estimada em -11) são susceptíveis de ser envolvido na tumorigénese em qualquer determinado tumor. O acúmulo de tantas mutações contributivo é difícil de explicar apenas pela frequência de múltiplos eventos de mutação independentes. A acumulação de mutações em determinados cancros pode reflectir um fenótipo mutante com mutações aleatórias globalmente [4] – [6]. selecção sequencial oferece outra explicação [7], [8]. Uma mutação faz com que o excesso de replicação, dando origem a um clone, que a sobre-replica devido a uma segunda mutação, etc. Recentemente a existência de chuveiros de mutação foram relatados, levantando a possibilidade de “cancro num instante” se ocorrer chuveiros mutação dispersos . chuveiros de mutação foi encontrada após análise de mutações no gibão intragênicos revelou que eles foram agrupados e chronocoordinate [9].

Nós demonstramos que a maioria dos doublets na

gene EGFR

ter um diferente padrão de mutação em relação para singletos e consistem em mais do controlador do controlador de mutações, devido a mutações sequenciais ou chronocoordinate, putativamente seguido por selecção funcional de duas mutações, individualmente sub-óptimas [10]. Além disso, adquiriu segundo mutações (por exemplo T790M) em quatro

EGFR

dobletes foram relatados após o tratamento com gefitinib e erlotinib e associada a resistência aos medicamentos e recidiva da doença [11], [12]. Em contraste, a maioria

TP53

e

lacl

dobletes mostrar mutações condutoras mais passageiros em cancros do pulmão e no tecido normal Big Blue rato, respectivamente. No entanto, os mecanismos e epidemiologia subjacentes mutagênese de dobletes e múltiplas mutações não são claras.

Para elucidar a frequência de dobletes eo padrão de mutação distinta e espectro na

gene EGFR

, a epidemiologia do gibão mutações no cancro do pulmão é analisado e comparado com o de parelhas no

gene TP53

. Aqui, nós achamos que o tabagismo status, raça, etnia, sexo e idade não são fatores de risco para a ocorrência de gibão no

EGFR

e

TP53

genes. A frequência relativa de dupletos é mais elevada no cancro do pulmão humano do que no tecido normal de rato. A existência de pares OMIDI (ver Terminologia e abreviações em Materiais e Métodos) em

EGFR

, a alta frequência de alelos contra dobletes composto heterozigotos, a alta frequência de dobletes espaçados, e o agrupamento em multipletos são consistentes com mutações chronocoordinate que contribuem para, pelo menos, um subconjunto do

EGFR

e

TP53

gibão e mutações multipleto encontrados no cancro do pulmão humano.

resultados

Epidemiologia doublet mutações no EGFR e genes TP53 no câncer de pulmão

a análise por status, gênero e etnia fumar não revelam uma diferença significativa na frequência gibão no

EGFR

gene (Tabela 1, Tabela S1). A idade média dos pacientes com interiores e dobletes é semelhante (61,4 ± 11,3

vs

65,8 ± 10,3).

Os resultados para o

gene TP53

no pulmão câncer são similares com uma exceção. A frequência de

TP53

dupletos é significativamente maior do que em asiáticos em caucasianos (3,2%

vs 1.8%, P = 0,03) (Tabela 1, Tabela S2), mas isso não é significativo quando corrigido para comparações múltiplas (seis teste exato de Fisher realizados para o

EGFR

e

genes TP53

). são necessários para avaliar esse ponto de dados adicionais.

No geral, 98/1627 (6,0%) de mutações EGFR e 54/2387 (2,3%) de mutações no gene TP53 em cancros do pulmão humanos são dobletes, uma frequência muito maior do que que a observada no

gene lacl

em camundongos Big Blue (8 vezes e 3 vezes, respectivamente) (Tabela 2).

Doublets tendem a se aglomerar na EGFR e TP53 genes no câncer de pulmão: a “meia-vida de espaçamento mutação” é de 9 pb e 15 pb, respectivamente

espontânea

lacl

dobletes (0,7% de mutações total) estão agrupados com um espaçamento apropriado uma distribuição exponencial e mostram um padrão de mutação semelhante a singuletos, indicando um evento chronocoordinate [13], [14]. Com base no espaçamento dupleto entre duas mutações,

EGFR

dupletos podem ser divididos em dois grupos: o grupo proximal ( 100 pb, o espaçamento médio de 22,8 ± 24,4 pb) e o grupo distai ( 809 pb , espaçamento médio de 12,3 ± 5,1 kb) (Tabela S1). Análogo ao

lacl

dobletes, um subconjunto [40% (39/98)] de

EGFR

dobletes ocorridos no mesmo exão com espaçamento proximal mostra um exponencial (R

2 = 0,9979 ) em vez de uma distribuição quase uniforme (Figura S1). Metade dos dobletes têm mutações separadas por 9 bp ou menos (a “meia-vida de espaçamento mutação”; ver Terminologia em Materiais e Métodos).

A distribuição espaçamento para

TP53

dobletes no pulmão cancro que ocorre na mesma exão (43%, 23/54) mostra também o espaçamento proximal ( 86 pb, média 20,2 ± 20,9 pb) e adapta-se a uma distribuição exponencial (R

2 = 0,979) (Tabela S2, Figura S1) com uma meia-vida de espaçamento mutação de 15 pb. Doublets ocorrendo em diferentes exons têm espaçamento distal (131-4504 pb, média 1317,9 ± 1000 pb) separados por um intrão. Um espaçamento semelhante para que no cancro do pulmão foi encontrado para

TP53

dupletos dentro do mesmo exão em cancros da mama e colo-rectal, com uma meia-vida de espaçamento mutação de 24 e 16 pb, respectivamente (Tabelas S4 e S5) .

Assim, cerca de um terço da

EGFR

e

TP53

dobletes são altamente cluster (≤ 30 pb) e todos os dobletes que ocorrem dentro de um único exão ter uma inter- espaçamento mutação que é distribuído exponencialmente ao invés da distribuição da quase-uniforme esperado, consistente com eventos chronocoordinate em

lacl

no tecido normal do mouse.

os pares OMIDI são uma forte evidência de mutações chronocoordinate cluster

A grande maioria dos germlime humana espontânea ou MIDIs somáticas do rato são OMIDIs (

CORRECÇÃO

, a Big Blue); De fato, cerca de metade são eliminações base individuais [15] – [18]. Em contraste, há uma muito baixa fração de OMIDIs (0,26%, 4/1526) e mutações nonsense (0,13%, 2/1526) em

EGFR

interiores, consistente com uma forte seleção de mutações que alteram, em vez de apagar, função. Oito dos 98 (6%)

EGFR

dobletes conter um par de mutações frameshift (pares OMIDI; ver siglas em Materiais e Métodos). Todos os oito dos pares OMIDI estão estreitamente espaçadas (Tabela 3, Figura S2), com o resultado líquido a ser uma mutação na estrutura. Dada uma mutação OMIDI, uma segunda mutação aleatória a 3 ‘do primeiro (ou IMIDI ou OMIDI) irá restaurar o quadro de leitura de apenas 1/3 do tempo, e uma sub-fracção deste terceiro é ainda truncando a proteína porque uma mutação sem sentido ocorre antes para a segunda mutação. No total, 0,49% do relatado

EGFR

mutações (8/1627) estão agrupados pares OMIDI sem mutação truncamento que ocorre antes da segunda OMIDI. Estes oito pares OMIDI Espera-se que reside no mesmo alelo; Caso contrário, compostos dobletes OMIDI heterozigotos levará a dois truncamentos alélicas, eliminando toda a

função do gene EGFR

. Entretanto, ambas as OMIDIs agrupados também deve ocorrer em rápida sucessão (mutações chronocoordinate) dentro do mesmo ciclo celular, porque a frequência de mutações secundárias que ocorrem aleatoriamente em uma célula em proliferação deficiente resultante de um único OMIDI é rara. Os 14 eliminações restantes (em exons), 9 indels e 3 dobletes estão todos em-frame (IMIDI) mutações (Tabela 2; Tabela S1).

As mutações no único par OMIDI relatado na

gene TP53 Quais são 2309 bp de intervalo, em diferentes exons (Tabela S2, ID # 14373), e, ao contrário dos pares OMIDI no

EGFR

gene, não juntos restaurar o quadro de leitura.

multipletos EGFR são consistentes com uma camisola e uma segunda mutação chronocoordinate altamente agrupado

Quatro trigêmeos e um quádruplo no

EGFR

foram encontrados com uma frequência de 0,3% (5 /1627) de cancros do pulmão com mutações antes do tratamento com inibidor de tirosina cinase (TKI) (Tabela 4). É de interesse que os pares de mutações em cada um dos trigêmeos e três mutações dentro do quádruplo são bem agrupado com espaçamento proximal (3-60 pb), semelhante ao parelhas no

lacl

em tecidos normais do mouse. A terceira mutação está localizada no exão um diferente espaçamento com distai. Os dados são consistentes com a seleção sequencial de duas mutações em que uma das mutações é um gibão chronocoordinate ou triplete.

TP53

multipletos (6 trigêmeos e um quádruplo) também são responsáveis ​​por 0,3% ( 7/2387) de mutações no total (Tabela S3). Cinco multipletos (71%, 5/7) residem no mesmo exão ou dois exons, consistentes com uma mutação e um gibão chronocoordinate. Sete multipletos tinham mutações separadas por regiões de espaçamento 15. Destes, seis foram altamente cluster (≤30 nt) e nove eram menos de 100 nucleótidos ou menos. Oitenta por cento (16/20) das múltiplas mutações no cancro da mama e 76% (25/33) em câncer colorretal também residem em um ou dois exons (Tabelas S6, S7).

Uma comparação entre pares OMIDI e gibão espaçados e mutações multipleto no

EGFR

e

TP53

genes é mostrada na Tabela 5. a frequência de pares OMIDI no

gene EGFR

é de aproximadamente 10 vezes maior do que no

TP53

gene (e um par OMIDI no

gene TP53

não resulta em uma rede de mutação em-frame), refletindo a seleção mais frequente de mutações que altera, em vez de apagar, a função da proteína EGFR. A frequência de mutações espaçados em doublets e multipletos em ambos os genes é semelhante

Todos os dobletes EGFR caracterizados são alélicas:. Um subconjunto significativo de mutações chronocoordinate fornece uma explicação alternativa

No rosto valor, o alelismo dados sugerem que as mutações motorista /motorista em

EGFR

precisam estar na mesma molécula [10]. No entanto, a existência de um subconjunto significativo de mutações chronocoordinate fornece uma explicação alternativa. Dezasseis heterozigótico

EGFR

dupletos de três ensaios diferentes foram analisados ​​por clonagem ou amplificação específica do alelo (Tabela S1) [10], [19], [20]. A sequenciação subsequente dos produtos revelou que todos estes alelos foram tipo quer duplamente mutado ou selvagem, indicando que, em cada caso, ambas as mutações estavam localizadas no mesmo alelo. Se os pares doublet resultar de eventos independentes, metade pode ser esperado ser heterozigotos compostos. A observação de 100% alelismo (16/16) contra heterozigotos compostos de zero (p = 0,002) pode reflectir que, funcionalmente, as mutações motorista /motorista são obrigados a estar na mesma molécula de, mesmo que os dímeros forma de proteínas de EGFR [10] . No entanto, também são consistentes com 50% de eventos chronocoordinate, putativamente durante a replicação cadeia ou reparação de remendo e 50% de mutações sequenciais independentes, sem a exigência de que ambas as mutações estar na mesma molécula de dados (8 de 8 mutações alélicas observado quando 4 de 8 são espera aleatoriamente;.. p≤0.08)

Infelizmente, a nosso conhecimento, análise de alelos não foi realizada em

TP53

dobletes heterozigotos

Discussão

apresentamos a primeira análise da epidemiologia da dobletes no câncer de pulmão. tabagismo, raça, etnia, sexo e idade não são fatores de risco para a ocorrência de gibão no câncer de pulmão. A alta frequência de dobletes em cluster, a distribuição exponencial de espaçamento, a ocorrência de pares OMIDI agrupados em-frame, a natureza alélicas de dupletos, eo agrupamento de multipletos em

EGFR

e

TP53

são consistentes com uma significativa minoria de mutações chronocoordinate no cancro humano. No entanto, existem advertências para cada uma das observações acima (ver abaixo).

Nós demonstramos que dobletes são mais frequentes no

EGFR

e

TP53

genes no câncer humano do que em mutações somáticas espontâneas em tecido normal do mouse. Dentro das limitações de tamanho da amostra, a frequência gibão não dependem, obviamente, tabagismo, sexo, etnia ou idade. O

gene TP53

está mutado em cerca de metade de todos os tumores e pode ser utilizado como um “teste de agente mutagénico”, isto é, as frequências relativas dos diferentes tipos de mutação pode ser usado como uma ferramenta para explorar a epidemiológica contribuição de agentes mutagénicos exógenos vs. processos endógenos em cancros da mama [21], [22]. Nossa hipótese é que as taxas de mutação mais elevada esperados em fumantes que mais frequentemente produzem mutações gibão. No entanto, não há diferença significativa entre fumantes e não-fumantes, de acordo com dobletes e multipletos decorrentes de processos endógenos.

Os dados são consistentes com mutações chronocoordinate (com ressalvas)

Vários aspectos da dados são consistentes com um subconjunto de

EGFR

e

TP53

dobletes decorrentes de eventos choronocoordinate ao invés de hipermutabilidade (espaçamento distribuídos aleatoriamente) ou seleção sequencial. Sobre 32-35% dos dobletes encontrados no

TP53

(35%, 19/54) e

EGFR

(32%, 31/98) genes são ou pares OMIDI ou altamente agrupado dupletos separados por ≤30 nt. No entanto, há ressalvas para cada inferência de que deve ser excluída em trabalhos futuros.

O valor principal da presente análise é gerar dados que constrangem nossas hipóteses e, por Occam

s navalha, gerar uma hipótese simples (o subconjunto de eventos chronocoordinate) consistente com vários dados.

(1) os pares de OMIDI são a melhor evidência de mutações chronocoordinate. Para a maioria dos genes, a maioria dos MIDIs espontâneas são OMIDIs, mas no

EGFR

gene, OMIDIs são raros, consistente com a selecção total para função alterada em vez de falta de função. É notável que a oito

EGFR

dupletos contendo pares OMIDI Todas as mutações foram espaçados que resultam em uma mutação líquida em grelha, produzindo assim uma proteína de EGFR com potencialmente alterados, em vez de ausente, função. No entanto, foi demonstrada nenhuma evidência experimental de uma proteína contendo uma destas mutações doublet. A explicação mais razoável para esta ocorrência é através de mutações chronocoordinate que são selecionados em conjunto para a função proteína alterada. Uma explicação alternativa é que os pares OMIDI poderia de alguma forma ser sequencial, embora mutações aleatórias dentro de alguns nucleotídeos no genoma deve ser extremamente improvável.

(2) A frequência relativamente elevada de mutações doublet em cluster no

EGFR

gene é consistente com mutações chronocoordinate. A distribuição exponencial do espaçamento entre as duas mutações em

EGFR

e

TP53

dupletos nas mesmas exões (R

= 2 0,98). É altamente improvável por acaso

a simulação foi feita anteriormente para cada um dos

TP53

exons 5-9 para testar a hipótese nula de que as mutações no

TP53

dobletes são eventos independentes e que a distribuição do o espaçamento entre as duas mutações depende apenas do espectro de mutações no

gene TP53

e o tamanho do alvo mutação [13]. A primeira mutação de cada dupleto simulada foi aleatoriamente com base na distribuição de mutações observadas singleto numa dada exão. Usando a distribuição camisola do banco de dados TP53 IARC (release 8) é responsável por viés que pode resultar de hot spots espaçados. A segunda mutação no dupleto foi aleatoriamente com base numa distribuição uniforme ao longo da sequência de codificação para o gene TP53 exão que, uma vez que é provável que seja uma mutação (passageiro) “carona”, em vez de uma mutação driver para o tumor.

o espaçamento mutação nos dobletes simuladas foi comparado com 402 real

TP53

parelhas no banco de dados da IARC de todos os tipos de câncer. Os resultados demonstraram que duas mutações dentro dupletos não são eventos independentes por comparação estatística das distribuições observadas e esperadas, e indicou que mais dupletos ocorreu com um espaçamento mutação de menos de 30 nucleótidos do que o esperado por acaso (P = 0,03, 0,02, 0,0006, e 0,01 para os exões 5-8). Estes resultados são consistentes com a ocorrência de mutações na chronocoordinate humano

TP53

gene. Uma explicação alternativa para o agrupamento de dobletes é que eles podem representar algumas limitações funcionais ainda desvalorizado.

(3) A natureza alélicas de dobletes é consistente com mutações chronocoordinate. Entre 98 pares doublet relatados na literatura, apenas alguns foram analisados ​​para determinar se eles estão presentes nos mesmos ou diferentes alelos. Entre 16 pares doublet testados por clonagem ou amplificação específica de alelo, todos os 16 pares foram encontrado para estar presente no mesmo alelo. No entanto, para os pares doublet restantes, em que a clonagem ou alelo-específico de amplificação não foi realizada, a possibilidade de que as mutações estavam presentes em diferentes alelos não pode ser descartada.

(4) A freqüência relativamente alta de multipletos com dois ou mais cluster mutações e uma mutação adicional em um local distal também argumenta para um evento mutacional chronocoordinate além de um evento mutacional único independente. Mais uma vez, uma explicação alternativa poderia envolver limitações funcionais sobre as mutações em cluster.

Em conjunto, estes dados são consistentes com uma contribuição de mutações chronocoordinate cluster de câncer humano. Um excesso de dupletos ou multipletos com um subconjunto de distribuição agrupado ocorre mais frequentemente do que o previsto, por acaso, uma vasta gama de organismos, incluindo riboviruses, vírus de ADN, células procarióticas, de levedura, e linhas de células eucarióticas e tecidos [23], [24].

motorista suporte de dados acrescido TP53 passageiros dobletes no câncer de pulmão

Cerca de 22% da segunda mutações nos dobletes são esperados para ficar em silêncio se eles são “passageiros” mutações, ao invés de “driver” mutações [25].

TP53

dobletes, há cinco silencioso e duas alterações de nucleótidos intr�icas (13%, 7/54), não significativamente diferente das alterações de nucleótidos silenciosa 23,5% esperados para ocorrer com mutações de passageiros aleatórios (p = 0,46 ) [26], [27]. mudanças de nucleotídeos silenciosos (18%, 22/04) dentro

TP53

multipletos também estão perto de 23,5%. Juntos, estes dados implicam que

TP53

dupletos multipletos e consistem de um padrão de condutor, passageiros mutação, em contraste com o padrão condutor /motorista encontrada em

EGFR

dupletos [10].

mutações Doublet estão associados com chuveiros de mutação no rato [9]. O advento do sequenciamento paralelo em massa podem facilitar a análise de um número suficiente de amostras para definir qualquer doublets e, em seguida, determinar se estes doublets estão associados com chuveiros de mutação no cancro. As mutações de agrupamento não aleatórias nos chuveiros mutação deve fornecer dados mais definitivos para a ocorrência de mutações em cancros humanos chronocoordinate. A contribuição dos chuveiros mutação ao câncer continua a ser determinado.

Materiais e Métodos

Terminologia e abreviaturas

Mutation espectro.

As frequências relativas de mutações em locais específicos.

Mutation padrão.

As frequências relativas de diferentes tipos de mutações, por exemplo, transições C para T vs. T para transições C.

Singlet.

a única mutação identificada dentro de um gene [13].

mutação Tandem-base (TBM).

uma mutação que resulta em mudanças de base nos nucleótidos adjacentes [28], [29].

Doublet.

Duas mutações identificadas dentro de um gene incluindo uma mistura de TBM e não-TBM mutações.

Multipleto.

Três ou mais mutações identificadas dentro de um gene, com excepção da situação em que todas as mutações estão adjacentes. Multipletos podem incluir uma mistura de TBM e não-TBM mutações.

Domuplets.

Um mutante que seja um gibão ou um multipleto. Aproximadamente 1% dos

lacl

placas mutantes são domuplets [9]

MIDI

Microinsertion, exclusão ou INDEL..; uma inserção, eliminação ou INDEL que resulta em um ganho ou uma perda de 1 a 50 nucleotídeos [10].

IMIDI.

No quadro MIDI

OMIDI.

out-of-frame MIDI

meia-vida do espaçamento mutação.

a partir do ajuste exponencial aos dados, o intervalo de espaçamento mutação correspondente ao intervalo abrangendo metade do restante mutações no interior da amostra. Isto é análogo à semi-vida de um radioisótopo.

Chronocoordinate mutação.

mutações múltiplas que ocorrem dentro do mesmo ciclo celular e em rápida sucessão, tipicamente dentro de segundos a minutos, [13].

chuveiro mutação.

Chronocoordinate mutações múltiplas que abrangem vários quilobases [9].

mutação silenciosa.

Uma mutação neutra que não muda a estrutura da proteína, incluindo sinónimas codificam alterações região. É reconhecido que tipos de mutações pontuais sobrepõem, por exemplo, uma mutação silenciosa pode activar um local de junção crípticos ou podem inactivar o local normal de splicing se interrompe a sequência de dador de splicing consenso [30]. Na prática, foram encontrados muito poucos tais sobreposições.

amostras e análise mutacional

A fim de investigar o mecanismo e as características dos doublets e multipletos,

EGFR

mutações identificadas por sequenciação foram coletadas de 66 artigos publicados e nosso atualizados

EGFR

banco de dados de mutação [10], [31] (www.egfr.org).

TP53

mutações foram coletadas de IARC versão 12 (www-p53.iarc.fr) e excluídos mutações na fibrose pulmonar e no câncer de pulmão em pacientes expostos a emissões esfumaçados carvão, radônio, gás mostarda, amianto, metais pesados e radiação da bomba atômica (raios y). Também foram excluídos dois artigos em que múltiplas mutações compreendidas 50% do total de mutações, provavelmente devido a artefactos de PCR, uma vez que múltiplas mutações geralmente constituem apenas ~ 3% das mutações totais.

TP53

mutações no câncer de mama e colorretal, também foram recuperados e foi analisada a distribuição espaçamento de dupletos /multipletos.

Análise Estatística

padrões de mutação e outras distribuições de contagem categóricas foram testadas para diferenças significativas pelo teste exato de Fisher ou não ordenada R × tabelas C contingência utilizando o teste “Fisher-Freeman-Halton” implementado pelo pacote de software de análise estatística StatXact (Cytel software Corporation, Cambridge, MA).

Apoiando informações

Figura S1.

Um subconjunto de dobletes mostra espaçamento proximal e se encaixa a distribuição exponencial nos genes EGFR e p53 no cancro do pulmão. O painel A mostra a separação (em pares de bases) entre as duas mutações de EGFR em dupletos proximais (n = 37). As distâncias de separação foram divididos em três grupos, com espaçamentos de 1-41 pb, 42-82 bp, e 83-123 pb, e plotados no ponto médio de cada grupo (20, 60 e 100, respectivamente). A separação é definido aqui como o número de nucleótidos entre, mas não incluindo, as duas mutações em um dupleto. Para MIDIs, a separação é definida como o número de nucleótidos entre, mas não incluindo, o início do primeiro e segundo MIDIs. O painel B mostra o espaçamento (em pares de bases) entre as duas mutações na p53 dupletos proximais (n = 23). As distâncias de separação foram divididos em três grupos, com espaçamentos de 1-31 pb, 32-62 bp e 63-93 bp, e plotados no ponto médio de cada grupo (15, 30 e 45, respectivamente).

doi: 10.1371 /journal.pone.0003714.s001

(0,62 MB PPT)

Figura S2.

Doublets no gene EGFR que formam OMIDI pares O tipo (em peso) de sequência de EGFR selvagem no exão 19 dos nucleótidos 2227 a 2280 é mostrado. Os oito pares OMIDI no câncer de pulmão são diagramado para mostrar as exclusões (em magenta), inserções (em verde) e uma região que é duplicado (em amarelo). Note-se que dois dos dupletos consistem de duas deleções cada um, cinco dupletos consistem de uma eliminação mais uma indel, e um dupleto tem uma duplicação (de inserção), mais um indel. Em cada caso, o quadro de leitura é restaurado (ver exclusão líquido)

doi:. 10.1371 /journal.pone.0003714.s002

(0,03 MB DOC)

Tabela S1.

quadro suplementar 1

Deixe uma resposta