PLoS ONE: A linhagem germinativa variantes no cromossomo 4q31.1 Associates na suscetibilidade ao desenvolvimento de cancro do cólon Metastasis

Abstract

Nós testamos para germinal variantes mostrando associação com a metástase do cancro do cólon usando um estudo de associação do genoma que, em comparação Ashkenazi indivíduos judeus com estágio IV cancros metastáticos do cólon contra aqueles com estágio I ou II cancros do cólon não-metastático. Em um projeto de estudo de dois estágios, demonstramos associação significativa para o desenvolvimento de doença metastática para rs60745952, que, em Ashkenazi descoberta e validação de coortes, respectivamente, mostraram uma razão de chances (OR) = 2,3 (P = 2.73E-06) e OR = 1,89 (P = 8.05E-04) (superior a validação limiar de 0,0044). associação significativa para o cancro do cólon metastático foi ainda confirmada por uma meta-análise de rs60745952 nestes conjuntos de dados mais uma coorte de validação Ashkenazi adicional (OR = 1,92; IC 95%: 1,28-2,87), e por um teste de permutação, que demonstrou um haplótipo significativamente mais longo circundante rs60745952 nas amostras estágio IV. rs60745952, localizado em uma região intergénica no cromossomo 4q31.1, e não anteriormente associado com o câncer, é, assim, um marcador genético da linha germinal para a susceptibilidade ao desenvolvimento de metástases de câncer de cólon entre os judeus Ashkenazi

Citation:. Markowitz SD, Nock NL, Schmit SL, Stadler ZK, Joseph V, Zhang L, et al. (2016) A linhagem germinativa variantes no cromossomo 4q31.1 Associates na suscetibilidade ao desenvolvimento de cancro do cólon metástase. PLoS ONE 11 (1): e0146435. doi: 10.1371 /journal.pone.0146435

editor: Ajay Goel, Baylor University Medical Center, United States |

Recebido: 04 de fevereiro de 2015; Aceito: 03 de abril de 2015; Publicação: 11 de janeiro de 2016

Direitos de autor: © 2016 Markowitz et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Data Availability:. Todos relevante dados estão disponíveis a partir do NCBI (número de acesso: PRJNA306392).

Financiamento: Este trabalho foi financiado pelo National Institutes of Health concede R01 CA144040 (SDM), CA150964 P50 (SDM), CA043703 P30, S19 CA148107 (SBG ), P30 CA014089 (SBG), K07 CA129162 (NLN), T32 ES013678 (SLS), R01 CA160356 (PS e SDM) e R01CA136726 (LL); e, pela Horvitz Fundação Leonard e Joan (SDM), o Richard Horvitz e Erica Hartman-Horvitz Foundation (SDM), a Fundação Anton B. Burg na USC Norris, o Fundo Sharon Levine Corzine Pesquisa e, o Robert e Kate Niehaus Clinical Iniciativa genética MSKCC. Este trabalho foi financiado em parte pelo Instituto Nacional do Câncer, dos Institutos Nacionais de Saúde, sob RFA # CA-09-002. O conteúdo deste manuscrito não refletem necessariamente a posição nem as políticas do National Cancer Institute ou qualquer um dos centros colaboradores do consórcio corect, nem a menção de nomes comerciais, produtos comerciais ou organizações implica o endosso pelo Governo ou dos Estados Unidos da consórcio corect

Conflito de interesses:.. os autores declararam que não existem interesses conflitantes

Introdução

o câncer colorretal é o terceiro câncer mais comum ea segunda principal causa de câncer de morte nos Estados Unidos, com 136,830 novos casos diagnosticados anualmente e 50,310 mortes [1]. Em todo o mundo, o cancro colorectal é o terceiro câncer mais comumente diagnosticado em homens, e em segundo nas mulheres, com 746.000 casos e 614.000 casos, respectivamente [2].

Em quase todos os casos, morte por câncer colorretal é causada pelo desenvolvimento de metástases cancerosas para órgãos distantes, na maior parte geralmente o fígado [3]. Em estudos anteriores, temos mostrado que todas as mutações somáticas presentes em metástases hepáticas de câncer de cólon já estavam presentes nas primárias combinado antecedente de câncer de cólon tumores, isto é, novas mutações genéticas não são obrigados a iniciar as metástases do cancro do cólon [4].

neste estudo, foi examinado um modelo genético alternativa para o desenvolvimento de metástases do cancro do cólon, um que testa se variações genéticas na linha germinal humana pode conferir uma susceptibilidade individual para a disseminação metastática do cancro do cólon. Para testar este modelo, realizou uma Genoma Grande Associação de Estudo (GWAS), envolvendo a avaliação de polimorfismos de nucleotídeo único germinativas (SNPs) em pacientes com ascendência judaica Ashkenazi com estágio IV cancro do cólon metastático em comparação com aqueles com cancros estágios I e II do cólon que fizeram não metastatizam. Nós selecionamos a população judaica Ashkenazi para este estudo porque alelos fundadores, que são altamente detectável por GWAS, já estão bem precedentes para várias outras doenças nesta população [5,6]. Utilizando os dados da nossa coorte descoberta, foi desenvolvida uma análise de poder preliminar que nos permitiu pré-especificar um número limitado de SNPs cujo exame em uma coorte de validação daria para replicação com razoável poder ao nível de significância de 5%. Os SNPs principais identificados no conjunto de dados descoberta foram então avaliados em outra população de pacientes com câncer colorretal de Ashkenazi ascendência judaica (validação conjunto de dados # 1). Com base nos resultados da descoberta e validação de conjuntos de dados, o topo SNP de interesse foi posteriormente avaliada num terceiro população colorectal paciente com câncer de Ashkenazi ascendência judaica (validação dataset 2 #), e uma análise combinada (meta-análise) deste top SNP foi concluído, utilizando os resultados dos três conjuntos de dados judeus Ashkenazi. Como um teste adicional ainda, foi encontrado o comprimento do haplótipo em torno deste SNP a ser significativamente mais longo entre a metastático contra os cancros do cólon não metastático.

Resultados

descrições detalhadas da descoberta e coortes de validação são fornecidos em métodos abaixo. Em média, os pacientes na população do estudo descoberta foram 71 anos de idade, que era semelhante à média de idade de 72 e 65 nos conjuntos de dados de validação # 1 e # 2, respectivamente (Tabela 1). A população descoberta composta por 52% de homens e 48% mulheres e distribuições de gênero em conjuntos de dados de validação foram semelhantes. As distribuições de estágio IV e estágio I e II casos também foram semelhantes entre os três conjuntos de dados (Tabela 1).

Como mostrado na Tabela 2 e Figura 1, a associação mais significativa observada quando se compara estágio IV para a fase I /II, os doentes com cancro do cólon na descoberta GWAS era para rs2024846 no cromossomo 6 (OR = 2,62; IC 95%: 1,76-3,92; p = 1,2×10

-6). A próxima associação mais significativa observada foi com dois SNPs (rs72737810, rs60745952) em 4q31.1 cromossomo (OR = 2,83; IC 95%: 1,81-4,44; p = 2.73×10

-6), que são separados por 5kb e estão em forte desequilíbrio de ligação (ver Figura 2). Estes dois SNPs estão localizados numa região intergénica distante a partir do gene mais próximo,

NR3C2

, por 380KB (Figura 2). Embora a significância estatística para a associação para esses SNPs top não excedam níveis de significância do genoma padrão, um exame visual da trama QQ dos p-valores observados em comparação com a distribuição esperada sugerem que o top SNPs eram pena avaliar ainda mais (S1 Arquivo) , motivando-nos a avançar com um estudo de replicação projetado para examinar 20 SNPs superiores (Tabela 2) que foram pré-selecionados pelo poder para replicação como descrito nos métodos abaixo.

o eixo vertical indica o (-log

10 transformada) observado P-valor e o eixo horizontal indica a posição cromossómica de cada SNP. Seta indica a posição do rs60745952 e rs72737810, que não são individualmente discerníveis a esta escala de apresentação.

O eixo horizontal mostra SNPs ao longo região cromossómica e os shows de eixo vertical esquerdo (-log

10 transformado) observaram P-valor. SNPs perto do SNP mais significativo (rs60745952) são codificados por cores para representar o seu LD com este SNP (derivado como valores pares R2 a partir de dados HapMap CEU). rs60745952, o qual é mostrado no círculo roxo, é forte em LD com rs72737820, que é ilustrada pelo circulo vermelho. taxas de recombinação estimados a partir de HapMap está representada no eixo vertical direita em ciano para refletir a estrutura LD local.

A Tabela 2 apresenta os resultados observados no conjunto de dados de validação # 1 para os 20 SNPs pré-seleccionados para teste de associação com estágio IV versus o estágio I ou II cancro do cólon. Replicação foi observado para os dois SNPs no cromossoma 4q31.1, rs72737810 e rs60745952. Na validação de conjunto de dados # 1, estes dois SNPs mostraram associação com o desenvolvimento de doença metastática no p = 9.12×10

-4 (OR = 1,89; IC 95%: 1,27-2,82) e p = 8.05×10

-4 (OR = 1,89; 95% CI: 1,27-2,80), respectivamente (Tabela 2). A força de associação para estes dois SNPs correlacionados tanto excedeu P 0,0044, que era o nosso limite de significância pré-especificado para replicação (conforme detalhado no métodos). Dada a forte LD entre estes SNPs, foram selecionados arbitrariamente rs60745952 para avaliar no segundo conjunto de dados de validação. No menor, menos altamente alimentado validação do conjunto de dados # 2, a associação entre rs60745952 e desenvolvimento de doença metastática não era estatisticamente significativo, mas a estimativa efeito foi na mesma direcção, com um risco aumentado para o alelo menor (OR = 1,31; 95% CI:. 0,81-2,12) (Fig 3, Painel a)

Como o conjunto de dados de descoberta e ambos os conjuntos de dados de validação de todos mostraram um risco aumentado de doença metastática no cólon ou do cólon e pacientes com câncer retal que carregam o alelo menor de rs60745952, uma meta-análise foi realizada para obter a melhor estimativa do tamanho total efeito. Como mostrado na Figura 3 (Painel B), a estimativa de efeito de resumo para a análise combinada (meta-análise) sob um modelo de efeitos fixos foi estatisticamente significativa (OR = 1,93; IC 95%: 1,50-2,49; p = 5,20 x 10

-7). Uma vez que observamos algumas evidências de heterogeneidade no teste de homogeneidade (Q-estatística = 5.01; df = 2; p = 0,08; Fig 3, Painel A), também avaliamos o modelo de efeitos aleatórios e descobriu que as estimativas de efeito resumo foram semelhantes (OR = 1,92; 95% CI: 1.28, 2.87; p = 0,001); no entanto, como esperado, o intervalo de confiança foi mais apertado para o modelo de efeitos fixos.

Nós ainda argumentou que, se associação de rs6074592 ao risco de desenvolver a doença metastática foi impulsionado pelo desequilíbrio de ligação com um alelo de susceptibilidade fundador metástase, e Se este alelo fundador tinha surgido mais recentemente do que a população Ashkenazi como um todo, este alelo seria segregando num bloco de haplótipo de aumento do tamanho presente na metástase versus não-metástase genomas associados. Para testar esta possibilidade, examinámos a estrutura LD da região perto do SNP rs60745952 em indivíduos com estágio IV versus o estágio I ou II cancros do cólon. Figura 4 mostra os gráficos do D ‘entre rs60745952 (linha azul) e todos os outros SNPs na região. O agrupamento de SNPs com D ‘= 1 a rs60745952 define um haplótipo que é claramente maior em indivíduos com estágio IV relação ao Estádio I /II cancros do cólon, tanto na descoberta e os conjuntos de dados de validação # 1 (círculos vermelhos na Fig 4 indicam os SNPs em comum, tanto descoberta e validação # 1 conjuntos de dados). Mais especificamente, observou-se que o número de SNPs com D ‘= 1 no estágio IV (58, variância permutação = 11,71) era significativamente maior do que a observada na fase I /II (41, variância permutação = 7,60) no conjunto de dados descoberta ( P = 2,73 × 10-5) (Tabela 3; ficheiro S4). Resultados no conjunto de dados de validação # 1 foram semelhantes, apenas um pouco menos significativa (p = 5,00 × 10-5).

O eixo vertical é a LD como D ‘para a rs60745952 SNP (linha azul) e outros SNPs a montante ea jusante deste local disponíveis nas matrizes de genotipagem. Os pontos vermelhos indicam SNPs que estavam nas matrizes de genotipagem, tanto na descoberta Dataset e Validação Dataset # 1.

Além disso, nós examinamos a associação potencial entre rs6074592 e Stage IV versus o Estágio I /câncer de cólon II em uma população caucasiana de pacientes com câncer de cólon de Kentucky e descobriu que a associação não foi estatisticamente significativa (OR = 0,89; IC 95%: 0,55-1,46; p = 0,65), o que sugere a associação entre rs6074592 e câncer de cólon metastático é específico para pacientes com Ashkenazi ascendência judaica.

Discussão

para nosso conhecimento, este é o primeiro estudo a relatar associações genéticas de linha germinal humana variantes com o risco de desenvolver metástases do cancro do cólon, especificamente na neste estudo observando que, entre indivíduos judeus Ashkenazi com câncer de cólon, transporte do alelo menor para rs60745952 foi significativamente associada com o desenvolvimento de doenças IV palco, com metástases de órgãos distantes, contra estágio localizada I ou II da doença, com um OR de quase 2. o alelo secundário para rs60745952 é realizada por 31% da população Ashkenazi em geral, e em até cerca de 50% dos indivíduos com cancro do cólon Ashkenazi fase IV, e, portanto, é um contribuinte principal para o desenvolvimento de metástases do cancro do cólon nesta população. A probabilidade de que existe nesta população uma variante fundador metástase susceptibilidade em forte desequilíbrio de ligação (LD) com rs60745952 é sugerido de forma independente por observar que em indivíduos Ashkenazi com câncer de cólon estágio IV, rs60745952 encontra-se em um bloco de LD que é significativamente maior do que é observado em indivíduos com a fase I não metastático ou doença II. Acreditamos ainda mais a associação de rs60745952 com doença metastática é provável específico para a população judaica Ashkenazi, já que esta associação não foi observada quando avaliados na população em geral Europeu de pacientes com câncer de cólon de Kentucky. À luz do muito diferente da história evolutiva da população judaica Ashkenazi, as diferenças observadas não são surpreendentes.

estudos anteriores de nosso grupo [4] demonstraram que todas as mutações somáticas detectado em metástases de câncer de cólon já estavam presentes nos seus tumores de câncer de cólon primário antecedentes. Assim metástases do cancro do cólon não exigem aquisição de novas mutações “driver de metástase”. No presente estudo, nós apresentamos provas de que um elemento genético da progressão de metástases podem ser codificadas no genoma do hospedeiro. Enquanto possíveis factores especulativos, codificado hospedeiras relevantes para o processo metastático que incluem elementos de vigilância imunológica, elementos de permeabilidade e /ou angiogese vascular, e possivelmente elementos dentro de cascatas de sinalização que podem determinar as respostas celulares a oncogenes ou inactivação de genes supressores de tumores activados. Semelhante aos resultados de muitos estudos GWAS, rs60745952 encontra-se numa região intergénica, e não temos evidência direta de diferenças funcionais inerentes ao transporte deste SNP. investigações futuras sobre esta questão terá de ser realizado em amostras biológicas obtidas especificamente da população Ashkenazi.

Os resultados relatados aqui provavelmente não vieram à luz, exceto para o nosso empregando um design de alimentação orientada para a replicação que permitiu -nos a preservar o poder suficiente para demonstrar a importância da associação, mesmo em uma coorte de replicação de tamanho modesto. Esta abordagem provavelmente será de valor para outros investigadores que tentam enriquecer geneticamente para um sinal de associação através do estudo selecionado, mas as populações menores, do que aqueles que foram tipicamente empregados para GWASs. Testes para as diferenças na estrutura LD consistentes com variantes da doença fundador também pode ser de valor para GWASs nestes, mas populações altamente selecionadas menores.

Materiais e Métodos

Os participantes do estudo

Visão geral.

pacientes com câncer de cólon de quatro conjuntos de dados diferentes foram usados ​​nesta avaliação. Todos os pacientes foram demonstradas de acordo com protocolos de pesquisa aprovados pelos Institutional Review Boards das instituições correspondentes (Carmel Medical Center (Haifa), University of Southern California, Memorial Sloan-Kettering Cancer Center e Hospitais da Universidade de Processo Medical Center), conforme detalhado mais abaixo. Todos os pacientes forneceram consentimento informado por escrito. Todos os procedimentos de consentimento foram aprovados pelos correspondentes acima mencionados Institucionais Review Boards.

Descoberta Dataset.

Os participantes foram escolhidos a partir da epidemiologia molecular do estudo Câncer Colorretal (MECC), que é um caso de base populacional estudo -control de cólon incidente e casos de câncer retal que tem sido descrito anteriormente [7]. Resumidamente, os pacientes do norte de Israel foram recrutados para MECC desde 1998. Como parte do estudo MECC, foram obtidas informações demográficas e clínicas básica, bem como amostras de sangue. Casos selecionados para genotipagem tinha confirmado histologicamente, microssatélite câncer de cólon estável. Especificamente, a população de estudo utilizado no conjunto de dados de descoberta para esta avaliação consistiu de 89 indivíduos com câncer de cólon estágio IV com metástases de órgãos distantes, todos envolvendo o fígado, e 234 indivíduos com estágios I e II cancros do cólon que foram órgão confinados e sem metastático espalhar. Estes indivíduos foram ainda confirmados como remanescente livre de metástases durante o acompanhamento clínico com uma duração mínima de 3 anos. Controles na população do estudo descoberta dataset MECC consistiu em indivíduos sem história prévia de cólon ou rectal câncer e foram individualmente pareados aos casos com base na idade, sexo e local de clínica primária. 139 controles foram genotipados e usado para quantificar a freqüência do alelo menor para os melhores SNPs. Todos os pacientes tinham ascendência judaica Ashkenazi auto-referida.

Validação Dataset # 1.

O primeiro conjunto de dados de validação foi derivado de uma segunda amostra, independente dos participantes do estudo MECC que foram selecionados com critérios menos restritivos do que no conjunto de dados descoberta. Especificamente, a validação do conjunto de dados # 1, constituído por mais indivíduos, quer com cancro do cólon ou rectal, a fase I e II casos para os quais a pós-operatório follow-up não estava disponível, e os indivíduos cujos cânceres não tinha sido testado para a instabilidade de microssatélites. Além disso, esta amostra incluiu indivíduos com sefardita auto-reportados, bem como Ashkenazi ascendência judaica. O conjunto de dados de validação nesta avaliação incluiu 89 do estágio IV casos de câncer colorretal e 373 II casos de cancro colorectal fase I e fase. Controles no nº 1 população do estudo conjunto de dados de validação consistiu em mais pacientes sem história prévia de câncer de cólon ou rectal e foram individualmente pareados aos casos com base na idade, sexo, etnia judaica e local clínica primária.

Validação Dataset # 2.

os pacientes no segundo conjunto de dados de validação foram tratados no Memorial Sloan-Kettering cancer Center (MSKCC) e tinha confirmado histologicamente câncer colorretal. Os pacientes foram demonstradas de acordo com dois protocolos clínicos MSKCC entre 2000 e 2010. Este estudo populacional também foi menos restritivo do que o conjunto de dados de descoberta naquele conjunto de dados de validação # 2 incluiu indivíduos com tanto cólon ou câncer retal e indivíduos cujos cânceres não tinha sido testado para a instabilidade de microssatélites. Este conjunto de dados de validação foi composta por 86 indivíduos com câncer de cólon estágio IV com metástases de órgãos distantes, todos envolvendo o fígado, e 256 indivíduos com estágios I e II cólon ou retal que foram confinado ao órgão e sem metástase. Os indivíduos com esses tipos de câncer em estágio inicial foram confirmados como remanescentes metástase gratuito durante o acompanhamento clínico com uma duração mínima de 3 anos. Todos os pacientes tinham ascendência judaica Ashkenazi auto-referida.

Kentucky Caucasiano Dataset.

Os detalhes da população do estudo Kentucky foram descritos em outro [8]. Em resumo, o conjunto de dados utilizado nesta avaliação consistiu de 77 pacientes com câncer de cólon estágio IV e 398 pacientes com Fase I /II de câncer de cólon. Todos os pacientes desta amostra eram caucasianos.

isolamento de DNA, genotipagem e controle de qualidade

Descoberta Dataset.

DNA a partir de linfócitos de sangue total foi extraído utilizando o DNA Mini sangue QIAamp kit (Qiagen, Hilden, Alemanha) e foi armazenada a -20 ° C até à sua utilização para a genotipagem. Todas as amostras de DNA foram submetidos a amplificação do genoma inteiro usando o Illustra GenomiPhi V2 DNA Amplification Kit (GE Healthcare, Waukesha, Wisconsin; catálogo No. 25.660.032). As amostras foram armazenadas a -20 ° C.

As amostras foram genotipados na 2.5-8 plataforma Illumina Omni. Os dados foram limpos utilizando procedimentos de controlo de qualidade recomendados pela Genomics Group emergem de trabalho [9]. Os procedimentos de CQ incluir a avaliação da amostra e taxa de chamada marcador, descasamentos de género (Plink [10]; “-check-sexo”), duplicatas, Hardy-Weinberg, parentesco amostra (Plink [10]; “-genome”), e estratificação populacional. Um total de 1,491,783 SNPs foram incluídos na análise após a exclusão de SNPs que tinham menores frequências alélicas 0,01, dados em falta em mais do que 2% de amostras, ou pontuações Ilumina GenTrain inferior a 0,6. No total, 5 fase IV pacientes, e 7 a fase I e II, os doentes foram removidas a partir das análises por ter taxas de chamadas inferior a 98%, por não a verificação de gênero ou por ser uma duplicata não intencional (ver arquivo S1 para obter detalhes adicionais). Para controlar a estratificação da população, os dois primeiros componentes principais (PCs) foram derivados de análise de decomposição multidimensional utilizando a função ‘cmdscale’ em R.

Validação Dataset # 1.

O Colorectal Transdisciplinar ( corect) Estudo realizado a genotipagem para conjunto de dados de validação # 1. A genotipagem foi realizada utilizando um costume Affymetrix plataforma do genoma (o conjunto Axiom® corect), com aproximadamente 1,3 milhões de SNPs e indels; no entanto, apenas dados de SNPs identificados como o Top SNPs no conjunto de dados descoberta foram extraídos por corect para esta análise (ver Análise Estatística). Os dados foram limpos utilizando procedimentos de controle de qualidade similar ao conjunto de dados de descoberta (veja o arquivo S2 para maiores detalhes) [9].

Validação Dataset # 2.

O DNA foi isolado a partir de qualquer linfócitos de sangue total ou de parafina e fixado em formalina incorporado (FFPE) de tecido de cólon normal, utilizando o kit de extracção de Qiagen QIAamp DNA ou o DNA QIAamp sangue Mini kit (Qiagen, Hilden, Alemanha) e foi armazenada a -20 ° C até à sua utilização para a genotipagem. Todas as amostras de ADN foram submetidos a amplificação do genoma completo, utilizando o Kit de Repli-g Amplificação de ADN (Qiagen, CA). Para um subconjunto de amostras, tanto FFPE e sangue derivada de ADN estavam disponíveis e foram utilizadas para testar a concordância de genótipos para a garantia da qualidade. A genotipagem foi realizada para rs60745952 utilizando ensaios Sequenom Iplex e analisados ​​utilizando MassARRAY [11]. Genótipos foram chamados usando TYPER 4.0.2 software.

Kentucky Caucasiano Dataset.

DNA foi isolado de todas as disciplinas e química ABI TaqMan foi empregado ao genótipo rs60745952. Isso exigiu design personalizado de sondas e iniciadores pela ABI. PCR [40] Ciclos foi realizado em um 9700 Dual Head Instrumento ABI GeneAmp PCR System e endpoint leituras foram realizadas utilizando o 7900 Sequence Detection System ABI.

Análises Estatísticas

A regressão logística foi realizada para avaliar a associação potencial entre cada SNP e estágio IV contra estádios I e II cancros do cólon sob um modelo genético log-aditivo. Embora as análises iniciais usado Plink [10], a análise final para rs60745952 nos três conjuntos de dados de estudo utilizados SAS v9.2 (SAS Institute Inc., Cary, NC) para a inclusão adequada de co-variáveis ​​assumindo única independência dos indivíduos, não de alelos [12 ], conforme implementado no Plink [10]. Todas as análises de regressão foram ajustados para idade e sexo e, no caso da descoberta e conjunto de dados de validação # 1, que foram GWAS, os 2 primeiros componentes principais. Além disso, nestes dois conjuntos de dados examinamos se rs60745952 foi realizado em um haplótipo mais pacientes no estágio IV do que na fase I /II pacientes. Depois de identificar a região cromossômica apropriada no conjunto de dados de descoberta usando o padrão LD gerada em Haploview [13] (S3 Arquivo), foi calculado o D ‘entre cada SNP no bloco e rs60745952 e contou o número de SNPs para o qual D’ = 1. em seguida, realizou testes de permutação para testar se o número de SNPs com D ‘= 1 foi significativamente maior no estágio IV em comparação com a fase I /II pacientes (S4 Arquivo).

projeto de Estudos de replicação

modelagem estatística sugeriu que uma coorte de replicação dos casos de câncer de cólon de tamanho similar à coorte descoberta poderia fornecer cerca de 80% de energia para testar até 9 de nosso candidato mais significativo SNPs (top SNPs) ao nível de significância corrigido Bonferroni de 0,04 /9 (= 0,0044), mais 8 novos SNPs em um Bonferroni corrigido nível de significância de 0,01 /8; Assim, o erro global de tipo 1 foi controlada para ser 0,05 (Um projeto semelhante foi usado para testar a fase III em relação fase I /II pacientes com câncer de cólon, mas apenas a comparação com a fase IV pacientes é relatado aqui). Poder para replicação foi calculada para cada SNP individual com base no limite de confiança de 50% inferior do rácio correspondente probabilidades [14] e a prevalência do SNP (ver arquivo S5). Três dos top 9 SNPs foram acompanhados por um SNP companheiro que demonstrou desequilíbrio de ligação completa em nossa descoberta de coorte (D ‘= 1,0), e estes 3 companheiro SNPs foram adicionados ao nosso conjunto de top SNPs a ser testado para replicação, sem nenhuma estatística ajuste, para um total de 20 SNPs pré-especificados para análise na coorte de validação. Antes de iniciar o estudo de validação, este projeto de análise e as identidades dos 20 SNPs pré-especificados foram depositados com o oficial de programa NCI que supervisiona o estudo à documentação registro do desenho do estudo. SNPs adicionais que estavam presentes no # 1 matriz genotipagem conjunto de dados de validação não foram considerados nesta avaliação do estudo.

Análise de Dados Combinada (Meta-Analysis)

Os resultados de associação para o rs60745952 SNP na três conjuntos de dados do estudo com ascendência judaica Ashkenazi (Discovery Dataset, Validação Dataset # 1, Validação Dataset # 2) foram combinados usando uma meta-análise com a abordagem ponderada pelo tamanho da amostra inversa implementado em METAL [15]. Foram avaliados homogeneidade entre os resultados de associação utilizando a Q-teste e calculou-se a estimativa de efeito resumo utilizando um modelo de efeitos aleatórios [15]. Calculou-se a estimativa de efeito resumo usando ambos os modelos de efeitos fixos e aleatórios, uma vez que o valor-p para o teste de homogeneidade foi marginalmente significante (Tabela 3; p 0,10), o que sugere alguma heterogeneidade pode estar presente ea variância entre os estudos deve ser incorporada nas análises para obter os limites de confiança.

Informações de Apoio

Arquivo S1. Genotipagem QA /QC detalhes para Discovery Dataset

doi:. 10.1371 /journal.pone.0146435.s001

(PDF)

S2 Arquivo. Genotipagem QA /QC detalhes para validação Dataset # 1 | doi:. 10.1371 /journal.pone.0146435.s002

(PDF)

arquivo S3. Terrenos LD

doi: 10.1371. /Journal.pone.0146435.s003

(PDF)

S4 Arquivo. Avaliação LD através Permutation na descoberta e validação # 1 conjuntos de dados

doi:. 10.1371 /journal.pone.0146435.s004

(PDF)

S5 Arquivo. Seleção de SNPs de Validação

doi:. 10.1371 /journal.pone.0146435.s005

(PDF)

Reconhecimentos

O conteúdo deste manuscrito não refletem necessariamente a posição ou políticas do National Cancer Institute ou qualquer um dos centros colaboradores do consórcio corect, nem menção de nomes comerciais, produtos comerciais ou organizações implica o endosso pelo governo dos EUA ou o consórcio corect.

Deixe uma resposta