PLOS ONE: câncer colorretal e o microbioma intestinal humana: Reprodutibilidade com todo o genoma Shotgun Sequencing

Abstract

As evidências acumuladas indicam que a microbiota intestinal afeta o desenvolvimento do câncer colorretal, mas estudos anteriores têm variado na população, métodos técnicos e associações com câncer. A compreensão dessas variações é necessário para comparações e para a colocação em comum potencial entre os estudos. Portanto, realizamos todo o genoma shotgun sequenciamento em amostras fecais de 52 pré-tratamento dos casos de câncer colorretal e 52 controles pareados de Washington, DC. Foram comparados os resultados de um estudo 16S rRNA publicado anteriormente com a taxonomia derivados de metagenômica dentro da mesma população. Além disso, genes previu-metagenome, módulos e caminhos no Washington, casos e controles DC foram comparados com os casos e controles recrutados em França cuja espécimes foram processados ​​usando a mesma plataforma. As associações entre a presença de Fusobactérias fecal,

Fusobacterium

, e

Porphyromonas

com cancro colo-rectal detectado por 16S rRNA foram reproduzidas por metagenômica, enquanto maior abundância relativa de Clostridia nos casos de câncer com base em 16S rRNA foi limítrofe meramente com base em metagenómica. Isto demonstrou que, dentro do mesmo conjunto de amostras, a maioria, mas não todas as associações taxonómicos foram visto com ambos os métodos. Considerando associações de câncer significativas com a abundância relativa de genes, módulos e caminhos em um recentemente publicado conjunto de dados metagenômica franceses, associações estatisticamente significativas no Washington, a população DC foram detectados em quatro dos 10 genes, três dos nove módulos e sete de 17 vias. No total, o estado câncer colorretal no estudo Washington, DC foi associado a 39% dos previu-metagenome genes, módulos e vias identificadas no estudo francês. Mais dentro e entre as comparações populacionais são necessários para identificar fontes de associações de variação e de doenças que podem ser reproduzidos, apesar dessas variações. Estudos futuros devem ter maior dimensão da amostra ou dados de pool entre os estudos para ter poder suficiente para detectar associações que são reprodutíveis e significativa após correção para testes múltiplos

Citation:. Vogtmann E, Hua X, Zeller G, Sunagawa S, Voigt AY, Hercog R, et al. (2016) Câncer Colorretal e o microbioma intestinal humana: Reprodutibilidade com todo o genoma Shotgun Sequencing. PLoS ONE 11 (5): e0155362. doi: 10.1371 /journal.pone.0155362

editor: John Parkinson, Hospital for Sick Children, Canadá |

Recebido: 17 de novembro de 2015; Aceito: 27 de abril de 2016; Publicado em: 12 de maio de 2016

Este é um artigo de acesso aberto, livre de todos os direitos autorais e pode ser livremente reproduzido, distribuído, transmitido, modificado, construído em cima, ou de outra maneira usado por qualquer pessoa para qualquer finalidade lícita. O trabalho é feito disponível sob a dedicação de domínio público da Creative Commons CC0

Data Availability:. Os dados shotgun metagenomic sequenciamento está disponível na base de dados europeia Nucleotide Archive com o número de acesso PRJEB12449 (https://www.ebi.ac .uk /ena /data /view /PRJEB12449). Devido a restrições de privacidade, os metadados completa pode ser disponibilizado para pesquisadores qualificados em contato com o Dr. Rashmi Sinha ([email protected])

Financiamento:. Este projecto foi apoiado pelo Programa de Pesquisa Intramural do National Cancer Instituto. GZ, SS, AYV, RH e PB recebeu financiamento através do projeto CancerBiome (referência do projecto Conselho Europeu de Investigação 268.985)

Conflito de interesses:.. Os autores declararam que não existem interesses conflitantes

abreviaturas: IMC, índice de massa corporal; CRC, câncer colorretal; DC, District of Columbia; HMP, Projeto Microbioma Humano; Motu, unidade taxonômica operacional metagenômico; OTU, unidade taxonômica Operacional; WGSS, todo o genoma shotgun sequenciamento

Introdução

O microbioma humano é o tema de uma área crescente de investigação, uma vez que provavelmente está relacionado à saúde humana e doenças. Há evidências de que o microbioma desempenha um papel no cancro colorectal desenvolvimento ou progressão (CRC), potencialmente através de vias inflamatórias ou metabolitos microbianos cancerígenos [1], e associações microbianas com CRC têm sido sugeridas em um número de estudos [2-9] . Por exemplo, com o próximo sequenciamento geração do gene universal do 16S rRNA em DNA extraído de fezes, o nosso grupo mostrou que, em comparação com controles pareados, casos CRC têm menor diversidade da comunidade, modestamente menor abundância relativa de Clostridia, e maior presença de

Fusobacterium

e

Porphyromonas

[2]. Do microbioma anterior e estudos CRC, alguns usados ​​16S rRNA sequenciamento de genes [2, 4, 5, 7, 9], enquanto outros utilizaram todo o genoma de espingarda metagenomics sequenciamento /espingarda (WGSS; [3, 6, 8]). WGSS produz não apenas os perfis de composição bacteriana e diversidade, mas também estima o potencial funcional do microbioma [10].

Realizamos shotgun sequenciamento metagenomic de amostras fecais de um estudo de caso-controle CRC realizado na década de 1980 em Washington, DC que foram previamente analisados ​​por sequenciamento do gene 16S rRNA [2]. Submetendo as mesmas amostras a um método de sequenciação diferentes, fomos capazes de comparar as associações de rRNA 16S anteriormente observados com os dados de sequenciação metagenômico espingarda. Além disso, usando esta tecnologia, pudemos investigar as possíveis associações de nível gene microbiano com CRC que não era possível nos dados de sequenciamento do gene 16S rRNA, e comparamos as associações de nível gene com os detectados em um caso-controle francês anterior estudo que aplicou o gasoduto mesma extração de DNA metagenômica e plataforma de sequenciamento e bioinformática [8].

Materiais e Métodos

população do estudo primário

as amostras de fezes foram coletadas em um CRC estudo caso-controle que tenha sido previamente descrito em detalhe [11] e a descrição da análise do respectivo estudo de sequenciamento do gene 16S rRNA foi publicado anteriormente [2]. Resumidamente, casos CRC e controles de freqüência combinado que estavam esperando a cirurgia para condições não-oncológicas e não-gastrointestinais foram recrutados 1985-1987 em Washington DC, Estados Unidos. Antes da cirurgia ou outro tratamento, todos os participantes recolhidas fezes ao longo de um período de dois dias e armazenou-los em gelo seco. No laboratório, as amostras foram liofilizadas, reunido, e armazenado de forma contínua, seguidamente, a -40 ° C. Para o atual estudo metagenomic espingarda, foram selecionadas amostras de 52 casos e 52 controles (população WGSS DC). Os casos e controles foram pareados por sexo e índice de massa corporal (IMC; 20 kg /m

2 ou ≥ 20 kg /m

2). Associações na análise WGSS DC foram comparados com os do estudo sequenciamento de genes 16S rRNA anterior (população 16S DC), que incluiu 47 casos de CRC e 94 indivíduos de controle do mesmo estudo pai. Todos os 47 casos de CRC de 16S DC foram incluídos no WGSS DC e os 52 controles em WGSS DC foram incluídos nos 94 controles de 16S DC. Os participantes forneceram consentimento informado por escrito e este estudo foi aprovado pelo Escritório de Seres Humanos Research no National Institutes of Health.

população de validação independente

Foram incluídos dados de um estudo publicado anteriormente (população F ) como um conjunto de validação independente [8]. Em suma, os casos de CRC e controles escolhidos aleatoriamente foram recrutados 2004-2006 em Paris, França. Antes da colonoscopia, uma amostra de fezes frescas foi recolhido e congelado a -20 ° C no decurso de quatro horas após a colheita. População F incluiu 53 CRC casos, 15 grandes casos de adenoma, 27 casos de adenoma pequeno, e 61 controles normais. Uma vez que os controles de Washington DC pode ter também incluiu pequenos adenomas não diagnosticados, a comparação de caso-controle definir a partir de população F incluídos 53 casos de CRC e 88 controles (ou seja, 27 pequenos adenomas e 61 controles normais) e excluídos os dados dos 15 grandes adenomas .

Incluímos também disponível publicamente espingarda dados metagenomic de 292 participantes MetaHIT [12, 13] Eu participantes e Fase 94 Projeto Microbioma Humano (HMP) [14] para a comparação da diversidade global, riqueza e regularidade com a nossa amostras.

extracção de ADN e todo o genoma espingarda sequenciação

as amostras fecais liofilizados de WGSS DC foram descongelados, ressuspensos em solução salina tamponada com fosfato, e uma alíquota foi enviado para o núcleo Genomics Facility, Laboratório Europeu de Biologia Molecular em Heidelberg, Alemanha em gelo seco. Os métodos de extracção de ADN, a preparação da biblioteca, e todo o genoma shotgun de sequenciação têm sido descritas em detalhe [8] e eram as mesmas para população WGSS DC e população F. Em resumo, o DNA foi extraído das amostras fecais utilizando o isolamento de ADN GNOME kit (MP Biomedicals) com pequenas modificações. Whole-sequenciação do genoma espingarda do DNA extraído foi realizada utilizando o Illumina HiSeq 2000/2500 (Illumina, San Diego, EUA). As amostras foram sequenciados com um comprimento de 100 bp de leitura para sequências-end emparelhado no Centro de Genômica Core, Laboratório de Biologia Molecular Europeu, Heidelberg, Alemanha com uma profundidade sequenciamento alvo de 5 GBP.

Bioinformatics

a estratégia geral para o processamento dos dados de bioinformática sequenciação de todo o genoma tenha sido previamente descrito em detalhe [8] e foi o mesmo para ambos e WGSS DC população perfis abundância F. taxonómicos resumidos no NCBI fileiras taxonómicos que variam de espécie para filo e unidades taxonômicas operacionais metagenomic (Motu) [15, 16] foram criados usando MOCAT [17]. MOCAT também foi usado para anotar funcionalmente genes extraídos de conjuntos metagenomic ao banco de dados KEGG (versão 62) [18]. índices ecológicos (Shannon diversidade, riqueza de espécies, e uniformidade comunidade) foram calculados com base em Motu abundância relativa e reduzida para 2000 inserções utilizando o pacote de software R vegan [19]. Um participante da população WGSS DC e quatro participantes de população F foram excluídos devido à cobertura de leitura mais baixa.

A análise estatística

Nós comparamos Shannon diversidade, riqueza e regularidade para a população WGSS DC, a população F , amostras MetaHIT, e HMP Fase I e as diferenças de caso-controle testados na população WGSS DC e da população F utilizando o teste de Kruskal Wallis. Então, tanto para a população do estudo primário (população WGSS DC: 52 casos contra 52 controles) e a população independente de validação (população F: 53 casos contra 88 controles), foi testada para as associações entre o estado caso /controle e tanto a abundância relativa e presença /ausência de diferentes níveis taxonômicos e categorias de genes (ou seja, genes, módulos e vias). Um modelo de regressão logística com ajuste para idade, sexo, índice de massa corporal (IMC) foi utilizado e os valores de p foram calculados com base no teste de Wald (S1 Tabela). Três casos de CRC de população WGSS DC estavam faltando dados de IMC por isso incluímos esses valores usando meios específicos de sexo dos casos de CRC. Para fins de comparabilidade com o estudo 16S DC, também calculado um modelo de regressão logística não ajustada para um teste do qui-quadrado de dois lados Wald e um teste de Wilcoxon não paramétrico de dois lados para a presença /ausência e abundância relativa de taxa específica, respectivamente. Geramos parcelas QQ de-registo de (valor p observado) versus o log de (valores de p sob uma distribuição normal) dentro WGSS DC e da população F para todos os níveis taxonômicos e categorias de genes para determinar associações potencialmente estatisticamente significativa após correção para comparações múltiplas. Para os dados de categoria do gene na população F, utilizamos correcção de Bonferroni do valor de P para determinar a significância estatística (isto é, p 0,05 /número de testes) e considerado como um valor de p 0,05 como sendo estatisticamente significativo para análises de reprodutibilidade em WGSS DC. Todas as análises estatísticas foram realizadas utilizando R (versão 3.0.0).

Resultados

Características dos 52 casos CRC e 52 controles de população WGSS DC são apresentados na Tabela 1. Eles foram bem adaptado por sexo e IMC. No entanto, casos de CRC teve uma maior proporção de negros não-hispânicos (23,1% dos casos e 5,8% nos controles), menor nível de escolaridade (15,4% dos casos e 3,8% dos controles tinham menos de uma educação de escola secundária), e mais atual fumantes (13,5% dos casos e 3,8% dos controles). Dentro dos casos de CRC, 28,8% dos casos tinha câncer no cólon direito e 34,6% tinham câncer no cólon esquerdo. A maioria dos CRCs estavam invasiva sem metástases conhecidas (40,4%), mas 34,6% eram metastático.

associações de câncer colorretal em o WGSS DC contra 16S DC

16S anteriores rRNA análise de sequenciação genética nesta população (16S DC), a presença de 4 taxa ea abundância relativa de 3 taxa foram significativamente associados com CRC status do caso de falsa descoberta valores de p ajustado de taxa inferior a 0,05. Como pode ser visto na Tabela 2, que reproduz uma associação significativa entre a presença do filos Fusobactérias e estado caso CRC (p = 0,003), especificamente que 76,9% dos casos e 48,1% dos controlos tinham detectável Fusobactérias. Isso reproduz a associação de Fusobactérias com status do caso na análise 16S DC; Embora a detecção foi inferior (36,2% dos casos e 16,0% dos controles, Tabela 2). Em comparação com o 16S DC, o WGSS também teve taxa de detecção prevalente para outros taxa, e reproduziu uma associação significativa entre a presença de

Fusobacterium

(p = 0,006) e

Porphyromonas

(p = 0,032) com CRC status do caso. A associação entre o

Atopobium Comprar e CRC do 16S DC não foi reproduzido na WGSS (Tabela 2). Como pode ser visto na Tabela 3, que não reproduziu associações entre a abundância relativa de taxa específica e status do caso CRC, embora a associação entre a abundância relativa de Clostridia tendeu a ser menor nos casos (p = 0,092). Notavelmente, a abundância relativa de Clostridia estimada no WGSS foi duas vezes menor para ambos os casos e os controlos em comparação com que no estudo 16S DC. Na população WGSS DC, a classe com uma maior abundância relativa foi Bacteroidia, que tinha uma abundância relativa de 53,2% nos casos e 50,9% nos controles (S1 Tabela).

associações de câncer colorretal na WGSS DC contra população F

na população WGSS DC, não houve diferenças significativas entre casos de CRC e controles para Shannon diversidade, riqueza, ou uniformidade com base em Motus, embora, em geral, os controles tiveram um pouco maior diversidade alfa em comparação com os casos (Fig 1). Shannon diversidade, riqueza e regularidade foram semelhantes para a população WGSS DC, a população F, e as amostras MetaHIT, ao passo que as amostras de HMP tendem a ter um pouco menor Shannon diversidade, riqueza e regularidade.

As diferenças estatísticas entre cancro colorectal casos e controles foram testados utilizando o teste de Kruskal-Wallis.

status do caso CRC na população F [8] foi fortemente associada com a abundância relativa de muitos genes derivados de metagenome KEGG, módulos e percursos ( como pode ser visto pela forte desvio da linha 45 ° graus na Figura 2), mas isto não foi observado na população WGSS DC. Para a presença de genes KEGG, módulos e caminhos, havia pouca evidência para quaisquer associações com CRC status do caso em qualquer população de estudo (Fig 2). Desde associações foram detectados pela abundância relativa dos dados de nível único gene na população F, tentamos reproduzir associação estatisticamente significativa após a correção de Bonferroni na população F com os dados WGSS DC sem correção para comparações múltiplas.

Em contraste com a avaliação global (Fig 2), quando consideradas as associações significativas entre a abundância relativa de genes KEGG (p 0,05 /8028), módulos (p 0,05 /485), e vias (p 0,05 /318) na população F, as associações de câncer foram reproduzidas (p 0,05) no WGSS DC para quatro de 10 genes: aminomethyltransferase (K00605), triptofanase (K01667), peptídeo metionina sulfóxido redutase msrA /MSRB (K12267) e proteína de membrana putativa (K01421) (Tabela 4). Do mesmo modo, a DC WGSS reproduzida associações cancerosas para três de nove módulos: leucina degradação, leucina = acetoacetato + acetil-CoA (M00036), ciclo citrato, segundo a oxidação do carbono, 2-oxoglutarato = oxaloacetato (M00011), e metionina biossíntese, apartate = homoserina = metionina (M00017) (Tabela 5). Fora das 17 associações via estatisticamente significativas na população F, o WGSS DC reproduzida associações com sete vias: ciclo de citrato (ko00020), o metabolismo do ácido lipóico (ko00785), valina, leucina, e degradação isoleucina (ko00280), esclerose lateral amiotrófica (ko05014 ), biossíntese da lisina (ko00300), a degradação do geraniol (ko00281), e o metabolismo do azoto (ko00910) (Tabela 6). Nenhuma associação adicionais significativas com CRC foram encontrados no WGSS DC

Discussão

Este estudo teve dois objetivos principais:. 1) para comparar os 16S anteriormente observados rRNA associações genéticas com dados de todo o genoma shotgun sequenciamento metagenomic; e 2) para investigar possíveis associações de nível gene microbiano com CRC em diferentes populações. Para o primeiro objetivo, a abordagem metagenômica reproduziu algumas das associações previamente observados na análise do gene 16S rRNA, maior probabilidade mais notavelmente de detectar taxa no filo Fusobactérias e

Fusobacterium

género entre os casos de CRC. Uma grande diferença entre os dois estudos foi a sensibilidade para a detecção de taxa. Por exemplo, os filos Fusobactérias foi detectada em 36,2% dos casos e 16,0% dos controlos no estudo de genes de rRNA 16S, mas utilizando metagenómica espingarda todo o genoma, Fusobactérias foi detectada em 76,9% dos casos e 48,1% dos controles . Não é claro o que pode fazer com que as diferenças entre os resultados de ARNr 16S e WGSS, mas pode ser devido a região do gene de ARNr 16S variável sequenciado, a profundidade de sequenciação, a atribuição de bioinformática taxonomia, ou diferenças técnicas. Estas variações na detecção da presença e abundância relativa de taxa demonstram uma diferença importante quando se comparam 16S rRNA sequenciamento de estudos metagenomic todo o genoma de espingarda e deve ser estudado com mais detalhes no futuro.

Para o nosso segundo objetivo, o WGSS DC fez reproduzir algumas das específicas, estatisticamente significativas genes, módulos e vias detectadas na população F com [8] status do caso CRC. Dois módulos e vias relacionadas foram identificados em modelos independentes: M00011 (ciclo de citrato, segundo a oxidação do carbono, 2-oxoglutarato = oxaloacetato) e ko00020 (ciclo de citrato /ciclo TCA); e M00036 (degradação leucina, leucina = acetoacetato + acetil-CoA) e ko00280 (valina, leucina, isoleucina e degradação). É possível que estas, e outras capacidades funcionais estão relacionados com a CRC, mas são necessários mais estudos. Shannon diversidade, riqueza e regularidade baseado em metagenomics espingarda todo o genoma não foram associados com CRC status do caso na WGSS DC, mas essas estimativas foram semelhantes aos do MetaHIT ea população F.

Nossa reprodutibilidade estatisticamente significativa associações de um estudo anterior [8] fornece informações importantes sobre o futuro pooling de dados dadas as grandes diferenças entre estes dois conjuntos de dados. Nossas amostras foram coletadas na década de 1980 nos Estados Unidos, enquanto as amostras para a população F foram coletados na década de 2000 na França. Há alguma evidência de que o armazenamento de amostras fecais em baixas temperaturas mantém a estrutura da comunidade microbiana [20, 21], no entanto, para o nosso conhecimento, este não tem sido testada para amostras armazenadas durante quase 30 anos. E dado o trabalho anterior que sugere que as associações microbianas com diabetes tipo 2 podem diferir pela população [22, 23], embora essas diferenças podem ser conduzidos por metformina use [24], é encorajador que algumas das associações eram robustas entre as populações no Estados Unidos e França a partir de diferentes anos. Além disso, as amostras de fezes em nosso estudo foram coletadas antes da hospitalização e tratamento de todos os movimentos do intestino ao longo de dois dias e depois liofilizado. Isto contrasta com os métodos para a população F, onde as amostras foram recolhidas 2 semanas a 3 dias antes da colonoscopia, mas sempre antes da limpeza intestinal, e foram-se uma alíquota a partir de um movimento do intestino que foi congelado dentro de quatro horas. Liofilização de amostras fecais foi encontrada para afetar a abundância relativa de taxa diferente para amostras de fezes infantis [25], por isso é reconfortante para replicar alguns resultados entre os diferentes métodos de armazenamento. Além disso, as amostras pareciam ter WGSS medidas de diversidade semelhantes em comparação com outro estudo metagenômico espingarda, MetaHIT, que também inclui uma população e colecções diferente. Como foi visto em estudos de associação do genoma humano, amostras de grande tamanho são necessários para detectar associações que sobrevivem correção para testes múltiplos. Com essas diferenças em período de coleta, população e coleta de amostras, as semelhanças entre associações entre microbianas dados taxonômicos e de nível de gene com CRC status do caso fornece algum suporte para o intercâmbio de dados entre os estudos heterogêneos. trabalho adicional foi realizado para avaliar os métodos de recolha ideais para futuras coletas fecais [26-30] e o efeito de procedimentos de manuseio de laboratório e processamento de bioinformática dos dados [31] que podem fornecer informações adicionais para o agrupamento de dados a jusante ou meta-análise.

Outros estudos anteriores investigaram associações entre o microbioma fecal e CRC [32]. Similar aos nossos achados, uma série de estudos não detectaram uma diferença global entre casos e controles CRC de medidas de diversidade da comunidade [4, 5, 9]. No entanto, um estudo observou que os casos de CRC tinha aumentado gene e riqueza género em relação aos controles [3], enquanto outro estudo detectou reduzida riqueza genética e diversidade alpha gene em casos de CRC, em comparação com os controles, embora a associação não foi estatisticamente significativa após ajuste para fecal coleta de amostra após a colonoscopia [6]. De acordo com nossos resultados, a maioria dos estudos anteriores descobriram que casos CRC eram mais propensos a ter níveis detectáveis ​​ou superiores de

Fusobacterium

comparação com controles [3, 5-7, 9], enquanto que apenas alguns estudos detectaram níveis mais elevados ou detecção de

Porphyromonas

em casos de CRC em relação aos controles [3, 5, 7]. Em todo o genoma espingarda metagenômico estudo anterior, o módulo M00036 e KEGG vias ko00280 e ko00910 foram encontrados para ser significativamente enriquecidos em casos CRC comparação com os controlos [6] similar ao que foi detectado neste estudo. No outro estudo metagenomic todo o genoma anterior espingarda, nossas descobertas para KEGG vias ko00020, ko00280, ko00281, ko00300, ko00785 foram confirmadas, mas uma associação para KEGG via ko00910 estava na direção oposta do que observamos [3]. Em resumo, nós confirmou algumas associações observadas em pesquisas anteriores, mas todos os estudos anteriores (16 e todo o genoma shotgun sequenciamento) teve baixa potência. Além disso, esses estudos anteriores pode não ter sido capaz de ajustar adequadamente para possíveis fatores de confusão, o que poderia explicar um pouco da variabilidade entre os estudos. Devido às múltiplas comparações nas análises microbioma, pooling de dados será fundamental para superar o poder limitado nestas análises.

O estudo atual não é sem limitações. Em primeiro lugar, todas as amostras de fezes foram recolhidas de forma transversal, de modo que não é possível determinar se as alterações microbianas ocorreu antes do desenvolvimento de cancro ou se eram devido ao desenvolvimento de cancro. Além disso, este estudo teve uma amostra relativamente pequena e, portanto, fomos underpowered para detectar muitas associações estatisticamente significantes após correção para testes múltiplos. Finalmente, nossos controles saudáveis ​​foram hospitalar controles que aguardam cirurgias eletivas com base e podem não representar a população em geral naquela época. No entanto, nosso estudo também tem pontos fortes. Fomos capazes de alavancar recursos de amostra existentes que foram coletadas mais de 30 anos e para reproduzir as associações com CRC de um estudo atual. A nossa amostra fecal foi a partir de uma colecção de dois dias, que podem ser mais representativo da microbiota intestinal normal. Nós também foram capazes de utilizar outras fontes de dados existentes para a comparação.

Neste estudo, nós fomos capazes de utilizar todo o genoma shotgun sequenciamento metagenomic para reproduzir uma série de resultados significativos na mesma população que foi avaliada usando 16S rRNA gene seqüenciamento [2]. O presente estudo também reproduziu algumas associações significativas em nível de gene com CRC a partir de um genoma inteiro shotgun estudo metagenomic anterior de pacientes na França [8]. Estudos futuros agrupamento de dados ao longo do tempo, a população eo método de colheita irá ajudar a superar alguns dos problemas de energia estatísticos enfrentam estudos epidemiológicos do microbioma e será a chave para identificar associações importantes que podem estar envolvidos na detecção ou prevenção CRC. Além disso, uma vez que todos os estudos atuais são transversais, é imperativo que os estudos prospectivos de coorte incluem uma coleta de amostra fecal, a fim de estudar o efeito do microbioma intestinal humana em resultados adversos para a saúde, como CRC.

Apoiando informações

Tabela S1. abundância ou detecção de atribuições taxonômicos (ou seja, filo, classe, ordem, família, gênero, espécie determinada, Motu) e categorias de genes (ou seja, gene, módulo, e da via) para a população WGSS DC e da população F.

Cada guia representa um nível taxonômico ou cessão gene específico. A abundância relativa média ou média de detecção (presença /ausência) é apresentado para casos e controles, e o valor de p de um teste de Wald ajuste para idade, sexo e índice de massa corporal (IMC) é fornecido

doi:. 10.1371 /journal .pone.0155362.s001

(XLS)

Reconhecimentos

Este projecto foi apoiado pelo Programa de Pesquisa Intramural do National Cancer Institute. Uma parte da análise dos dados foi a realização de utilizar os recursos computacionais dos Institutos Nacionais de Saúde cluster de HPC Biowulf (https://hpc.nih.gov). GZ, SS, AYV, RH e PB recebeu financiamento através do projeto CancerBiome (referência do projecto Conselho Europeu de Investigação 268.985).

Deixe uma resposta