PLOS ONE: Peptides da Região Variável de anticorpos específicos são compartilhados entre Lung Cancer Patients

Abstract

O diagnóstico tardio do câncer de pulmão ainda é a principal razão para altas taxas de mortalidade no câncer de pulmão. O cancro do pulmão é uma doença heterogénea, que induz uma resposta imune para diferentes antigénios tumorais. Existem vários métodos de auto-anticorpos à procura têm sido descritos que são baseados em painéis antigénio purificado conhecidos. O objetivo do nosso trabalho é encontrar evidências de que partes do de ligação a antigénio do domínio de anticorpos são compartilhados entre pacientes com câncer de pulmão. Isto foi investigado por uma nova abordagem com base na sequenciação de ligação do antigénio-fragmentos (Fab) de imunoglobulinas, utilizando técnicas proteomic sem a necessidade de painéis de antigénio previamente conhecidos. A partir do soro de 93 participantes do ensaio NELSON IgG foi isolada e subsequentemente digerida em fragmentos Fab e Fc. Fab foi purificado a partir da mistura digerida por SDS-PAGE. Os contendo gel-bandas Fab foram excisadas, digeridas tríptico e medidos em um sistema de nano-LC-Orbitrap-espectrometria de massa. A análise multivariada dos dados de espectrometria de massa por análise discriminante canônica linear combinada com regressão logística resultou em um modelo de 12 anticorpo-peptídeo que foi capaz de distinguir pacientes com câncer de pulmão de controles em uma população de alto risco com uma sensibilidade de 84% e especificidade de 90%. Com a nossa Fab-purificação abordagem Orbitrap-espectrometria de massa combinada, encontramos peptídeos a partir da variável de peças de anticorpos que são compartilhados entre pacientes com câncer de pulmão

Citation:. De Costa D, Broodman I, Calame W, Stingl C, Dekker LJM, Vernhout RM, et ai. (2014) Peptides da Região Variável de anticorpos específicos são compartilhados entre pulmão pacientes com câncer. PLoS ONE 9 (5): e96029. doi: 10.1371 /journal.pone.0096029

editor: Sophia N. Karagiannis, do Kings College London, Reino Unido

Recebido: 22 de julho de 2013; Aceito: 03 de abril de 2014; Publicado em: 01 de maio de 2014

Direitos de autor: © 2014 de Costa et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Os autores graças a Roche Diagnostics por sua bolsa de pesquisa irrestrito e NWO (A Organização Holandesa para pesquisa Científica) pelo apoio financeiro (Zenith concessão 93.511.034). Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

Conflito de interesses:. Esta pesquisa foi apoiada em parte pela Roche Diagnostics por uma bolsa de investigação irrestrita. Roche Diagnostics não têm qualquer papel na concepção do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito. Suporte pela Roche Diagnostics não altera a adesão dos autores para todas as políticas de PLoS One sobre os dados e materiais de compartilhamento.

Introdução

O cancro do pulmão é actualmente o cancro mais comum com a maior taxa de mortalidade ( 28%) no mundo devido ao diagnóstico em um estágio avançado. [1], [2] no entanto, com a demonstração de uma redução da mortalidade por câncer de pulmão, 20% até o julgamento NLST (screening julgamento Nacional do câncer) dose de rastreio de baixa CT de pulmão o cancro está a receber cada vez mais interesse. [3] O julgamento NELSON (trial rastreio do cancro do pulmão holandês-belga) mostrou que, após três triagem arredonda 3,6% de todos os participantes do estudo tiveram um resultado tela de falso-positivo. [4] Embora, ainda, aproximadamente, 27% dos participantes foram submetidos a procedimentos invasivos que revelavam doenças pulmonares benignos no exame inicial (primeira rodada julgamento NELSON). [5] Um bom biomarcador (painel) irá reduzir este número de procedimentos invasivos desnecessários. Na selecção momento de indivíduos de alto risco para o rastreio é feito por idade e histórico de tabagismo. Um painel de biomarcador ou biomarcador seria útil na seleção de indivíduos de alto risco para o rastreio CT, pois isso pode detectar câncer de pulmão numa fase mais precoce do que a TC.

Os anticorpos podem ser interessantes como marcadores para distinguir pacientes com cancro do pulmão de Câncer de pulmão indivíduos livres. Esses anticorpos são produzidos pela resposta imune que alvejar os antigénios associados a tumores (TAAs) específicos durante o desenvolvimento do cancro, provavelmente, numa fase inicial [6] -.. [12] Recentemente Liu et

ai

mostraram que a concentração de circulação de auto-anticorpos IgG contra o transportador ABCC3 foi significativamente maior em pacientes com adenocarcinoma do sexo feminino do que nos controles do sexo feminino [13].

Os anticorpos humanos consistem em quatro cadeias, duas cadeias pesadas idênticas e duas cadeias leves idênticas. Cada cadeia leve tem um variável (V

G) e o domínio constante (C

L). As cadeias pesadas têm três diferentes domínios constantes (C

H1, C

H2 e C

H3) e um domínio variável (V

H). As primeiras partes constantes e variáveis ​​formar o fragmento de ligação ao antigénio (Fab). As restantes duas partes constantes da cadeia pesada formam a região Fc. Dentro das seis regiões Fab determinantes de complementaridade (CDR1, CDR2 e CDR3) estão localizados entre os quadros. Estes CDRs determinam a especificidade de antigénio e formar uma superfície complementar de uma forma que faz parte do antigénio. As CDR são regiões hipervariáveis ​​do anticorpo. [14] Os anticorpos ou imunoglobulinas, são moléculas altamente complexos com grandes variações na sua sequência de aminoácidos. A possível diversidade de imunoglobulinas é estimada entre 10

13 e 10

50 e, portanto, a descoberta de sequências idênticas semelhantes ou até mesmo em indivíduos diferentes por acaso é, em teoria, altamente improvável. [14], [15] No entanto, estudos de diferentes grupos de pesquisa demonstraram recentemente que, apesar desta pequena possibilidade teórica ter anticorpos idênticos entre indivíduos, é possível identificar sequências idênticas ou similares [16] -. [19] Um estudo realizado por nós mostrou que no PNS (neurológica paraneoplastic syndrome) pacientes sequências de amino primário de ácido mutadas idênticas de regiões determinantes de complementaridade (CDR) não existem. Estes CDRs são específicos para antígenos onconeural conhecidos, como o HUD e Yo em pacientes PNS, eo mais interessante foram partilhados entre os pacientes PNS diferentes [20].

O objetivo deste estudo é encontrar evidências de que os peptídeos de anticorpos específicos são compartilhados entre pacientes com câncer de pulmão em contraste com indivíduos sem cancro do pulmão. Como o cancro do pulmão é uma doença heterogénea e com a variabilidade de um anticorpo pode ser um desafio para detectar anticorpos relacionados com o tumor idênticos no soro. Nós experimentalmente testar a hipótese de que as regiões altamente variáveis ​​específicas de um anticorpo incluindo as regiões de determinação de complementaridade (CDRs) podem ser compartilhados entre pacientes com câncer de pulmão. A nossa abordagem experimental para verificar essa hipótese baseia-se sequenciar péptidos de anticorpos por espectrometria de massa. Medição de soro por um espectrómetro de massa pode ser muito complexa devido à alta variabilidade como mencionado acima. Purificar IgG Fab a partir do soro irá reduzir a complexidade da amostra de um paciente com câncer de pulmão e lhe dará a possibilidade de se concentrar em frações de anticorpos puros.

Materiais e Métodos

Ética e aprovação legal

o julgamento NELSON foi aprovado pelo Conselho de Saúde holandês, o Ministro da Saúde e pelos Comitês de Ética médica de todos os centros participantes (número de ensaios clínicos ISRCTN63545820). Todos os participantes para este estudo forneceu consentimento informado por escrito para o uso de suas amostras de soro. O doador da amostra de referência utilizado ao longo deste estudo forneceu consentimento por escrito para o uso de sua /seu soro para fins científicos, de acordo com as orientações do Banco de Sangue Sanquin, Rotterdam, na Holanda.

NELSON Julgamento

O julgamento NELSON (trial Rastreio do Cancro do pulmão holandês-belga) começou o recrutamento em 2003 através do envio de questionários a 548,489 homens e mulheres entre 50-75 anos de idade. Os participantes tiveram a ser fumantes ou ex-por pelo menos 25 anos, fumando pelo menos 15 cigarros por dia ou fumar, pelo menos, 30 anos, de fumar pelo menos 10 cigarros por dia. Dos 548,489 machos e fêmeas 15.822 participantes foram incluídos no estudo. Estes participantes foram randomizados para um braço de tela ou controle. O braço de triagem recebeu rastreio CT em anos 1,2 e 4. O braço de controle não recebeu nenhuma triagem (cuidado usual). Os participantes com um resultado positivo foram encaminhados para um pneumologista. Se o câncer de pulmão diagnóstico foi estabelecido o paciente foi tratado e saiu de triagem. Os participantes com um resultado de teste indeterminado foi submetido a uma verificação de acompanhamento de três meses mais tarde. Se um resultado negativo do teste foi obtido o TC segunda rodada foi marcada para 12 meses mais tarde [5], [21].

Estudo da População

Para este estudo, foram selecionados câncer de pulmão 44 casos e 49 controles (Figura suplementar S1) do ensaio de rastreio do cancro NELSON pulmão. [5], [21] Para os casos do conjunto de descoberta, NELSON 1, apenas a fase inicial (I e II) de células escamosas (n = 4) ou adenocarcinomas foram seleccionados (n = 21). Eles foram cuidadosamente combinados para os controles por idade, sexo, tabagismo, duração e número de cigarros fumados por dia, o estado da doença pulmonar obstrutiva crónica (DPOC), exposição ao amianto e local de coleta de sangue (Tabela Suplementar S1). Os critérios de selecção para os casos da NELSON 2 (validação) definido (n = 19) foram semelhantes, exceto que de todos os não-pequenas histologia celular e estádios da doença foram autorizados (Quadro Suplementar S1), a fim de contestar os resultados da fase de descoberta . Por fim, as características clínicas dos pacientes do grupo controle são diferentes com o NELSON 1 conjunto no que diz respeito ao tabagismo e DPOC. Portanto, este conjunto NELSON 2 não está combinado com o conjunto NELSON 1. Usando um conjunto de amostras de validação (NELSON 2) escolhida desta forma, pode ser determinada a robustez do método.

As amostras de soro foram coletadas tanto para NELSON 1 e 2 NELSON obtido a partir de rastreio de base CT (primeira rodada) .

IgG Fab purificação e NanoLC Orbitrap MS Análises

Antes de todos os procedimentos de preparação de amostras, todas as amostras foram cegados e a chave para a desocultação foi colocado à coordenador do banco de dados do ensaio de NELSON. purificação de Fab de IgG e nano LC-MS Orbitrap análises foram realizadas de acordo com o método descrito antes. [22] Para uma descrição mais extensas nos referimos a complementar Métodos S1. Em resumo, a IgG foi isolada a partir do soro e digerida em fragmentos Fab e Fc (Figura 1). A parte Fab foi isolado a partir da mistura digerida por SDS-PAGE. As bandas de gel contendo Fab foram excisadas e digerido triptico. Uma folha em branco de gel que não foi carregado com a proteína foi excisada e tratados como as bandas Fab excisadas para a avaliação de fundo.

Neste fluxograma as diferentes etapas de purificação de Fab, Fab medição e análise de dados são ilustradas. Em amarelo a purificação Fab é mostrado, em azul a medição espectrometria de massa, em verde a análise de dados e na cor rosa a análise estatística.

medições LCMS foram realizadas em um 3000 sistema nano LC final (Thermo Fisher Scientific /Dionex, Amsterdam, Países Baixos) em linha acoplado a um ion trap linear híbrida /Orbitrap MS (LTQ Orbitrap XL; Thermo Fisher Scientific, Bremen, Alemanha). 4 uL do Fab digerido foi carregado para o sistema. Para mais configurações e soluções nos referimos Suplementar Métodos S1 e trabalhos publicados anterior. [22] Todas as amostras foram randomizados antes da medição e foram medidos em lotes de 11 amostras, incluindo uma amostra de referência. Uma amostra de referência foi utilizada como um controlo de qualidade para cada etapa de medição e análise. Uma amostra em branco foi executado no início e final da medição para determinar o fundo ea existência de carry-over durante a cromatografia.

Análise de Dados

arquivos de dados em bruto foram carregados no progênese software ( Figura 1) (Versão 3.1;. Nonlineair Dynamics Ltd, New Castle, Reino Unido) e processos como descrito anteriormente [22] Além disso, foi realizada uma análise progênese onde em vez de detectar características (massas peptídicas (m /z)) em todo o amostras ao mesmo tempo, o programa de software, detecção característica foi realizada individualmente por amostra. Características escolhidas, assim, foram pareados a tabela de resultados do progênese contendo todas as amostras com uma tolerância de massa de 5 ppm. Esta foi uma vantagem, uma vez que muitas vezes apresenta ocorrer com baixas intensidades em uma amostra e são posteriormente acompanhados por progênese em todas as outras amostras. Este resultado em erros relacionados com a fundo se se tiver o respectivo espectro de massa em conta. Com este pequeno ajuste relativo ele garante que uma característica é detectada com maior precisão ao longo das amostras. Os dados adquiridos por esta abordagem foi filtrada usando as mesmas configurações padrão. [22] A matriz de dados separado para cada caso e controle foi gerado consiste de todos os recursos com os correspondentes abundância e tempo de retenção cru. Para gerar uma matriz de dados de grandes dimensões que inclui todos os casos e controles a partir dessas matrizes de dados separados, que procurou massas a partir das matrizes de dados separados por caso ou controlo na matriz de dados completo gerado a partir do padrão analisa progênese. Cada massa tinha de satisfazer três critérios: 1) m /z (± 5 ppm), 2) tempo de retenção (min) ± 1 e 3) de carga idêntica. Se uma massa met estes três critérios a abundância em bruto a partir da matriz completa (gerada por um procedimento geral [22] recomendado pelo fabricante) foi usado. Se uma massa não atender a esses critérios um zero foi gerado pela abundância cru.

espectros MS /MS foram extraídos dos arquivos de dados brutos e convertidos em arquivos compatíveis com o mascote usando extrato de-msn (parte do Xcalibur versão 2.0. 7, Thermo Fisher Scientific Inc.). Mascote (versão 2.3.01; Matrix Science Inc., London, UK) foi utilizado para realizar pesquisas de banco de dados no banco de dados NCBInr subconjunto humano (versão de Março de 11

th, 2009; Homo sapiens restrição espécies; 222,066 sequências) do extraídas Os dados de MS /MS (Figura 1). Banco de dados (NCBInr) a identificação de péptidos dependente e

De Novo

resultados de sequenciamento (picos de software; Versão 5.2; Bioinformatics Solutions Inc., Waterloo, Canadá) foram também incluídos no progênese fornecida matriz. Para configurações usadas para a pesquisa de banco de dados e

de novo

sequenciamento nos referimos a obra publicada anterior e métodos S1. [22] Para

De Novo

sequências até agora não conhecidas a partir de um banco de dados, os picos software identifica uma leucina por o isobárica aminoácidos leucina e isoleucina. resultados de identificação de péptidos dependente de banco de dados ou

de novo de

resultados de sequenciamento foram incluídos na matriz com base na maior pontuação identidade peptídeo (Data S1, S2 Dados e Dados S3). Todas as sequências peptídicas dos casos e controles identificados por Mascot ou picos foram posteriormente alinhada às bases de dados que contêm V, sequências de linha germinal D, J ou C-região derivados de banco de dados IMGT (IMGT, a imunogenética internacionais sistema de informação http: //www.imgt. org), utilizando o algoritmo BLAST (Figura 1). [23] os péptidos com fósforo suficiente (bitscore ≥12.5 e alinhamento marcar ≥70%) para a base de dados da região V foram atribuídos a uma posição na molécula de imunoglobulina com vários comprimentos de CDR (dados S1, S2 e dados dados S3).

ficheiros das amostras de referência de cada conjunto de dados de dados em bruto foram carregados separadamente no software progênese e seguido os procedimentos padrão tal como mencionado acima. Para determinar a percentagem de variação entre as medições de referência das amostras realizados em diferentes pontos do tempo, a mediana R-quadrado foram calculados para cada amostra. Cada amostra foi comparada com todas as outras amostras de referência, medida em que um conjunto de dados e R-quadrado médio foi calculado para cada amostra. A comparação foi baseada na abundância cru de cada recurso. Este foi realizada separadamente para ambos os conjuntos de dados independentes, Nelson 1 e NELSON 2 (Tabela S2a e S2B).

Para determinar a proporção de variação (Figura 1) entre as amostras (casos e controles) dos dois conjuntos de dados separados , os mesmos cálculos foram realizados como descrito acima para cada caso e controlo de exemplo. Esta análise foi realizada separadamente para os dois conjuntos de dados (Tabela S2C e S2D). Com base na distribuição do R-quadrados medianos de cada amostra, decidimos estabelecer um ponto de corte na r-quadrado 0,70. Os casos e controles que obtiveram um r-quadrado médio abaixo de 0,70 foram excluídos do conjunto de dados e análises posteriores. Os cálculos foram realizados utilizando o Microsoft Excel 2007.

Análise Estatística

Dois conjuntos de dados independentes têm sido utilizados, NELSON 1 e NELSON 2. O passo inicial na análise estatística consistiu em testes de normalidade utilizando assimetria e características de distribuição de curtose sobre a intensidade da abundância em bruto das características [24].

Subsequentemente, foi realizada análise univariada, aplicando, quer um teste t não emparelhado (paramétrico) ou um teste-U de Mann-Whitney ( não paramétrico) para detectar diferenças significativas na abundância em bruto entre casos e controles no conjunto NELSON 1. [25] o limite de significância foi fixado em 0,05 (frente e verso). Todas as características identificadas que foram encontrados significativamente diferentes foram utilizados para a seleção de recursos para distinguir pacientes com câncer de pulmão de controles.

Em segundo lugar, foi utilizado para a análise multivariada apenas os recursos significativamente identificados que tinham ≥2 desencadeada MS espectros. Nós aplicamos uma análise multivariada sobre os recursos que cumprem estes critérios com um (logística) modelo de regressão (y = a

1 × 1 + a

2 × 2 + a

3 × 3 … .a

nx

n + c) em combinação com análise discriminante linear canônica (Tabela S3a). [26], [27] Isto resultou em uma combinação de características com alta sensibilidade e especificidade no conjunto de dados NELSON 1. Esta combinação de características foi então testado no conjunto de dados NELSON 2 utilizando a mesma metodologia tal como descrito acima. [26], [27] Note-se que para o NELSON 2 conjunto de dados foi necessário optimizar os coeficientes na equação do modelo, a fim (Tabela S3B ) para optimizar a sensibilidade e especificidade no conjunto de dados NELSON 2.

para evitar um efeito de erro aleatório na modelagem, verificou-se a base estatística da combinação de recursos em um conjunto de dados permutado. A avaliação do fundo consistiu no mesmo fluxo de trabalho utilizado para a construção de modelos, exceto que no início de atribuição dos processos e controles de NELSON 1 foram permutadas (Figura S2). Esta permuta foi realizada doze vezes e os resultados obtidos foram testados para a significância contra o resultado por modelo Z-teste (unilateral; p 0,05). Uma vez que a construção do modelo foi baseado nos dados fornecidos como em Nelson 1, após o que a validação deste modelo foi feita usando os dados em Nelson 2, a mesma abordagem foi feita depois de cada permutação indivíduo. Também aqui, note que para NELSON 2 dataset os coeficientes na equação do modelo foram otimizados.

Todas as análises na construção do modelo, validação e fundo de avaliação foram feitas usando STATA, versão 12 (StataCorp, Texas, EUA). Ao longo do estudo, usando o teste de dois lados (excepto para um lado de testes para valores de Z), foram considerados os valores de p de 0,05 ou inferior como sendo estatisticamente significativo. As análises estatísticas dos dados mostrados na Tabela S1 foram gerados através do programa SPSS (SPSS IBM Estatística 20). O tempo para o câncer foi gerado pelo cálculo do intervalo entre as amostras de sangue e diagnóstico para cada caso.

Resultados

características clínicas da População do Estudo

Não houve diferença significativa na as características clínicas entre os casos e controles no NELSON 1 set (Tabela S1). No conjunto NELSON 2, estado fumante e DPOC ou ex-diferiu significativamente entre os casos e controles (Tabela S1). Em 72% e 84% dos casos do conjunto NELSON 1, e NELSON 2 set, respectivamente, o intervalo de tempo entre a coleta de sangue e diagnóstico de câncer de pulmão foi entre 0-1,5 anos. A mediana de duração de acompanhamento após a coleta de sangue foi para a população de controlo 1925 dias (intervalo 1075-2086 dias) e 1861 dias (intervalo 347-2135) na NELSON 1 set e NELSON 2 set, respectivamente. Nenhum dos controles desenvolveram câncer de pulmão durante o período de acompanhamento.

Variação Técnico

Durante as medições de espectrometria de massa de amostras biológicas medimos uma amostra de referência em diferentes pontos de tempo. valores R-quadrado foram calculados a partir das abundâncias de proteínas identificadas em cada medição de referência para mostrar reprodutibilidade técnica. O valor de R-quadrado menor observado nas diferentes medidas variaram entre 0,84 e 0,93 (Figura 2).

Exemplo de Referência medidos em diferentes pontos de tempo durante a medição do conjunto de amostras NELSON 1. Uma repetição da amostra de referência (eixo x) foi comparado com cada outra amostra replicado com base na abundância em bruto de cada recurso. Um valor de R-quadrado foi calculado. Cada ponto representa um valor de R-quadrado (eixo-y) para a comparação de que replicam específica com outra réplica. Para cada replicar o desvio médio r-quadrado e padrão (SD) é mostrado.

Foi realizado o mesmo cálculo r-quadrado para 5 amostras biológicas aleatórias retiradas do conjunto NELSON 1 que foram medidos em dois LC-diferentes colunas (mesmo lote) a diferentes pontos de tempo. A reprodutibilidade técnica dentro de cada coluna resultou em valores mais baixos de R-quadrado que vão ,75-,93, mas a reprodutibilidade técnica das cinco amostras biológicas medidos em duas colunas similares independentes foi menor. Para as duas colunas similares independentes foi observada uma média de R-quadrado de 0,52. Na Figura 3, a correlação entre cada uma das amostras e entre as colunas são mostrados.

Este dendrograma mostra a correlação entre as cinco amostras biológicas diferentes medidos em duas colunas diferentes de mesmo lote, coluna 1 e coluna 2 (eixo y). No eixo dos y das cinco amostras diferentes são mostrados. Amostra 1-5 são medidos na coluna 1 e 6-10 são medidos em coluna 2. Amostra 1 e 6 são do mesmo indivíduo. Isto também se aplica para a amostra 2 e 7, 3 e 8, 9 e 4 e 5 e 10. No eixo dos x a distância Euclidiana entre cada uma das amostras é mostrado. A forte correlação por coluna é encontrada

Na Figura 4A os tempos de retenção são mostrados para os peptídeos identificados com alta confiança (pontuação Mascot 60). Nas amostras de referência, medida simultaneamente com ambos NELSON 1 e NELSON 2. Esta figura mostra que o desempenho da coluna foi comparável entre as duas colunas LC diferentes para estes péptidos abundantes (R-quadrado 0,996). Além disso, as abundâncias observadas para estes correlacionados péptido também bem (Figura 4B; R-quadrado 0,995). Isto sugere que ambos cromatografia e espectrometria de massa realizada nominalmente, pelo menos para os péptidos identificados com confiança elevada em abundância relativamente elevada. Assim, a variação técnica vemos decorre principalmente de peptídeos em abundâncias inferior, mais próximo dos limites de detecção (Figura S3).

Para amostras de referência que foram medidos durante tanto NELSON 1 e NELSON 2, comparamos os péptidos que eram identificados com alta confiança por uma busca Mascot com um resultado de mais de 60 em ambos os conjuntos. Para este subconjunto de péptidos, foram comparados os tempos de retenção observados em Nelson 1 e Nelson 2 (A) e também a sua abundância (B). Para esses parâmetros observou-se valores de r-quadrado de 0,996 e 0,995, respectivamente.

Uma estimativa da variação biológica foi realizada e resultou em uma mediana r-quadrado de 0,43. Este resultado foi muito menor do que a menor r-quadrado (0,84) observado para a variação técnica. Portanto, a variação biológica é mais elevada em comparação com a variação técnica.

Estes resultados mostram que a variação da técnica devem ser tomadas em consideração e é necessário um ajustamento para a comparação de conjuntos de amostras medida independentemente desde que o conjunto de dados NELSON 1 e 2 foram NELSON medido em duas colunas diferentes em diferentes pontos de tempo. Para superar esta variação técnica, aplicou-se uma série de filtros dos dados antes que pudesse começar uma análise de dados, tal como descrito no Material seção de métodos.

Com esses dados foi realizada a análise univariada separados em todos os peptídeos encontrados nos casos e controles do conjunto de dados NELSON 1 e 2 NELSON separado. Fomos capazes de observar 49 peptídeos que foram significativamente diferentes entre os casos e controles no conjunto de dados NELSON 1. No entanto, estes péptidos, com uma exceção, não apresentaram esta diferença no conjunto de dados NELSON 2. Não houve tendência observada (r-quadrado 0,004) em p-valores para os dois conjuntos de dados. Portanto, testando univariada dessa maneira era ou não a estratégia de análise direita ou os recursos selecionados aleatoriamente processo gerado (oportunidade). Portanto, os peptídeos significativas de NELSON 1 foram analisados ​​como um próximo passo de forma multivariada.

Antibody Peptídeo Modelo

Uma combinação ideal de 12 péptidos foi identificado pelas estatísticas multivariadas utilizadas na NELSON 1 set (conjunto de descoberta). Esta combinação de peptídeos podia distinguir pacientes com câncer de pulmão de controles com sensibilidade e especificidade de 96% e 100%, respectivamente. Este modelo peptídeo anticorpo foi capaz de detectar o cancro do pulmão 373 dias em média (intervalo 39-1193 dias) antes do diagnóstico foi determinado. Na Figura 5 mostra-se que a combinação dos 12 péptidos foi capaz de distinguir os casos a partir de controlos. Os 12 péptidos correspondia a uma sequência de sobreposição com a região CDR2, uma sequência de sobreposição região CDR3, 7 sequências que se sobrepõem a região do Quadro 1 e 3 sequências que se sobrepõem com a região do Quadro 3 de acordo com a base de dados IMGT (Tabela 1).

as abundâncias matérias são preenchidos na equação do modelo (y = a

1 × 1 + a

2 × 2 + a

3 × 3 … .a

nx

n + c ) do conjunto de amostras relevantes. No eixo y (em unidades arbitrárias) os valores gerados pela equação são mostrados.

Foi realizada uma validação externa na (validação) Conjunto NELSON 2. Quando aplicamos o mesmo modelo 12 peptídeo a este conjunto, casos e controles não podia mais ser distinguidos. No entanto, com os mesmos péptidos, mas após a re-optimização dos coeficientes do modelo, observou-se uma sensibilidade e uma especificidade de 84% e 90%, respectivamente. Como os coeficientes da equação são ajustados tivemos para verificar se há a chance de overfitting dos dados. Portanto, uma avaliação de fundo foi realizada a qual será descrita mais tarde. Dentro da validação NELSON 2 definir a combinação de peptídeos foi capaz de detectar o cancro do pulmão 281 dias em média (intervalo de 54-777 dias) antes do diagnóstico de câncer de pulmão.

Nós comparamos a abundância bruto dos 12 peptídeos entre os dois conjuntos de dados Nelson. Observou-se que a abundância média bruta de cinco peptídeos foi maior nos casos em comparação com a abundância média dos controles do conjunto de dados NELSON 1. Estes dados foram consistentes com as descobertas da NELSON 2 conjunto de dados (Tabela S4). Os outros sete peptídeos tiveram uma abundância crua média mais elevada nos controles do conjunto de dados NELSON 1 em comparação com a abundância nos casos desse conjunto de dados. Por apenas um desses sete peptídeos, essa diferença pode ser confirmado no NELSON 2 conjunto de dados (Tabela S4).

Avaliação do fundo de Anticorpo Peptídeo Modelo

Além da constatação da combinação ideal de peptídeos que se distinguem significativamente os casos de controles, foi realizada uma análise de fundo. Como os coeficientes da equação do modelo foram ajustados para cada conjunto de dados, verificamos os resultados para uma contribuição de seleção aleatória dos dados e, assim, a chance de encontrar um modelo comparável por acaso. O mesmo fluxo de trabalho foi aplicado para a construção do modelo, exceto que no início do fluxo de trabalho dos casos e controles de NELSON 1 foram permutadas aleatoriamente (Figura S2). Descoberta foi realizada nos 12 vezes permutados NELSON 1 conjuntos de dados, cada vez com 12 péptidos diferentes mostrando o menor valor de p (p 0,05) no conjunto NELSON 1 para que permutação particular. Validação dos modelos foi realizada em Nelson 2. O desempenho do modelo multivariado os conjuntos de descoberta permutados (NELSON 1) é mostrada na Figura 6A (pontos azuis) em que a sensibilidade é representada graficamente contra a especificidade. A energia correspondente dos conjuntos de validação (Nelson, 2) é mostrado na Figura 6B (pontos azuis). Assim, cada ponto na Figura 6A (ponto azul) corresponde com um ponto (ponto azul) na Figura 6B. Além disso, o desempenho encontrado para os conjuntos de dados reais em que o modelo de péptido anticorpo foi encontrado é representada graficamente (ponto vermelho). Pode-se observar que a instalação multivariada dos conjuntos de dados permutados produz modelos razoáveis, mesmo para os dados permutados no conjunto de descoberta.

Doze vezes uma permutação (fundo) foi realizada no NELSON 1 e 2 NELSON conjunto de dados. A sensibilidade e especificidade do modelo de peptídeo anticorpo são mostrados em vermelho. avaliação de fundo: A) Doze permutação corridas são mostrados com a sensibilidade correspondente e especificidade do NELSON 1 conjunto de dados (azul). Os mesmos 12 péptidos encontradas na avaliação de NELSON um fundo foram testadas em Nelson 2. B) As pistas 12 são mostrados com a correspondente sensibilidade e especificidade de NELSON conjunto de dados 2 (azul). Note-se, como alguns resultados da análise de fundo ocorreu mais de uma vez, um número aleatório entre 1 e 1 foram adicionados a cada número de sensibilidade e especificidade para assegurar que cada análise (ponto azul) pode ser visto na figura.

no entanto, em especial nos conjuntos de dados de validação, os dados reais (modelo péptido anticorpo) tiveram um desempenho significativamente melhor (p 0,05) do que os conjuntos de dados permutados, o que sugere que os péptidos de imunoglobulina abrigar informação relacionada com o estado de doença do paciente. Assim, os resultados obtidos não resultam de um artefato no processamento de dados.

CT Resultado Screening em NELSON 1 e NELSON 2 Conjunto de Dados

Na Figura 7A e 7B os resultados de rastreio da linha de base tomografias são mostrados para o conjunto NELSON 1 e NELSON 2, respectivamente. De acordo com o protocolo de triagem do estudo NELSON, uma varredura de repetição CT foi realizada seguindo um resultado de triagem indeterminado, cerca de 3 meses depois.

Resultados da tomografia computadorizada do A) NELSON 1 e B) NELSON 2 conjuntos de amostras são mostrado no momento da coleta de sangue (base). Além disso, os resultados CT são mostrados do follow-up CT varredura após cerca de três meses (follow-up). Para um caso do NELSON 1 set sem CT resultado do exame de Acompanhamento estava disponível. A última linha representa o número de resultados de varredura CT positivos, indeterminados e negativos da linha de base, incluindo resultados de acompanhamento.

Foi observado que 68% dos casos tiveram um resultado de triagem positivo tanto no NELSON 1 e NELSON 2 set durante os primeiros 3 meses do programa de rastreio, os outros tipos de câncer de pulmão foram diagnosticados após outra verificação de repetição CT após 3 meses ou durante a segunda triagem rodada. Depois de, em média, 367 dias (intervalo 39-1193 dias) para NELSON 1 e 269 dias (intervalo 54-777 dias) para NELSON 2, o resultado do rastreamento foi positivo, ou seja suspeito para câncer de pulmão e resultando em clínica work-up pelo pneumologista

Deixe uma resposta