PLOS ONE: proteômica Biomarkers para a Doença Pulmonar Aguda intersticial em Gefitinib-Tratada japonesa Lung Cancer Patients

Abstract

A doença pulmonar intersticial (DPI) eventos foram relatados em câncer de pulmão de não-pequenas células japonês (NSCLC) pacientes tratados com inibidores da tirosina-cinase EGFR. Nós investigamos biomarcadores de proteômica para idéias mecanicistas e melhor predição de DIP. plasma foi colhido sangue de 43 pacientes com NSCLC tratados com gefitinib em desenvolvimento ILD aguda (confirmada por análise de diagnóstico cego) e 123 controles selecionados aleatoriamente em um estudo caso-controle aninhado dentro de um estudo de coorte farmacoepidemiológico no Japão. Geramos medições ~ 7 milhões em tandem espectrometria de massa (MS /MS) com amplo controle de qualidade e validação, produzindo um dos maiores conjuntos de dados de câncer de pulmão proteômica até à data, incorporando design rigoroso estudo, definição do fenótipo, e avaliação de processamento da amostra. Após o alinhamento, escala e ajuste lote de medição, foram identificados 41 picos de péptidos que representam 29 proteínas melhor prevendo ILD. peptídeo multivariada, proteína, e modelagem via alcançado previsão ILD comparável com variáveis ​​clínicas previamente identificados; a combinação dos dois forneceu algumas melhorias. A via de resposta de fase aguda foi fortemente representado (17 de 29 proteínas, p = 1,0 x 10

-25), o que sugere um papel chave com utilidade potencial como um marcador para o aumento do risco de eventos agudos com DIP. Validação por Western blot mostrou correlação para proteínas identificadas, confirmando que os resultados robustos pode ser gerada a partir de uma plataforma de MS /MS implementar rigoroso controle de qualidade

Citation:. Nyberg F, Ogiwara A, Harbron CG, Kawakami T, K Nagasaka , Takami S, et al. (2011) proteômica Biomarkers para intersticial doença pulmonar aguda em Gefitinib-tratados japoneses pulmão pacientes com câncer. PLoS ONE 6 (7): e22062. doi: 10.1371 /journal.pone.0022062

editor: Scott A. Coonrod, Universidade de Cornell, Estados Unidos da América

Recebido: 28 Março, 2011; Aceito: 14 de junho de 2011; Publicação: 20 de julho de 2011

Direitos de autor: © 2011 Nyberg et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Este estudo foi financiado pela AstraZeneca e realizado em colaboração por pesquisadores da Academia, AstraZeneca e Medical Proteoscope Company. Todas as partes colaboradoras participaram do desenho do estudo, coleta de dados e análise, decisão de publicar, e preparação do manuscrito

CONFLITO DE INTERESSES:. FN, CGH, ISP, MCS e IGC são funcionários da AstraZeneca e acções próprias em a empresa. AO, TK, K. Nagasaka, ST, KW, HKT, MO, Y. Kyono, TD, Y. Komatsu, MK, SA, e TN são /foram empregados de Medicina Proteoscope Co., Ltd. TH é um funcionário da Chiesi Farmaceutici. TH e GMV são empregados anteriores da AstraZeneca. MF recebeu honorários da AstraZeneca. K. Nakata, YO, SK, e HK têm declarado que não há conflitos de interesse existe.

Introdução

doença pulmonar intersticial (DPI) afeta o parênquima pulmonar ou região alveolar [1]. Quando associado com o tratamento medicamentoso, pode apresentar precipitadamente como dano alveolar difuso aguda (DAD), às vezes com um resultado fatal [2]. Os pacientes muitas vezes têm aparência ‘chão de vidro “graves falta de ar e de radiologia torácica shows. Nenhum tratamento específico está disponível, mas a terapia de suporte inclui oxigênio, corticosteróides ou ventilação assistida. eventos ILD agudas podem desenvolver

de novo

, mas uma condição crônica ILD existente aumenta o risco consideravelmente [3], como observado em estudos recentes de pacientes com fibrose pulmonar idiopática (FPI), a forma crônica mais comum [4 ].

ILD, especialmente IPF, é uma co-morbidade conhecida em pacientes com cancro do pulmão de células não pequenas-(NSCLC) [5]. eventos ILD aguda têm sido relatados com muitas terapias de câncer de pulmão em taxas de até ~ 10% [6] – [11]. ILD é reconhecido como mais comuns no Japão do que em outros lugares, tanto na população e entre os pacientes com NSCLC [5], [6], [12], [13], embora não esteja claro o porquê.

tirosina EGFR inibidores da cinase (TKI) são um tratamento estabelecido para NSCLC avançado. Ao contrário de muitas quimioterapia, eles são tipicamente bem tolerado e sem efeitos secundários citotóxicos. O gefitinib EGFR TKI (IRESSA) foi aprovado em 2002 no Japão para o tratamento de NSCLC avançado. Embora alguns eventos do tipo DPI foram observadas em ensaios clínicos e uso clínico compassivo, somente após a aprovação fez um número crescente de notificações espontâneas para ILD aparecem no Japão como a droga tornou-se mais amplamente disponível.

Nesse ponto, melhor foi urgentemente necessária compreensão do ILD: incidência de base sobre tratamentos diferentes, fatores de risco e a associação potencial de gefitinib com o risco de DIP. Uma equipe acadêmica independente em conjunto com cientistas da AstraZeneca, portanto, concebido e realizado uma coorte e caso-controle estudo farmacoepidemiológico de DPI em pacientes com NSCLC japoneses tratados com gefitinib ou quimioterapia, com resultados clínicos relatado anteriormente [3]. Como um componente sub-estudo exploratório, os pacientes que receberam gefitinib (ambos os casos ILD subsequentes e pacientes do grupo controle) foram amostrados para proteômica do plasma, com dois objetivos principais: 1) para identificar preditores de proteómica de ILD que possam vir a ser desenvolvidos em uma medicina personalizada de diagnóstico para identificar pacientes com maior risco de DIP; 2) aumentar a compreensão dos mecanismos subjacentes ao desenvolvimento de eventos ILD agudas.

Usando uma abordagem biomarcador múltiplos tais como a proteômica (o estudo simultâneo de grandes partes do proteoma humano para dar uma visão global da expressão diferencial de proteínas no sangue ou tecido), em vez de simplesmente um biomarcador único convencional, potencialmente aumenta o poder preditivo tanto através do aumento da robustez decorrentes de medições múltiplas e a oportunidade de combinar informações de vários processos biológicos. Para apoiar a produção dessas informações de alta qualidade, combinados em uma nova maneira de vários componentes do estudo-chave: design robusto estudo, as definições fenotípicos bem definidos, os procedimentos de coleta de amostra cuidadosas, cromatografia estável avançada líquido (LC) espectrometria de massa -tandem (MS /MS) à base de separação e detecção métodos peptídicos, análise estatística incorporando informações proteômica e clínica, métodos rigorosos para anotação de proteínas de banco de dados de picos peptídicos detectados e interpretação biológica usando software de mineração de literatura, além de controle de qualidade extensiva e validação, relatados abaixo.

Resultados

Características da população do estudo

a coorte não randomizado incluiu 3.166 pacientes japoneses com avançado /recorrente NSCLC que foram seguidos durante 12 semanas após o início gefitinib (n = 1.872 períodos de tratamento ) ou a quimioterapia (n = 2551). A partir do sub-coorte tratados com gefitinib, 103 casos suspeitos ILD (79 posteriormente confirmados e 24 rejeitados pelo caso Board Review [CRB]), assim como 252 controles, foram registrados no estudo de caso-controle. amostras proteômicas para esta sub-estudo foram disponível a partir de 43 casos confirmados ILD, 123 indivíduos do grupo controle, e 15 casos ILD inicialmente diagnosticados rejeitou-CRB (Tabela 1). As características clínicas dos casos e controles são descritos na Tabela S1.

A análise exploratória de dados de LC-MS /MS obtidos em condições de qualidade controlada revela grande variação de lote que precisa ser controlada em análises estatísticas posteriores

avaliação da qualidade do processamento de amostras e geração de dados

Depois de esgotamento imunoafinidade, mantendo-se a albumina sérica foi 8% para todas as amostras 181 basais (Tabela S2). A hidrólise tríptica subsequente resultou em uma porção da proteína não digerida restante variando de 3,0% a 32,3% (média 15,3%) (Tabela S2). A variação nestas etapas de processamento era independente do estado caso /controlo (dados não apresentados).

medições LC-MS /MS para as 181 amostras de linha de base individuais foram realizadas em 11 lotes, com 19 e 20 amostras de lotes 1 e 3 repetidas em lotes 10 e 11, respectivamente (Tabela 1), resultando em 220 proteómica medições discretas. Quatro dos 11 lotes inicialmente não preenchia os critérios de controlo de qualidade (coeficiente de variação [CoV] 20% para qualquer um dos seis péptidos de controlo entre as três amostras de controlo no interior do lote) no primeiro ciclo de medição, mas passados ​​os critérios em medição repetida. Um resumo dos ensaios descontínuos aceitáveis ​​controlo de qualidade é dada na Figura 1A.

(a) Reprodutibilidade de 6 picos de controlo para as amostras de controlo de qualidade padrão de 3, representada graficamente como ‘+’, em cada lote de análise (intensidade de pico, eixo esquerdo). Os coeficientes de variação (%, eixo direito) entre as amostras de controlo 3 de cada lote são representados como pontos ligados por uma linha. (B) A reprodutibilidade das intensidades de peptídeos durante 39 amostras com análises duplicadas em lotes diferentes de análise. correlação parcial, após a remoção entre as diferenças de lote, conspiraram contra a intensidade normalizada média para cada peptídeo. peptídeos de maior intensidade mostrar alta reprodutibilidade em suas intensidades entre lotes repetidas.

Figura 1B mostra um gráfico das correlações parciais entre as amostras duplicadas em lotes 1 e 10, 3 e 11, após permitir qualquer efeito lote , contra a intensidade normalizada média ao longo do conjunto de amostras completo para cada sinal. Peptídeos com intensidades médias mais elevadas apresentam maior reprodutibilidade entre lotes como evidenciado por geralmente elevadas correlações parciais.

análise exploratória de dados de intensidades de sinal de MS.

Em seguida, usamos uma análise de componentes principais (PCA) para explorar os dados de modo a identificar as maiores fontes de variação. Figura 2A mostra um gráfico desta análise, com cada amostra de cor de acordo com o lote. As medições a partir do mesmo lote tendem a se agrupar em conjunto, separado de outros lotes, o que implica que as maiores diferenças entre as amostras surgir a partir do processamento em lote-wise.

(A) Lote de dois primeiros componentes principais da análise PCA da dados de proteômica completos de todos os lotes 11 de análise (numeradas de 1-11 na sequência de tempo). Cada amostra é representada por um único ponto, com a gama de pontos dentro de cada lote a ser mostrado por um polígono que une os pontos extremos, em que o lote. (B) A parcela dos dois primeiros componentes principais para os lotes repetidos de amostras (1 e 10, 3 e 11). As amostras individuais estão representadas por uma linha, que liga as duas repetições em diferentes lotes. (C) Reprodutibilidade de um exemplo diferencialmente expressos peptídica entre duas execuções em lotes duplicados de análise proteômica. As intensidades dos primeiro e segundo, de cada uma das amostras replicadas são representados graficamente contra o outro. Amostras coloridas por lote (lote 1 repetida como lote 10 – azul; lote 3, repetido como lote 11 – vermelho). Permitindo a entre-sequência diferenças há uma boa correlação entre execuções replicadas.

Figura 2B mostra os resultados da PCA sobre os pares de lotes repetidas (1 e 10, 3 e 11), com amostras duplicadas unidas por uma linha, representada graficamente contra os dois primeiros componentes principais. As linhas são geralmente horizontal e paralela, novamente sugerindo que a maior fonte de variabilidade ou as maiores diferenças globais em perfis entre amostras (primeiro componente principal) refere-se a variabilidade inter-grupo, e que a ordenação das amostras no segundo componente principal, isto é, na próxima maior fonte de variabilidade ou diferenças gerais entre as amostras, está em forte acordo entre os lotes repetidas. Depois de permitir que as diferenças consistentes entre os lotes, estes resultados confirmam assim que as diferenças inter-amostra são reproduzíveis com o método utilizado.

Considerando que figura 2B compara resultados resumidos sobre todos os péptidos medidos, Figura 2C mostra os resultados de execução repetidas para um exemplo péptido. Embora existam grandes diferenças entre os lotes, dentro de cada lote há uma alta correlação entre as intensidades para o mesmo assunto em corridas em duplicado. Dos 41 picos de péptidos expressos diferencialmente utilizados para identificar as proteínas listadas na Tabela 2, 25 (61%) mostram uma correlação parcial depois de remover o efeito de lote maiores do que 0,8 e todas mostram uma correlação parcial superior a 0,35.

claras diferenças nos padrões de peptídeos e proteínas entre casos e controles ILD

As análises subsequentes destinadas a identificar peptídeos e proteínas que efetivamente discriminados entre casos e controles, tão rejeitado casos foram agora excluídos. amostras repetidas em lotes 10 e 11 foram excluídos, e dadas as grandes diferenças entre os lotes identificados nas análises exploratórias, o tema de controle medido em lote 10 também foi excluído, deixando 43 casos confirmados ILD e 122 controles com uma medição de amostra cada.

Identificação de discriminar os péptidos e proteínas.

a Figura 3 mostra os resultados do univariada (péptido indivíduo) analisa usando análise de covariância (ANCOVA), apresentado como histogramas dos valores de p para a comparação entre casos e controles. Permitindo a lote como uma covariável análise, para remover a variação inter-lote, aumenta substancialmente a potência da análise, identificar aproximadamente o dobro de péptidos que mostram expressão diferencial estatisticamente significativa no nível de 5%. Figuras S1 e S2 explorar e explicar essa relação de forma mais detalhada. Além disso representando a ordem dentro do lote diminui apenas ligeiramente o número de peptídeos significativas, sugerindo que qualquer efeito de ordem dentro do lote é marginal e tenta modelar ele não vai aumentar o poder.

A figura mostra o efeito sobre o distribuição de valores de p para a expressão diferencial de incluir informação de processamento de análise e variáveis ​​clínicas.

por outro lado, permitindo variáveis-chave clínicos (OMS estatuto [PS] desempenho, história de tabagismo, grau de normalidade cobertura de pulmão na tomografia computadorizada, e da gravidade da ILD pré-existente) na análise consistentemente reduziu o número de peptídeos sendo detectado como diferencialmente expressos, refletindo que grande parte da informação transportada nos peptídeos mais significativas é a duplicação de informação transportada pelas variáveis ​​clínicas ( A Figura 3). Figura S3 mostra um exemplo deste, em que os níveis mais elevados de o péptido, maior pontuação estado de desempenho e o estado caso estão associados um com o outro, e a maior parte do aumento da intensidade do péptido dos casos em comparação com os controles podem ser explicados pela sua associação com maior pontuação de desempenho, de modo a intensidade peptídeo está acrescentando muito menos informações quando consideradas em combinação com esta variável clínica.

com base no valor-p, as 100 maiores picos de ambas as análises, incluindo e excluindo variáveis ​​clínicas foram identificado. Estes picos foram subsequentemente restrito a 41 de acordo com os seguintes critérios: 1) tempo de retenção LC normalizada entre 5 e 75 minutos, e 2) verificação completa

m /z

valor do ião precursor de entre 450 e 1.500. Em seguida, as identificações de péptidos compreendidos nos 41 picos de péptidos foram seleccionados utilizando os seguintes critérios: 1) um ião Mascot marcar mais do que o valor limiar determinado de identidade com a sequência de aminoácidos do péptido indivíduo; e 2) 3 amostras com o péptido de identificação correspondente. Isto resultou em 45 identificações peptídicos válidos a partir de 28 dos 41 picos, incluindo dois péptidos da lisozima cravada (Tabela S3). Os 43 péptidos derivados de plasma representado 27 identificações distintas com 2 identificações duais de proteínas intimamente relacionados, para um total de 29 proteínas. Elas estão listadas na Tabela 2, com mais detalhes sobre a sua identificação apresentados na Tabela S3.

resposta de fase aguda identificada como uma importante via propensos a se envolver em eventos ILD agudas

Este conjunto de proteínas Utilizou-se então na interpretação biológica analisa, utilizando o sistema de Engenho Pathway Analysis (IPA). A via mais significativo encontrado quando sobrepondo as proteínas sobre as vias canônicas Ingenuity-curadoria foi a via de sinalização resposta de fase aguda, com o qual 17 dos 29 proteínas poderia estar associada (p = 1,0 × 10

-25). Outras vias que mostram uma sobreposição com a lista de proteínas incluídas a cascata do complemento e coagulação, mas os valores de p foram menos significativos devido ao menor número de proteínas envolvidas (Figura 4).

As vias mais significativas a partir de uma análise ligando os identificados 29 proteínas a partir do estudo de vias curadoria no sistema Engenho pathway Analysis são apresentados, ordenados de acordo com a razão entre o número de marcadores de proteína que podem ser associados com a via e o número de proteínas na via.

Ao entrar nas 29 proteínas em IPA, 5 redes foram formadas. A rede 24 contém mais significativa das proteínas 29 (Figura 5). As proteínas adicionadas à rede pela ferramenta para ligar as proteínas marcadoras incluem IL-1 e NF-kB, o que sugere que estas proteínas podem também estar envolvidos na geração do padrão observado. Combinando as duas redes com as maiores pontuações acrescenta IL1-beta, HNF1A, HNF4A, HNF6 (ONECUT1) e CEBPB como componentes centrais (Figura S4).

Maior rede de pontuação gerada a partir de entrar nas identificados 29 proteínas em o sistema Ingenuity Pathway Analysis, com as proteínas identificadas no estudo sombreada proteínas cinza e conexão identificadas por Ingenuity Análise via não-sombreada. formas azul escuro e linhas = proteínas identificadas como preditores neste estudo e as interações entre eles. formas e linhas cinzentas = proteínas identificadas pelo engenho para gerar a rede e as interações entre eles. linhas azul claro = interações entre proteínas identificadas pelo engenho para gerar a rede e as proteínas identificadas no estudo. Figura S4A mostra esta figura com as relações de interacção rotulados. As proteínas identificadas no estudo e incluídos na rede: SERPINA1 = alfa-1-antitripsina; SERPINA3 = alfa-1-antiquimotripsina; SERPINC1 = antitrombina-III; APOA1 = apolipoproteína A-I; APOB = apolipoproteína B-100; APOC3 = apolipoproteína C-III; C3 = complemento C3; C4A, C4B = complemento C4-A; complementar C4-B; C9 = componente do complemento C9; GSN = gelsolina; HBA2 = hemoglobina alfa; HBB, HBD = hemoglobina beta /delta; HP = haptoglobina; HPR = proteína relacionada com a haptoglobina; HRG = glicoproteína rica em histidina; KLKB1 calicreína = plasma; região III V da cadeia kappa IGKC = Ig Ti; RBP4, RBP = proteína 4 ligadora de retinol; APCs = soro amilóide P-componente; TF = serotransferrin; TTR = transtirretina. As proteínas identificadas no estudo e não incluídos na rede: ORM1 = glicoproteína alfa-1-ácido 1; A1BG = alfa-1B-glicoproteína; LRG1 = ricas em leucina alfa-2-glicoproteína; ARMC2 = tatu repetição contendo proteína 2; AHSG = alfa-2-HS-glicoproteína; ITIH4 = inibidor de inter-alfa-tripsina cadeia pesada H4.

A validação dos dados MS /MS mostra boa reprodutibilidade e razoável acordo com a Western blot

Dentro da plataforma de MS /MS lá era forte concordância entre corridas em duplicado das mesmas amostras depois de permitir que para efeitos de lote, conforme descrito acima (Figura 2C).

Validar com outro método, a Tabela 2 mostra a correlação nas intensidades derivado da MS /MS e Western blotting (WB) para uma selecção de proteínas 9. Considerando que a WB tem como alvo a proteína intacta, enquanto que o presente MS /MS pode detectar peptídeos derivados das proteínas intactas, estas 9 proteínas mostram bastante forte nível de concordância entre as tecnologias, com 6 dos 9 proteínas que exibem uma correlação superior a 0,7 . Scatterplots comparando as intensidades de proteína MS /MS e WB são mostrados na Figura S5 e as imagens WB na Figura S6.

predição de DIP utilizando proteínas e clínicas de dados

fenótipo modelagem baseada em múltiplos marcadores peptídicos .

a Figura 6A mostra o poder preditivo baseado em leave-one-out de validação cruzada, para modelos construídos utilizando uma gama de diferentes números de péptidos em combinação. melhorias substanciais na previsão aleatória foram obtidos a partir de apenas alguns peptídeos, e aumentando o número de peptídeos ainda não melhorou substancialmente as previsões do modelo. O poder preditivo do modelo até diminuiu quando se utiliza muitos peptídeos.

(A) a partir de peptídeos, por um número diferente de peptídeos incluídos no modelo de previsão de proteômica, e (B) a partir de dados clínicos, dados de proteômica, e uma combinação de ambos os dados clínicos e proteômica.

Para a robustez, abordagens alternativas de modelagem multivariada foram comparados. Usando florestas aleatórios em vez de mínimos quadrados parciais análise discriminante (PLS-DA) e de regressão logística dentro da estrutura de modelação rendeu aproximadamente o mesmo nível preditivo como evidenciado pela área sob a curva (detalhes não mostrados).

Um subgrupo análise de restringir o conjunto de casos para aqueles com o padrão ILD aguda DAD (20 dos 43 casos) foi dificultada pelo pequeno tamanho da amostra e não foi capaz de melhorar o poder preditivo geral.

fenótipo modelagem baseada em múltiplos marcadores peptídicos e dados clínicos.

Figura 6B compara o poder preditivo, baseado em leave-one-out validação cruzada, para os modelos construídos em dados clínicos /radiológica sozinho usando uma regressão logística, dados peptídeo sozinho, e uma combinação. Ambos os tipos de dados sozinho fornecida previsão semelhante. Alguns melhoria foi obtida através da combinação dos dois tipos de dados, mas foi muito menos do que aditivo. Isto é consistente com os resultados da análise de péptidos individuais, o que sugere que os péptidos que discriminam parcialmente transportar informação também disponíveis a partir das variáveis ​​clínicas /radiológicas.

Modelando fenótipos com base em proteínas e os dados clínicos.

a Figura 7 mostra os valores p para distinguir os casos e controlos obtidos a partir das proteínas (ou seja, combinado pontuação péptido constituinte), todos os seus péptidos constituintes, e a medida de intensidade via de fase aguda combinado (isto é, a pontuação combinada dos 16 incluídos proteínas constituintes) . Para a maioria das proteínas, a intensidade de proteína estimada é mais significativa do que a maioria das intensidades peptídicos medidos associados com que a proteína, mas só melhora sobre o significado de o melhor péptido por algumas proteínas. Como estes resultados foram obtidos dentro do mesmo conjunto de dados que foi usado para identificar e seleccionar os péptidos constituintes, alguns sobre-montagem pode estar ocorrendo, ea intensidade de expressão de proteínas que incorpora informações de muitos peptídeos pode ser uma medida mais robusta para aplicar num contexto mais amplo . A intensidade medida via de fase aguda combinada mostra uma resposta mais significativa do que qualquer uma das proteínas constituintes. Um quadro semelhante é obtido quando consideramos as informações adicionais fornecidas pelas medidas de peptídeos, proteínas e via no topo das variáveis ​​clínicas conhecidas na previsão de status ILD (Figura S7).

p-valores para as proteínas são mostrados por estrelas vermelhas, p-valores para os péptidos individuais são indicados por pontos, ea distribuição desses para cada proteína é mostrado por um boxplot. Em cada boxplot, os lados superior e inferior da caixa representam os valores dos quartis superiores e inferiores (Q3 e Q1), respectivamente. A barra preta em cada caixa representa o valor mediano. O valor de p para a via de fase aguda é representada pela linha a tracejado; boxplots para proteínas na via de resposta de fase aguda está sombreada. A1AG1 = glicoproteína alfa-1-ácido 1; A1AT = alfa-1-antitripsina; A1BG = alfa-1B-glicoproteína; A2GL = ricas em leucina alfa-2-glicoproteína; AACT = alfa-1-antiquimotripsina; ANT3 = antitrombina-III; APOA1 = apolipoproteína A-I; APOB = apolipoproteína B-100; APOC3 = apolipoproteína C-III; ARMC2 = tatu repetição contendo proteína 2; CO3 = complemento C3; CO4 = complementar C4-A; complementar C4-B; CO9 = componente do complemento C9; FETUA = alfa-2-HS-glicoproteína; GEL = gelsolina; HBA = alfa de hemoglobina; HBB, HBD = hemoglobina beta /delta; HPT = haptoglobina; HPTR = proteína relacionada com a haptoglobina; HRG = glicoproteína rica em histidina; ITIH4 = inibidor de inter-alfa-tripsina H4 cadeia pesada; KLKB1 calicreína = plasma; região III V da cadeia kappa KV3 = Ig Ti; RETBP = proteína 4 ligadora de retinol; SAMP = soro amilóide P-componente; TrFE = serotransferrin; TTHY = transtirretina.

Figura 8A mostra a resposta de fase aguda intensidade via plotados contra uma pontuação variável clínica combinada medir a probabilidade de um indivíduo ser um caso calculado a partir de uma regressão logística do estado de caso-controle contra o variáveis ​​clínicas OMS PS, história de tabagismo, extensão da cobertura pulmonar normal na tomografia computadorizada, e da gravidade da ILD pré-existente. Isso mostra ambas as fontes de informação que contribui para o resultado ILD prever, embora essas duas medidas são bastante fortemente correlacionados, de modo que muita da informação é duplicado. Figura 8B considera as implicações para a previsão de ILD, mostrando as características de funcionamento receptor curvas (ROC) para as variáveis ​​clínicas, a intensidade via de fase aguda, ea combinação das duas fontes de informação. Isto mostra níveis comparáveis ​​de poder preditivo das variáveis ​​clínicas e intensidades da via de fase aguda, e algum benefício potencial de combiná-los em conjunto, que, no entanto, é limitada, reflectindo a sua correlação.

(A) Lote de fase aguda a intensidade da resposta contra a pontuação variável clínica combinada medir a probabilidade de um assunto que está sendo um caso calculado a partir de um modelo de previsão de status de caso-controle apenas com base nas variáveis ​​clínicas OMS PS, fumando história, extensão da cobertura pulmonar normal na tomografia computadorizada, e da gravidade da ILD pré-existente, com boxplots comparando a distribuição dessas medidas em casos e controles. Em cada boxplot, os lados superior /direita e inferior /esquerda da caixa de representar os valores dos quartis superiores e inferiores (Q3 e Q1), respectivamente. A barra preta em cada caixa representa o valor mediano. operacional (B) Receiver características curva de previsões de cross-validados a partir de dados clínicos, a aguda intensidade da resposta de fase e uma combinação dos dados clínicos e intensidade da resposta de fase aguda.

Discussão

apresentamos aqui os resultados de uma análise proteomic aplicado a um estudo farmacoepidemiológico grande escala e demonstram que com considerável atenção ao desenho do estudo e os procedimentos experimentais ao longo de todo o processo requerido para gerar dados de alta qualidade, é possível derivar um conhecimento valioso tanto do ponto de científica e uma perspectiva de diagnóstico. No entanto, existem inúmeras fontes potenciais de variação dos dados de polarização e no presente processo. A integridade de todos os passos do processo é crítico para a geração de dados útil e incapacidade de garantir uma elevada qualidade em qualquer um deles pode comprometer a validade e o valor de todo o estudo.

aspectos metodológicos

desenho do estudo e preparação de amostras.

Nós aplicamos fenotipagem cuidado com avaliação diagnóstica cego para garantir um diagnóstico ILD precisas e medidas para assegurar que todos os casos de DPI ocorrendo na coorte fonte seria capturado incorporada. Controles foram selecionados entre a população real gerando os casos, assegurar a comparabilidade entre os casos e controles para que contrasta visto pode ser atribuída ao status caso. As taxas de participação foram elevadas ( 90%) e semelhante para casos e controles [3], fazendo com viés de seleção improvável. Proteomics amostras foram obtidas após consentimento informado separada de cerca de metade de todos os casos e os controlos tratados com gefitinib. Medidas para garantir que os dados de proteômica de alta qualidade para a nossa investigação epidemiológica em grande escala incluídos randomização das amostras processadas, uma cuidadosa avaliação da qualidade das preparações de amostra e protocolos de preparação otimizados para garantir a estabilidade em todos os procedimentos para um grande número de amostras. Temos anteriormente descrito a estratégia geral que decidimos utilizar no estudo com base em um número de rodadas da fase-piloto experimentais [14].

efeitos lote medida experimental.

bidimensional-gel de poliacrilamida electroforese é uma tecnologia comum convencional utilizado para análise de proteínas no soro /plasma [15], [16]. Actualmente, LC-MS /MS tornou-se amplamente aceites para a alta resolução análise ao nível do proteoma de uma mistura de péptidos de complexo de [17]. Avanços recentes nesta metodologia, incluindo a melhoria da estabilidade do péptido separação e detecção permitiu a comparação da intensidade de iões entre LC-MS /MS perfis [18]. O nosso sistema de análise de proteómica aplicados LC-MS /MS após a depleção de imunoafinidade das proteínas constituintes mais abundante no plasma do sangue, e de tratamento com enzima proteolítico da amostra de plasma empobrecido.

Identificou-se que a LC-MS /MS processo medindo tem erros de medição sistemáticos, como se poderia esperar, que tomámos medidas para eliminar através da introdução de processamento em lote com controle de qualidade, o desenho da ordem de processamento da amostra para minimizar os efeitos de quaisquer erros sistemáticos e, em seguida, eliminando os efeitos de lote na análise estatística. A consideração dos efeitos de lote na análise estatística apareceu para melhorar o processo de detectar picos exigentes, e, portanto, com base a etapa final a identificação de proteínas sobre esta abordagem de análise

algoritmos de alinhamento -. Interna guiada por norma Perfil Optimal alinhamento ( i-opalino)

a fim de permitir a quantificação comparativa entre amostras, as medições das amostras, tem que ser alinhado -. ou seja, a correspondência dos sinais de iões tem de ser identificada. Vários métodos têm sido propostos para este, por exemplo baseada em isótopos estáveis ​​rotulagem [19] – [21], utilizando identificação comparativa [22], [23], ou com a comparação directa dos respectivos sinais iónicos peptidicos [18]. O método i-OPAL pertence à última categoria. Apesar da resolução relativamente baixa precisão e de massa

m /z

medição, o instrumento de tipo MS por captura de iões permite uma medição estável a longo prazo, sem qualquer operação de calibração [24], [25]. Consequentemente, a

m /z

valores são directamente comparáveis ​​em um grande conjunto de amostras sem maiores transformações.

achados biológicos e implicações

mecanismos biológicos potenciais subjacentes eventos ILD agudas.

Em nosso mapeamento IPA para vias biológicas canônicas, proteínas de fase aguda saiu como o sinal mais forte, seguido pelo complemento e de coagulação caminhos.

Deixe uma resposta