Análise de componentes principais aplicada à estimação de parâmetros no modelo de regressão logística quadrático
DOI:
https://doi.org/10.5540/tema.2013.014.01.0057Resumo
A literatura disponível mostra que a quase totalidade dos trabalhos sobre o modelo de regressão logística considera apenas o modelo com funções discriminantes lineares. Entretanto, há situações nas quais funções discriminantes quadráticas são de grande utilidade e podem apresentar melhores resultados. Porém, o modelo de regressão logística quadrático envolve a estimação de um grande número de parâmetros desconhecidos, o que pode levar a algumas dificuldades, do ponto de vista computacional, especialmente quando há um grande número de variáveis independentes no conjunto de dados. Neste trabalho utiliza-se um conjunto de componentes principais das variáveis independentes a fim de reduzir as dimensões do modelo a ser estimado, com variáveis independentes contínuas, bem como os custos computacionais para a estimação de parâmetros na regressão logística quadrática politômica, sem perda de eficiência. Simulações com conjuntos de dados extraídos da literatura disponível mostram que o modelo de regressão logística quadrático, com componentes principais, é computacionalmente viável e, geralmente, produz resultados melhores que aqueles obtidos pelo modelo de regressão logística clássico, em termos de taxas de classificações corretamente efetuadas.Referências
A.M. Aguilera, M. Escabias, M.J. Valderrama, Using principal components for estimating logistic regression with high-dimensional multicollinear data, Computational Statistics & Data Analysis, 55 (2006), 1905--1924.
A. Albert, J. A. Anderson, On the existence of maximum likelihood estimates in logistic regression models, Biometrika, 71 (1984), 1--10.
J.A. Anderson, Quadratic logistic discrimination, Biometrika, 62 (1975), 149--154.
I. Andruski-Guimarães e A. Chaves Neto, Estimation in polytomous logistic model: comparison of methods, Journal of Industrial and Management Optimization, 5 (2009), 239--252.
L. Barker, C. Brown, Logistic regression when binary predictor variables are highly correlated, Satistics in Medicine, 20 (9-10) (2001), 1431--1442.
D. Brodnjak-Voncina, Z.C. Kodba,C. Novic, Multivariate data analysis in classification of vegetable oils characterized by the content of fatty acids. Chemometrics and Intelligent Laboratory Systems 75 (2005), 31--43.
J.B. Copas, Binary regression models for contaminated data. With discussion. Journal of Royal Statistical Society B, 50 (1988), 225--265.
A. Ekholme, J. Palmgren, A model for binary response with misclassification. GLIM 82 Proceedings of the International Conference on Generalized Linear Models (1982), 128--143.
R.A. Fisher, The use of multiple measurements in taxonomic problems. Annals of Eugenics 3 (1936), 179--188.
D. Gervini, Robust adaptive estimators for binary regression models. Journal of Statistical Planning and Inference, 131, 297--311 (2005).
G. Heinze, M. Schemper, A solution to the problem of separation in logistic regression. Statistics in Medicine} {bf 21 (2002), 2409--2419.
M. Hubert, K. van Driessen, Fast and robust discriminant analysis. {em Computational Statistics & Data Analysis}, {bf 45} (2004), 301--320.
bibitem{jolliffe} I.T. Jolliffe, A note on the use of principal components in regression. {em Applied Statistics}, {bf 31}, 3 (1982), 300--303.
bibitem{kodzar} N. Kodzarkhia, G.D. Mishra, L. Reiersolmoen, Robust estimation in the logistic regression model. Journal of Statistical Planning and Inference}, 98 (2004), 211-223.
W. F. Massy, Principal component regression in exploratory statistical research. Journal of American Statistical Association, (1965), 234--246.
G. J. McLachlan, Discriminant Analysis and Statistical Pattern Recognition, p. 130. John Wiley & Sons, Inc., Hoboken, New Jersey, U.S.A. 2004.
P.J. Rousseeuw, A. Christmann, Robustness against separation and outliers in logistic regression, Computational Statistics & Data Analysis, 43 (2003), 315--332.
Downloads
Arquivos adicionais
Publicado
Como Citar
Edição
Seção
Licença
Política para Periódicos de Acesso Livre
Autores que publicam nesta revista concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
- Esta é uma revista de acesso aberto, o que significa que todo o conteúdo é livremente disponível gratuitamente para o usuário ou sua instituição. Os usuários estão autorizados a ler, baixar, copiar, distribuir, imprimir, pesquisar ou vincular os textos completos dos artigos, ou usá-los para qualquer outro propósito legal, sem pedir permissão prévia do editor ou do autor. Isso está de acordo com a definição de acesso aberto do BOAI.
Todo o conteúdo do periódico está licenciado sob uma Licença Creative Commons do tipo atribuição BY.