[contact-form-7 404 "Not Found"]

Fique informado sobre as principais tendências em energias renováveis. Deixe seu e-mail e receba nossos conteúdos.

Sem categoria

logistic regression 예제

단순 로지스틱 회귀는 종속 변수가 측정이 아니라 명목이라는 점을 제외하면 선형 회귀와 유사합니다. 한 가지 목표는 명목 변수의 특정 값을 얻을 확률이 측정 변수와 연관되어 있는지 확인하는 것입니다. 다른 목표는 측정 변수를 고려하여 명목 변수의 특정 값을 얻을 확률을 예측하는 것입니다. 물류 기능은 1920년 레이몬드 펄과 로웰 리드에 의해 인구 증가의 모델로 독립적으로 재발견되었으며, 진주와 갈대(1920년)로 출판되어 현대 통계에서 사용되었습니다. 그들은 처음에는 베르훌스트의 작품을 알지 못했고 아마도 L. 구스타브 뒤 파스키어에게서 그것에 대해 배웠지만, 그에게 약간의 신용을 주었고 그의 용어를 채택하지 않았다. [41] Verhulst의 우선 순위는 인정되었고 1925년 Udny Yule에 의해 “물류”라는 용어가 부활했으며 그 이후로 이어지고 있습니다. [42] 펄과 리드가 먼저 미국 인구에 모델을 적용하고, 또한 처음에 세 점을 통과하여 곡선을 장착; Verhulst와 마찬가지로, 이것은 다시 나쁜 결과를 낳았습니다. [43] 단방향 anova 또는 학생의 t-test를 사용하여 하나의 명목 및 하나의 측정 변수로 데이터를 분석할 수도 있으며, 그 차이는 미묘할 수 있습니다.

한 가지 단서는 로지스틱 회귀를 통해 명목 변수의 확률을 예측할 수 있다는 것입니다. 예를 들어, 55세 여성의 혈액에서 콜레스테롤 수치를 측정한 다음 10년 후에 누가 심장 마비를 겪었는지 알아본다고 가정해 보십시오. 당신은 두 샘플 t-테스트를 할 수 있습니다., 심장 발작을 했다 여자의 콜레스테롤 수치를 비교. 그렇지 않은 사람들, 그리고 그 콜레스테롤 수치가 심장 발작과 관련 되지 않습니다 null 가설을 테스트 하는 완벽 하 게 합리적인 방법이 될 것 이다; 가설 테스트가 관심 있는 전부라면 t-test는 익숙하지 않은 로지스틱 회귀보다 더 좋을 것입니다. 그러나 특정 콜레스테롤 수치를 가진 55세 여성이 향후 10년 동안 심장 마비를 앓을 확률을 예측하고 싶다면 의사가 환자에게 “콜레스테롤을 40포인트 줄이면 콜레스테롤을 줄일 수 있습니다. X%에 의한 심장 마비의 위험”이라며 물류 회귀를 사용해야 합니다. 선형 회귀에서 Y 변수는 항상 연속 변수입니다. Y 변수가 범주형이라고 가정하면 선형 회귀 모델을 사용할 수 없습니다. 물류 회귀의 목표는 관심의 이분법 특성 (의존 변수 = 응답 또는 결과 변수) 및 독립적 인 세트 사이의 관계를 설명하기 위해 가장 적합한 (아직 생물학적으로 합리적인) 모델을 찾는 것입니다 ( 예측 변수 또는 설명) 변수를 참조하십시오. 로지스틱 회귀는 관심 특성의 존재 확률에 대한 로그 트 변환을 예측하는 수식의 계수(및 표준 오차 및 유의 수준)를 생성합니다: R2 보고.

이진 로지스틱 회귀를 위해 수많은 의사 R2 값이 개발되었습니다. 인위적으로 높거나 낮게 되는 많은 계산 문제가 있으므로 신중하게 해석해야 합니다. 더 나은 방법은 사용 가능한 적합성 테스트의 장점을 제시하는 것입니다. 호스머-레메쇼는 카이스퀘어 테스트를 기반으로 일반적으로 사용되는 적합성 측정값입니다. 종속 변수가 명목이고 하나 이상의 독립 변수가 있는 경우 여러 로지스틱 회귀를 사용합니다.