파이썬 랜덤 포레스트 예제

아래 코드는 repl.it 생성되며 파이썬의 임의포지내비시 포리스트에 대한 완전한 대화형 실행 예제를 제공합니다. 자유롭게 코드를 실행하고 변경할 수 있습니다(패키지 로드에 몇 분 정도 걸릴 수 있음). 그것을 알아냈다! 그것은 파이썬 3.5.2를 사용하는 문제였다. 나는 2.7로 전환하고 일했다! 임의 포리스트는 회귀 문제의 경우 최종 예측이 각 개별 의사 결정 트리의 예측의 평균이기 때문에 앙상블 의사 결정 트리 알고리즘입니다. 가장 빈번한 예측의 평균입니다. 따라서 알고리즘은 위의 이미지와 같이 많은 의사 결정 트리의 평균을 사용하여 최종 예측에 도달합니다. 이전에는 간단한 생성 분류자(순진한 베이즈; 심층 참조: 탐색 베이지 분류 참조)와 강력한 판별 분류자(지원 벡터 컴퓨터, 심층: 지원 벡터 컴퓨터 참조)를 심층적으로 살펴보았습니다. 여기서는 임의 포리스트라는 비파라메트릭 알고리즘인 또 다른 강력한 알고리즘에 대한 동기부여를 살펴보겠습니다. 임의 포리스트는 앙상블 방법의 예이며, 이는 더 간단한 추정기의 앙상블의 결과를 집계하는 데 의존한다는 것을 의미합니다. 이러한 앙상블 방법과 다소 놀라운 결과는 합계가 부분보다 클 수 있다는 것입니다 : 즉, 다수의 추정자 중 과반수 투표는 투표를하는 개별 추정자보다 더 나은 것으로 끝날 수 있습니다! 다음 섹션에서 이에 대한 예제를 살펴보겠습니다. 우리는 표준 가져오기로 시작합니다 : 다행히도 Scikit-Learn과 같은 라이브러리를 사용하면 파이썬에서 수백 개의 기계 학습 알고리즘을 쉽게 구현 할 수 있습니다. 너무 쉬워서 모델이 어떻게 작동하는지에 대한 기본 지식이 필요하지 않은 경우가 많습니다. 모든 세부 사항을 아는 것은 필요하지 않지만 기계 학습 모델이 후드 아래에서 어떻게 작동하는지 에 대한 아이디어를 가지고 하는 것이 여전히 도움이 됩니다.

이를 통해 모델이 실적이 저조할 때 모델을 진단하거나 의사 결정을 내리는 방법을 설명할 수 있으며, 이는 다른 사람들이 모델을 신뢰하도록 설득하려는 경우에 매우 중요합니다. 트리를 만들 때 각 분할 지점에서 욕심 알고리즘이 평가할 수 있는 기능(행)을 제한하여 의사 결정 트리가 달라지도록 할 수 있습니다.

파이썬 랜덤 포레스트 예제

Comments