aug 02, 2019
admin
0
15

rapidminer 예제

`Golf` 데이터 세트는 검색 연산자를 사용하여 로드됩니다. 데이터 연산자의 적용 전에 데이터 집합을 볼 수 있도록 중단점이 여기에 삽입됩니다. 첫 번째 예제에서 온도 및 바람 속성의 값이 각각 `85`와 `false`임을 확인할 수 있습니다. 데이터 설정 연산자는 `Golf` 데이터 세트에 적용됩니다. 예제 인덱스 매개변수는 1로 설정되고 특성 이름 매개변수는 `온도`로 설정되고 값 매개변수는 50으로 설정됩니다. 따라서 온도 특성의 값은 첫 번째 예제에서 50으로 설정됩니다. 마찬가지로 첫 번째 예제에서 Wind 특성의 값은 추가 값 매개 변수를 사용하여 `fast`로 설정됩니다. 프로세스를 실행하고 결과 작업 영역에서 결과를 확인하여 이를 확인할 수 있습니다. 문자열 값은 정수 형식이므로 온도 특성에 대해 설정할 수 없습니다. 정수 값은 Wind 특성(명목 유형)에 대해 지정할 수 있지만 명목 값으로 저장됩니다. 몇 초 후, 우리는 Naïve 베이즈 모델을 보고 결과 창에서 `Naïve Bayes` 아래의 `모델`을 클릭하여 검사를 시작할 수 있습니다.

여기서는 모델을 검사하는 시각적 인 방법이 있으므로 예를 들어 `ActualLapsedTime`특성은 매우 유용하지 않지만 드롭 다운을 선택하고 대신 `최소 습도`를 선택하고 두 클래스가 약간 다른지 확인할 수 있습니다. 인덱스 범위가 아닌 다른 옵션으로 예제를 필터링하려는 경우 예제 필터 연산자(Filter Examples 연산자)를 사용할 수 있습니다. ExampleSet을 입력으로 사용 하 고 지정 된 조건을 충족 하는 예제만 포함 하 여 새 ExampleSet을 반환 합니다. 미리 정의된 몇 가지 조건이 제공됩니다. 사용자는 그들 중 어느 것을 선택할 수 있습니다. 사용자는 예제를 필터링하기 위해 자신의 조건을 정의할 수도 있습니다. 필터 예제 연산자는 누락된 값이 있거나 없는 예제를 필터링하는 데 자주 사용됩니다. 또한 올바른 예측또는 잘못된 예측으로 예제를 필터링하는 데도 자주 사용됩니다(일반적으로 학습된 모델을 테스트한 후). 지정된 인덱스 범위 내에 있는 예제만 포함하는 새 ExampleSet은 이 포트의 출력입니다. 특성을 특징으로 하는 예제에는 다른 예제와 비교할 수 있는 구체적인 값이 있습니다. 데이터 집합의 테이블 행을 예로 들 수 있습니다.

여기에 사용된 예제 집합은 파일 고객 이탈-data.xslx에서 시작된 고객 변동 데이터입니다. 이 연산자는 대체 샘플링을 사용하기 때문에 다른 샘플링 연산자와 다릅니다. 대체 샘플링에서 모든 단계에서 모든 예제가 선택될 확률이 동일합니다. 샘플에 대한 예제가 선택되면 선택 후보로 남아 있으며 다른 단계에서 다시 선택할 수 있습니다. 따라서 교체가 있는 샘플은 동일한 예에서 여러 번 가질 수 있습니다.

POST CATEGORIES

Okategoriserade