RM 데이터 전처리 따라하기 - 1
이번 포스팅에서는 Loop 와 Macro 에 대한 개념을 알고자 합니다.
왼쪽의 데이터 셋을 활용 하여 오른쪽 과 같이 일별 누적 평균을 구하고자 합니다. 데이터는 7행 이상이 될 수 있다는 가정하에 유동적으로 구해질 수 있도록 해 보자.
1. 우선 Read Excel operator 를 활용하여 저장된 Excel 데이터를 RM 에서 읽어 드립니다.
( 반드시 import 마법사를 통해서 읽어 드려야 변수 정보등의 Meta 데이터가 저장됩니다. )
2. 다음 Loop operator 를 활용하여 7번의 반복이 진행 되도록 설정합니다. loop 내에서 사용될 반복 횟수에 대한 매크로 변수는 iteration 입니다.
( 이후 반복의 횟수는 데이터 전체 행의 개수로 설정 예정입니다. )
3. Loop operator 안에 filter example range operator 를 삽입하고 필터 조건에 1 부터 반복횟수 행
만큼 필터 걸리도록 합니다. 결국 첫번째 loop 에서는 1행만, 두 번째 loop 에서는 1과2행이 선택 될 것입니다. 매크로 변수 입력 %{iteration}
4. 필터 걸린 데이터에 대해서 Aggregate operator 를 활용하여 전체 평균을 계산합니다.
group 따로 넣지 않고 aggregation 에 value 를 넣어줍니다.
5. Generate Attributes operator 를 활용하여 Day 변수를 다시 재 생성합니다.
6. 각 loop 에서 생산된 결과값들을 쌓기 위해서 Append operator 를 사용합니다.
여기까지 작업이 된다면 원하는 결과값을 얻을 수 있을 것입니다. 데이터의 양이 계속적으로 변경 된다고 했을 때 7이라는 값이 아니라 전체 데이터의 행을 카운트 하여 반복 하는 작업을 추가 해 보도록 합니다.
7. read 이후에 extract macro operator 를 활용하여 데이터의 전체 행의 개수를 매크로 변수 count 에 넣습니다.
8. loop operator 의 반복 수 부분에 해당 매크로 변수를 넣어줍니다.
결과를 얻어 내기 위한 방법은 다양하게 있을 수 있습니다. 이번 포스팅도 단순히 결과를 얻기 위함이 아닌 Loop 와 Macro 의 사용법에 대해서 조금 더 쉽게 이해 시키고자 함입니다.