본문 바로가기

Qlik Sense

데이터 연관도 (Data Network) 분석

데이터 연관도 분석

고객분석(CRM)의 구축 화면 입니다. 고객을 RFM(Recency, Frequency, Monetary) 기준으로 분류하여 프리미엄 고객, VIP 고객 및 이탈 고객으로 세그멘테이션하여 고객수 및 매출액에 대한 기본 화면입니다.

 

위 내용을 분석하기 위하여 고객별 실적을 기준으로 분석에 필요한 집계 테이블 및 관련된 차원 테이블들이 필요합니다. 다음 내용은 이 화면을 분석하기 위한 모델링결과 입니다.

일반적인 BI Tool에서는 데이터마트 형태의 테이블을 생성하여 적재하지만 클릭센스에서는 관계형 모델을 지원하기 때문에 각 테이블들을 적재하여 서로 연관될 수 있는 키를 지정하여 SQL을 작성하지 않고 연관모델에 의하여 분석할 수 있습니다.

 

 

위 모델을 보면 약 10개 이상의 테이블이 적재된 결과이며 또한 위의 테이블들은 기간계 시스템에서 직접 적재될 수 있고 정보계 영역에서 적재될 수 있습니다. 정보계의 테이블들도 원천적으로는 기간계 시스템에서 필요한 단계를 거쳐서 정보계로 적재되었습니다.

많은 기업에서 BI 시스템 혹은 정보계 시스템을 제공하고 있습니다. 그러나 해당 정보는 어떤 경로를 거치고 있는지? 혹은 기간계의 어떤 테이블의 정보를 참조하고 있는지 궁금하게 합니다.

일반적으로 ETL 정의서를 작성하여 관련 정보를 파악하고 있는데, 구축 후 요건의 변경에 따라 많은 변화가 일어나지만 정작 ETL 정의서는 구축 후 업데이트가 되지 않고 있는 경우가 많습니다.

 

데이터 연관도의 필요성

분석앱의 정보는 어디에서 왔는지? 어떤 단계를 거치고 있는지를 파악하고자 합니다.

 

데이터 연관도 분석

위의 데이터 모델을 연관도 분석 차트로 표현한 예제 입니다.

그러나 아직 각 테이블의 소스시스템의 테이블은 알 수 없습니다.

표현의 레벨을 확대해 보겠습니다.

 

 

 

중심의 파란색이 앱의 이름이며 앱에 직접 연관된 노드들은 적재된 테이블입니다. 적재된 테이블은 다시 외부의 테이블과 연관되어 있습니다. 외부에 연관된 테이블은 별도의 ETL 과정을 거쳐서 생성되었습니다.

화면에는 자세히 보이지 않지만 확대를 하면 영문테이블명이 가간계 시스템의 테이블명입니다.

더 확대한 관계도를 보겠습니다.

 

각 테이블들의 연관도 입니다. 노드의 크기가 작은 테이블들은 소스시스템의 테이블입니다.

노드의 관계도를 계산해보면 7~8 단계를 거치는 경우도 있습니다.

이제 각 앱 단위로 최초의 테이블이 무엇인지? 어떤 경로를 거쳐서 분석이 되는지 파악할 수 있습니다.

 

또 다른 앱의 데이터 연관도 입니다.

 

중심부를 확대한 예제 입니다.

 

이제 IT 부서도 정보화가 필요합니다. 많은 정보화 프로젝트를 수행하면서 고객의 요구가 많이 발생하였는데 위 과정을 엑셀 시트로 ETL 정의서로 대체하였습니다.

이제 다음 프로젝트부터는 위와 같은 데이터 연관도를 제공함으로써 보다 유지보수가 용이한 시스템이 될 수 있도록 하겠습니다.

 

For more information

https://qliksense.tistory.com/

https://blog.naver.com/about_qlik

qliker@kakao.com

 

 

데이터 연관도 분석_Network Chart.pdf
0.45MB