본문 바로가기

[Data Engineering]/[Gloud-GCP]

[GCP] 3-3. DashBoard

728x90

< 실습 - 주기적인 데이터 스케줄링, 이어서 ... >

  지금까지 GCP를 활용해서 데이터를 가져오고 이를 SQL에서 처리하는 과정까지를 살펴보았다. 하지만 이를 최종결정권자나 사용자에게 설득력있게 다가가기에는 부족함이 있었다. 이제 우리는 우리가 설계한 모델을 가지고 DashBoard를 직접 작성하여 이를 어떻게 적용시킬것인지를 살펴보도록 하겠다. GCP에서는 DashBoard를 제작하는데에 Data-Studio를 사용한다. 이를 어떻게 이용할 지를 알아보고 이전에 작성한 모델을 바탕으로 직접 제작하는 실습을 가져보자.

  먼저 데이터 스튜디오로 작업하기 위해서는 데이터스튜디오(https://datastudio.google.com)로 접속해야한다. 아래에 보이는 화면이 데이터스튜디오에 처음 접속하였을 떄의 화면이다.

< 데이터 스튜디오 접속시의 화면 >

데이터 스튜디오에서는 '보고서'와 '원본' 이라는 개념이 있다. '보고서'는 원본의 데이터를 가지고 만들어내는 최종결정권자, 사용자등을 위한 것이고, '원본'은 이 '보고서'를 만들기 위해 필요한 데이터들을 지정해주는 것을 말한다. 따라서 첫번째 단계는 데이터의 원본을 설정하는 것이다. 처음부터 시작해서 원본을 설정해보기로 하자.

- 원본 데이터 설정하기 -

  먼저 왼쪽의 새로만들기 버튼을 클릭해서 Data Sourse로 들어간다.

< Data Sourse를 클릭 >

위와 같이 접속을 하게 되면 책에 나와있는 그림과는 다르게 굉장히 다양한 지원가능한 데이터 원본 목록이 나와있는 것을 알 수 있다. 우리의 flights데이터는 Cloud SQL에 있으므로 클릭해준다.

< 원하는 데이터 형식을 선택 >

  클릭해 보면 아래의 화면처럼 SQL 데이터베이스를 인증하라는 화면이 나온다. 해당 인증에는 데이터베이스 인스턴스의 연결이름과 데이터베이스, 사용자 이름, 비밀번호 가 필요하다. 데이터베이스 인스턴스의 이름은 SQL페이지에 접속해보면 flights데이터베이스 옆에 인스턴스 연결이름이라고 있다. 이를 복사해서 붙여넣어주면 된다. 나의 경우에는

gcptest1-268209:us-central1:flights 의 양식이다. 대략적으로 버킷이름,리전,인스턴스명 의 나열인듯 하다.

< 인증에 필요한 파라미터들을 대입해준다. >

  하단의 인증버튼을 눌러 해당 데이터베이스를 인증하고 로딩이 끝나면 옆에 flights가 뜬 것을 볼 수 있다. 정상적으로 인증처리가 되었으므로 우측 상단의 연결버튼을 눌러준다.

< 해당 데이터베이스를 인증 후 연결시켜준다 >

  데이터베이스 연결이 끝나면 아래처럼 '원본'데이터들의 필드를 포함한 분류 섹션들이 드러난다. 이 상태에서 우측 상단의 보고서 작성을 누르면 해당 데이터들을 기준으로 data-studio에서 자동으로 보고서를 작성해준다. 여기서 이제 다이어그램을 그리는데 상세한 다이어그램 작성법과 관련 기능들은 책고 data-studio reference들을 참고하고 나는 최종 결과물에 해당하는 다이어그램만 마지막에 나타내기로 하겠다.

 

- 다이어그램 그려보기 -

< '원본' 데이터를 기반으로 작성된 데이터 다이어그램 >

  데이터 스튜디오 보고서를 조금만 건드려도 상단의 다이어그램처럼 괜찮은 이미지를 얼마든지 간편하게 제작할 수 있다. 위의 다이어그램과 문구, 사용자가 조작할 수 있는 컨트롤 기능 등 많은 정보를 한곳에 담을 수 있지만 관련 내용들이 매우 방대해서 차후에 따로 데이터 스튜이오편만 포스팅을 진행하기로 하였다. 다음 장에서는 위의 데이터 Dash-Board의 한계인 정적인 데이터만 다룰 수 있다는 점을 벗어나서 실시간으로 장소 인지형 Dash-Board를 만드는 방법을 살펴보도록 하겠다.

 

 

"Data Science on the Google Cloud Platform by Valliappa Lakshmanan (O'Reilly). Copyright 2018 Google Inc."
728x90

'[Data Engineering] > [Gloud-GCP]' 카테고리의 다른 글

[GCP] 4-2. Stream Processing  (2) 2020.02.19
[GCP] 4-1. ETL Pipeline  (0) 2020.02.19
[GCP] 3-2. Decision Model  (0) 2020.02.18
[GCP] 3-1. How to make Dataset  (0) 2020.02.18
[GCP] 2-2. Periodic scheduling, flask web application  (0) 2020.02.18