본문 바로가기

[자유]

[DSC] DSC-PNU 2기 단기세션 운영계획(데이터 활용,ML)

728x90

https://sites.google.com/view/dsc-pnu/홈?authuser=0

 

부산대학교

DSC Pusan National 멤버 모집 DSC 부산대학교 2기와 함께할 멤버분들을 모집합니다! 모집기간 : 2020년 4월 13일 ~ 4월 19일

sites.google.com

 

  DSC - PNU 1기 운영진으로 이번 학기에는 개별 세션을 맡아 진행하기로 하였다. 이전에 진행했던 GCP-데이터 분석을 이어서 하려고 했지만 내용이 만만치 않고, 개인적으로 관심있는 퀀트 분야도 호불호가 갈릴 것 같아서 다른쪽으로 생각해 보기로 했다.

  내가 맡아 진행할 세션은 '데이터 활용 및 분석' 부분이다. 사실 내가 맡은 파트는 대부분의 커리큘럼이 ML쪽으로 맞춰져 있는데 학부생 수준에서 아는 내용도 한계가 있고, 구성되는 내용이 처음 접하기에 쉽지 않은 내용들이다. 이전에 ML스터디에서 했던 NN(CNN,RNN등)도 제외하고 기본적인 내용으로 구성했다. 

 

- 메인 참고자료 - 

https://www.kaggle.com/learn/intro-to-machine-learning

 

Learn Intro to Machine Learning Tutorials

Learn the core ideas in machine learning, and build your first models.

www.kaggle.com

https://www.kaggle.com/learn/intermediate-machine-learning

 

Learn Intermediate Machine Learning Tutorials

Learn to handle missing values, non-numeric values, data leakage and more. Your models will be more accurate and useful.

www.kaggle.com

 

- 보조 참고자료 -

https://book.naver.com/bookdb/book_detail.nhn?bid=15028524 

 

파이썬 머신러닝 판다스 데이터 분석

데이터 과학자가 되기 위한 첫걸음!파이썬 초급자나 중급자가 데이터 분석과 머신러닝을 배우고자 마음먹었다면 이 책을 선택해야 한다. 필수 라이브러리를 소개하고 설치부터 예제 코드를 따라 하면서 자연스럽게 익숙해지도록 안내하고 있기 때문이다. 어려울 것 같은 수학과 통계학적 이론은 가능한 한 낮추고 실습하며 최소한의 설명으로 결과값과 확인할 수 있도록 하였다. 또한 방대한 텍스트보다는 다이어그램 등과 같은 도식화에 신경을 기울여 한눈에 이해할 수 있도록 구성

book.naver.com

 

 

- 주차별 내용 구성 -

※ 추가적으로 구성할 내용 :  XGBOOST, Data-Leakage ( 여기까지가 kaggle intermediate course 마무리이다 )

 

  보통 방학때 세션을 진행하면 장기적으로 많은 주제들을 다뤄볼 수 있지만, 학기중이고 시간이 많지 않아 어느정도까지 진행할 수 있을지는 잘 모르겠다. 세션을 어느정도 진행해보고 결정해야 될 것 같다. 다른 분들이 진행하시는 세션도 유익하고 재밌는 것들이 많아 보인다. 놋북 챙겨다니면서 들어야겠다.

 

728x90