본 포스트는 inflearn 의 '캐글로 시작하는 머신러닝, 딥러닝 분석'(대구빅데이터활용센터) 강의 내용을 기반으로 실습을 진행하며 작성하였습니다.
안녕하세요?
이번 포스트에서는 Kaggle을 시작해보고, 그 기능들을 알아보도록 하겠습니다.
Kaggle 이란?
캐글(Kaggle)은 2010년 설립된 데이터를 통한 예측 모델 및 분석을 경쟁하는 대회 플랫폼으로, (무려 구글에서 인수했다고 합니다.)
기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 분석가, 과학자들이 이를 해결하기 위하여 데이터를 분석하고 모델을 만들어 경쟁합니다.
이러한 대회 뿐만 아니라 데이터 분석 실습을 할 수 있는 커널, 데이터 분석과 관련된 학습 컨텐츠와, 토론 공간까지 제공하는 데이터 분석을 위한 커뮤니티의 역할도 합니다.
한 마디로, 기업 등에서 제공하는 다양한 데이터 셋을 이용하여 데이터 분석을 공부하고 실습해볼 수 있는 사이트가 Kaggle 입니다.
Kaggle 시작하기
https://www.kaggle.com/ 캐글 사이트로 접속하면 아래와 같이 사이트가 뜨는데, 회원 가입을 위해 'Register' 버튼을 누릅니다.
아래와 같은 화면이 뜨면, 회원가입을 진행합니다.(저는 구글계정을 사용하여 가입하였습니다.)
계정 생성한 후에 다시 캐글 사이트를 보시면 아래와 같이 되어있습니다.
- Competitions : Kaggle 의 핵심 기능인 대회들을 볼 수 있습니다.
- Datasets : 기업이나 다른 사용자가 올린 Dataset이 올라오는 곳으로, 해당 데이터셋을 사용할 수 있습니다.
- Code : 위의 Dataset을 사용하여 직접 코딩을 하고 데이터 분석을 할 수 있는 Notebook 을 제공합니다(Jupyter Notebook 과 유사합니다)
이번 포스트 시리즈에서는 해당 기능을 이용하여 데이터 분석을 진행해보도록 할 것입니다.
- Discussions : 데이터에 관한 질문과 토론을 할 수 있는 공간입니다.
- Learn : 데이터 분석이나 프로그래밍 등에 대해 학습할 수 있는 공간입니다.
여기까지 Kaggle에 대해 알아보고, 또 가입까지 해보았습니다.
다음 포스트에서는 Kaggle에 등록되어 있는 Dataset을 조회하고,
이를 이용해서 직접 코드를 짜서 분석해보도록 하겠습니다.
Reference
[Inflearn]'캐글로 시작하는 머신러닝
딥러닝 분석'(대구빅데이터활용센터)