본 포스트는 inflearn 의 '캐글로 시작하는 머신러닝, 딥러닝 분석'(대구빅데이터활용센터) 강의 내용을 기반으로 실습을 진행하며 작성하였습니다.
안녕하세요?
지난 번 포스트에서는 kaggle 이 무엇인지를 알아보았습니다.
이번 포스트에서는 kaggle 에 등록된 dataset을 조회해보고, 이를 이용해서 코드 작성을 어떻게 하는 지 알아보겠습니다.
kaggle 에 등록된 데이터 셋 조회
kaggle 에 들어가서 좌측의 'Datasets' 를 누르시면 아래와 같은 화면이 뜹니다.
여기서 상단의 'Search' 부분을 클릭하시고 원하는 검색어를 입력하시면
아래처럼 입력된 검색어와 관련있는 Dataset 들이 조회됩니다.
저희가 실습에 사용할 데이터셋을 조회하기 위해
'london bike' 이라고 검색하였습니다.
위의 결과화면에서 밑줄쳐진 'London bike sharing dataset' 데이터셋을 클릭해봅니다.
그러면 아래와 같이 해당 데이터셋의 설명 등 정보가 조회됩니다.
이 데이터셋을 사용해서 코드를 작성해보고 싶으므로,
상단의 'New Notebook' 버튼을 눌러봅니다.
Notebook 에서 데이터셋 사용하기
위의 설명대로 'New Notebook'을 클릭하면 아래와 같은 화면으로 이어집니다.
이는 커널이라는 클라우드 환경의 코딩을 할 수 있는 공간입니다.(Jupyter Notebook과 유사합니다)
여기서 코드를 클릭하고 shift+enter 를 눌러주시면
해당 코드가 실행되게 됩니다.
해당 코드는 london-bike-sharing-dataset 의 데이터 파일 위치를 조회하는 것이므로 코드 실행 결과는 아래와 같이 파일의 경로가 뜹니다.
이상으로 kaggle에서 데이터셋을 조회하고, 이를 코드에서 이용하는 방법을 알아보았습니다.
다음 포스트에서는 이 데이터셋을 이용해서 본격적으로 데이터 분석을 시작해보겠습니다.
Reference
[Inflearn]'캐글로 시작하는 머신러닝
딥러닝 분석'(대구빅데이터활용센터)