머신러닝(Machine Learning)

google Colaboratory 에서 구글 드라이브에 있는 파일 쉽게 이용하기

leebaro 2018. 11. 15.
728x90

google Colaboratory(이하 Colab) 를 이용하면 별도의 서버를 준비하지 않아도 머신러닝 개발을 할 수 있는 파이썬 환경을 이용할 수 있습니다.

머신러닝 모델 개발을 만들기 위해서는 학습에 이용할 데이터셋이 필요합니다.

별도의 서버나 개인 PC에서 파이썬 환경을 구축 했다면 PC나 서버에 있는 파일을 이용하면 됩니다.

하지만 Google Colaboratory를 이용하면 데이터셋 파일을 어떻게 이용할 수 있을까요?

가장 간단한 방법은....

Colab 파일이 있는 구글 드라이브에 학습에 이용할 파일을 올린 후 Colab에서 사용하는 방법입니다.

예전에도 이 방법이 있었지만, 조금 복합하고 어려웠습니다. 예전에 이용하던 방법은 아래와 같습니다.

1단계

!apt-get install -y -qq software-properties-common python-software-properties module-init-tools



!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null

!apt-get update -qq 2>&1 > /dev/null

!apt-get -y install -qq google-drive-ocamlfuse fuse

from google.colab import auth

auth.authenticate_user()

from oauth2client.client import GoogleCredentials

creds = GoogleCredentials.get_application_default()

import getpass

!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL

vcode = getpass.getpass()

!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}

2단계

!mkdir -p drive

!google-drive-ocamlfuse drive

 

3단계

import pandas as pd

trainDf = pd.read_csv("drive/app/Sample/train.csv");//Here is your file 

 

참 복잡하죠?

이젠 구글에서 제공하는 파이썬 라이브러리를 이용하면 쉽게 구글 드라이브에 존재하는 파일을 이용할 수 있습니다.

 

1 단계

Google colab에서 이용할 파일을 구글 드라이브에 업로드 합니다.

 

2 단계

Google Colaborary에서 아래와 같이 입력 합니다.

from google.colab import drive

drive.mount('/content/gdrive')

 

3 단계

아래에 보이는 링크를 클릭 합니다.

4 단계

아래와 같은 페이지나 나오면 "허용" 버튼을 클릭 합니다.

 

5 단계

아래의 코드를 복사합니다.

6 단계

아래와 같이 빨간 박스 영역에 위의 코드 값을 입력 합니다.

 

7 단계

마지막으로 아래와 같은 '/content/gdrive/xxxx/' 경로에 있는 본인이 이용하려는 파일을 코드에서 사용하면 됩니다.

with open('/content/gdrive/My Drive/foo.txt', 'w') as f:
  f.write('Hello Google Drive!')
!cat /content/gdrive/My\ Drive/foo.txt

 

그러면 아래와 같이 구글 드라이브에 있는 파일을 확인할 수 있습니다.

728x90