はじめに
「機械学習を始めたいけど、環境構築が面倒」という方に朗報です。Google Colaboratory(Colab)を使えば、ブラウザだけで機械学習の環境が整います。インストール作業ゼロ、しかも無料です。
僕もSignateのコンペや勉強では今でもColabを活用しています。特にGPUが必要な深層学習は、Colabの無料GPUが大変助かります。この記事ではColabの基本的な使い方から、実務・学習での活用方法まで解説します。
Google Colabとは
Google Colaboratoryは、Googleが提供するクラウドベースのJupyter Notebook環境です。
- 無料で使える(有料プランもあり)
- GPUが無料で使える(使用時間に制限あり)
- 主要ライブラリが事前インストール済み:TensorFlow・PyTorch・scikit-learn・pandasなど
- Google Driveと連携:ファイルの保存・読み込みが簡単
Colabの基本的な使い方
アクセス方法
- https://colab.research.google.com にアクセス
- Googleアカウントでログイン
- 「新しいノートブック」をクリック
セルの実行
# Shift+Enterでセルを実行
import numpy as np
print(np.__version__)
GPUの有効化
- 「ランタイム」→「ランタイムのタイプを変更」
- ハードウェアアクセラレータで「GPU」を選択
- 「保存」をクリック
import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))
# GPU情報が表示されれば有効化成功
Google Driveとの連携
from google.colab import drive
# Driveをマウント
drive.mount('/content/drive')
# Driveのファイルを読み込む
import pandas as pd
df = pd.read_csv('/content/drive/MyDrive/data/sales.csv')
print(df.head())
# 結果をDriveに保存
df.to_csv('/content/drive/MyDrive/data/output.csv', index=False)
ライブラリのインストール
デフォルトで入っていないライブラリは!(ビックリマーク)でインストールできます。
!pip install lightgbm optuna japanize-matplotlib
Colabでの機械学習の流れ
# 完全な機械学習の流れ(Colab上)
from google.colab import drive
drive.mount('/content/drive')
import pandas as pd
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report
import joblib
# データ読み込み
df = pd.read_csv('/content/drive/MyDrive/data.csv')
X = df.drop('target', axis=1)
y = df['target']
# 前処理
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 分割
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
# 学習
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
# 評価
print(classification_report(y_test, model.predict(X_test)))
# 保存
joblib.dump(model, '/content/drive/MyDrive/model.pkl')
print("保存完了")
Colabの注意点
- セッションの制限:無料版は90分〜12時間でセッションが切れる。長い学習は有料版(Colab Pro)を検討する
- ファイルの消失:/contentに保存したファイルはセッション終了で消える。必ずDriveに保存する
- GPU割り当て制限:GPUを長時間使いすぎると割り当てが制限される
ローカル環境との使い分け
- Colab向き:GPU必要な深層学習・大容量データ・環境構築したくない時
- ローカル向き:秘密情報を含むデータ・長時間実行が必要な処理・インターネット接続なし環境
まとめ
Google Colabは機械学習の入門として最適な環境です。特にGPUが使える点は大きな強みで、深層学習の学習コストを大幅に下げてくれます。Driveと連携してデータを管理し、セッション切れに備えて定期的に保存する習慣をつけると、快適に使えます。まずはColabにアクセスして、Pythonのコードを1行動かしてみることから始めてみてください。
📌 プログラミング・AI学習のおすすめスクール
- 資格と仕事に強い個人レッスン → 【Winスクール】プログラミング・AI講座

※本記事にはアフィリエイトリンクが含まれます。


コメント