AI・データサイエンスの第一歩!Pythonのインストール方法を徹底解説
はじめに:AIとデータサイエンスの世界へようこそ
現代社会において、「AI(人工知能)」や「データサイエンス」という言葉を耳にしない日はないと言っても過言ではありません。スマートフォンの音声アシスタントから、ECサイトのレコメンデーション機能、医療現場での画像診断支援、金融業界での株価予測まで、その技術は私たちの生活やビジネスのあらゆる側面に浸透し、変革をもたらしています。
このエキサイティングな分野に飛び込んでみたい、自らの手でデータを操り、未来を予測するモデルを作ってみたい、そう考える方が増えているのは自然な流れでしょう。しかし、その第一歩をどこから踏み出せば良いのか、多くの人が戸惑いを感じるのも事実です。「プログラミングなんてやったことがない」「何から準備すればいいのか分からない」そんな不安を抱えていませんか?
ご安心ください。AI・データサイエンスの世界には、初心者にとっても非常に心強い「共通言語」が存在します。それが、プログラミング言語Pythonです。
Pythonは、そのシンプルで直感的な文法から、プログラミング入門者に最適な言語として知られています。それと同時に、AI・データサイエンス分野で必要とされる高度な計算やデータ分析を可能にする、極めて強力なライブラリ(機能の集合体)が豊富に揃っています。まさに、学びやすさとパワフルさを両立した、理想的な言語なのです。
この記事の目的は、AI・データサイエンスの冒険を始めるための最も重要で、そして最初のステップである「Pythonの実行環境構築」を、誰でも迷うことなく完遂できるように徹底的にサポートすることです。プログラミングの経験が全くない方、PCの操作にあまり自信がない方でも安心して進められるよう、一つひとつの手順を丁寧に、具体的な画面の文言も交えながら解説していきます。
この記事を読み終える頃には、あなたのコンピュータにはAI・データサイエンスのための強力な開発環境が整い、すぐにでもデータ分析や機械学習の学習をスタートできる状態になっているはずです。
さあ、未来を創造するテクノロジーへの扉を開きましょう。あなたのAI・データサイエンスの旅は、ここから始まります。
第1章: Pythonとは? – AI・データサイエンスの共通言語
インストール作業を始める前に、まずは私たちがこれから相棒として付き合っていく「Python」がどのような言語なのか、そしてなぜこれほどまでにAI・データサイエンス分野で愛されているのかを少しだけ深く知っておきましょう。道具の特性を理解することは、それを効果的に使いこなすための第一歩です。
Pythonの歴史と哲学
Pythonは、1991年にオランダ人のグイド・ヴァン・ロッサム氏によって開発されたプログラミング言語です。彼の開発思想は「読みやすさ」と「シンプルさ」に重きを置いており、その思想は “The Zen of Python”(Pythonの禅)という短い詩に集約されています。ターミナル(コマンドプロンプト)で import this
と入力すると表示されるこの詩には、「Beautiful is better than ugly. (醜いより美しい方がいい)」「Simple is better than complex. (複雑であるよりは平易である方がいい)」といった言葉が並びます。
この哲学により、Pythonのコードは、まるで英語の文章を読むかのように自然に理解できる構文を持っています。これにより、プログラマーは複雑なルールに頭を悩ませることなく、問題解決そのものに集中できるのです。
Pythonの主な特徴
-
シンプルで読みやすい文法: 前述の通り、これが最大の特徴です。少ないコード行数でやりたいことを実現でき、他の人が書いたコードも理解しやすいため、チームでの開発や学習効率の向上に大きく貢献します。
-
豊富なライブラリ: Pythonには「車輪の再発明はしない」という文化があります。世界中の開発者が作成した便利な機能の集合体である「ライブラリ」が膨大に存在し、それらを活用することで、データ分析、Web開発、ゲーム制作など、あらゆることを効率的に実現できます。
-
プラットフォーム非依存: Windows, macOS, Linuxといった主要なオペレーティングシステム(OS)で同じように動作します。一度書いたコードは、基本的にはどの環境でも動かすことができるため、非常に汎用性が高いと言えます。
-
インタープリタ型言語: Pythonは書いたコードを一行ずつ機械が理解できる言葉に翻訳しながら実行していく「インタープリタ型」の言語です。これにより、コードを書いてすぐに実行結果を確認できるため、トライ&エラーを繰り返しながら開発を進めるデータ分析などの作業と非常に相性が良いです。
なぜAI・データサイエンスでPythonが選ばれるのか?
Pythonが持つ汎用的な魅力に加え、AI・データサイエンス分野で圧倒的な支持を得ている決定的な理由、それはこの分野に特化した「専門ライブラリ」が驚くほど充実しているからです。以下に代表的なものをいくつかご紹介します。
-
NumPy (ナムパイ):
- Pythonで高速な数値計算、特に多次元配列(行列など)の操作を行うための基盤となるライブラリです。画像データやセンサーデータなど、AIが扱うデータの多くは数値の集まりであるため、NumPyはまさしく縁の下の力持ちとして不可欠な存在です。
-
Pandas (パンダス):
- Excelの表のような、行と列からなる「データフレーム」という形式でデータを扱うためのライブラリです。データの読み込み、欠損値の処理、集計、結合といった、データ分析の前処理(データクレンジング)において絶大な威力を発揮します。データサイエンティストが最も多くの時間を費やすのがこの前処理であり、Pandasなくしてデータ分析は始まりません。
-
Matplotlib (マットプロットリブ) / Seaborn (シーボーン):
- データをグラフや図で可視化するためのライブラリです。Matplotlibは基本的なグラフを柔軟に作成でき、SeabornはMatplotlibをベースに、より美しく統計的なグラフを簡単に描画できるように作られています。データの傾向やパターンを直感的に理解するために、可視化は極めて重要なプロセスです。
-
Scikit-learn (サイキットラーン):
- 機械学習のための総合ライブラリです。回帰、分類、クラスタリングといった代表的な機械学習アルゴリズムが数多く実装されており、数行のコードで高度な予測モデルを構築・評価できます。機械学習を学ぶ上で、誰もが最初にお世話になるライブラリと言えるでしょう。
-
TensorFlow (テンサーフロー) / PyTorch (パイトーチ):
- ディープラーニング(深層学習)のフレームワークです。Googleが開発したTensorFlow、Facebook (現Meta)が開発したPyTorchは、複雑なニューラルネットワークを構築し、大規模なデータで学習させるための機能を提供します。画像認識や自然言語処理といった最先端のAI技術は、これらのフレームワークによって支えられています。
これらの強力なライブラリ群がPythonのエコシステム(生態系)を形成しており、世界中の研究者や開発者が日々新たな知見やツールをPythonベースで公開しています。この活発なコミュニティの存在こそが、PythonをAI・データサイエンスにおける「デファクトスタンダード(事実上の標準)」の地位に押し上げているのです。
第2章: インストール前の準備と基礎知識
いよいよ実践的なインストールの話に入りますが、その前にいくつか確認・決定しておくべきことがあります。急がば回れ、ここでの準備が後のスムーズな進行に繋がります。
自分のPC環境を確認しよう
まず、あなたが使っているコンピュータのOS(オペレーティングシステム)と、そのシステムの種類(ビット数)を確認しましょう。
-
OSの確認:
- Windows: デスクトップに表示されるロゴや、スタートメニューのデザインでWindows 10かWindows 11かなどが分かります。
- macOS: 画面左上のアップルメニューから「このMacについて」を選択すると、OSのバージョン名(例: macOS Ventura)が表示されます。
-
32bit版か64bit版かの確認:
- Windows:
- スタートボタンを右クリックし、「システム」を選択します。
- 「デバイスの仕様」の項目にある「システムの種類」を確認します。「64ビット オペレーティングシステム、x64ベース プロセッサ」のように表示されていれば64bit版です。近年のPCはほとんどが64bit版ですが、念のため確認しましょう。
- macOS:
- macOS Catalina (10.15) 以降は64bitに完全移行しているため、確認は不要です。それより古いmacOSをお使いの場合は、アップグレードを検討することをお勧めします。
- Windows:
Pythonのバージョンについて
Pythonには大きく分けて「Python 2」と「Python 3」という2つの系統が存在しました。しかし、Python 2は2020年1月1日に公式サポートが終了しており、現在ではセキュリティアップデートも行われていません。これからAI・データサイエンスを学ぶあなたは、迷うことなくPython 3を選択してください。本記事で紹介する方法も、もちろんPython 3をインストールするものです。
インストール方法の選択肢:公式 vs Anaconda
Pythonをインストールする方法は、主に2つあります。
-
Python公式サイトのインストーラー:
- Python.orgからダウンロードできる、Python本体のみをインストールする方法です。非常にシンプルですが、前述したNumPyやPandasといったデータサイエンス用ライブラリは含まれていないため、後から自分で一つひとつ追加(インストール)する必要があります。
-
Anaconda (アナコンダ) ディストリビューション:
- Python本体に加えて、先ほど紹介したNumPy, Pandas, Matplotlib, Scikit-learn, Jupyter Notebookといった、データサイエンスで頻繁に使われる1,500以上ものライブラリやツールをまとめてインストールしてくれるパッケージです。
結論から言うと、AI・データサイエンスを目的とする初心者の方には、Anacondaの利用を強く、強く推奨します。
なぜAnacondaを推奨するのか?
- 手間の大幅な削減: ライブラリを個別にインストールする手間が一切かかりません。インストールが完了した瞬間から、すぐにデータ分析を始められる環境が手に入ります。
- 依存関係の問題を回避: ライブラリ同士には「Aを使うにはBのバージョンX以上が必要」といった依存関係があり、これを手動で管理するのは非常に厄介です。Anacondaは
conda
という優れたパッケージ管理システムを持っており、これらの依存関係を自動で解決してくれます。 - Jupyter Notebookの同梱: 後ほど詳しく解説しますが、Jupyter Notebookはデータ分析の試行錯誤に最適な、インタラクティブな開発ツールです。Anacondaをインストールすれば、これもすぐに使えるようになります。
- 仮想環境の管理が容易: プロジェクトごとにライブラリのバージョンを切り替えたい場合などに役立つ「仮想環境」という仕組みを、
conda
コマンドで簡単に作成・管理できます(これも後述します)。
まさに、Anacondaは「AI・データサイエンスのためのオールインワン・スターターキット」なのです。本記事では、このAnacondaを使ったインストール方法を、WindowsとmacOSそれぞれについて詳しく解説していきます。
第3章: 【実践】Anacondaのインストール (Windows編)
お待たせしました。ここからはWindows PCにAnacondaをインストールする具体的な手順を解説します。一つひとつ、画面を確認しながら進めていきましょう。
ステップ1: Anacondaインストーラーのダウンロード
-
まず、Webブラウザ(Google Chrome, Microsoft Edgeなど)を開き、Anacondaの公式サイトにアクセスします。検索エンジンで「Anaconda」と検索すれば、一番上に出てくるはずです。(URLは
https://www.anaconda.com/
です) -
サイトにアクセスすると、多くの場合、トップページに「Download」や「Get Started」といったボタンがあります。それをクリックしてください。
-
ダウンロードページに移動すると、Windows, macOS, Linux用のインストーラーが並んでいます。Windowsのセクションを見つけてください。
-
ここでPythonのバージョンを選択しますが、通常は最新のPython 3系がデフォルトで選択されています。それで問題ありません。
-
「64-Bit Graphical Installer」 というリンクをクリックします。これが、先ほど確認した64bit版Windows用の、グラフィカルなインターフェースで簡単にインストールできるインストーラーです。
-
クリックすると、
Anaconda3-xxxx.xx-Windows-x86_64.exe
というような名前のファイル(数百MBあります)のダウンロードが開始されます。完了するまでしばらく待ちましょう。
ステップ2: インストーラーの実行と設定
ダウンロードが完了したら、その .exe
ファイルをダブルクリックしてインストーラーを起動します。
-
Welcome to Anaconda3…:
- 最初の画面です。「Next >」をクリックして進みます。
-
License Agreement (ライセンス契約):
- ライセンス契約書が表示されます。内容を確認し、「I Agree」をクリックします。
-
Select Installation Type (インストールタイプの選択):
- 「Just Me (recommended)」と「All Users」の2つの選択肢が表示されます。
- 「Just Me」 を選択することを強く推奨します。これは、現在ログインしているユーザーアカウントに対してのみAnacondaをインストールする方法です。管理者権限が不要で、後のトラブルも少ないです。
- 「Next >」をクリックします。
-
Choose Install Location (インストール先の選択):
- Anacondaをインストールするフォルダを指定します。通常はデフォルトのままで問題ありません。
- 【重要】 インストール先のパス(フォルダ名)に日本語や全角文字が含まれていないことを必ず確認してください。例えば、ユーザー名が日本語(例:
C:\Users\山田太郎\anaconda3
)になっていると、将来的にライブラリが正しく動作しない原因になります。もしユーザー名が日本語の場合は、C:\Anaconda3
のように、Cドライブ直下など、パスに日本語が含まれない場所を指定してください。 - 確認したら「Next >」をクリックします。
-
Advanced Installation Options (高度なインストールオプション):
- ここは非常に重要な設定画面です。2つのチェックボックスがあります。
- “Add Anaconda3 to my PATH environment variable” (Anaconda3をPATH環境変数に追加する)
- インストーラーには “(not recommended)” と書かれていますが、これは他のPython環境との競合を避けるための注意書きです。初めてPythonをインストールする方で、PC内に他にPythonをインストールしていない場合は、ここにチェックを入れても大きな問題はありません。
- 【推奨する選択】 ここでは、より安全で公式が推奨する方法に従い、このチェックは外したままにしておきましょう。チェックを外した場合、通常のコマンドプロンプトから
python
コマンドは使えませんが、後述する「Anaconda Prompt」という専用のコマンドプロンプトを使えば全く問題なく利用できます。この方法が最もトラブルが少ないです。
- “Register Anaconda3 as my default Python 3.x” (Anaconda3をデフォルトのPython 3.xとして登録する)
- こちらはチェックを入れたままにしておきましょう。これにより、Pythonスクリプトファイル(.py)をダブルクリックしたときなどに、このAnacondaのPythonが使われるようになります。
-
設定が完了したら、「Install」ボタンをクリックします。インストールが開始されますので、完了まで数分間待ちます。PCの性能によっては10分以上かかることもあります。
ステップ3: インストールの完了と確認
-
Installation Complete:
- 「Completed」と表示されたら、インストールは無事完了です。「Next >」をクリックします。
- 次の画面ではAnacondaの他のツール(PyCharmなど)の紹介が表示されることがありますが、「Next >」で進み、最後の画面で「Finish」をクリックしてインストーラーを閉じます。途中で「Launch Anaconda Navigator」などのチェックボックスがあれば、チェックを外してしまって構いません。
-
インストール後の動作確認:
-
正しくインストールされたかを確認しましょう。
-
① Anaconda Promptの起動
- Windowsのスタートボタンをクリックします。
- アプリ一覧から「Anaconda3 (64-bit)」というフォルダを探します。
- その中にある「Anaconda Prompt (anaconda3)」をクリックして起動します。
- 黒い画面(ターミナル)が開き、行の先頭に
(base)
と表示されていれば成功です。この(base)
は、現在Anacondaの基本環境(base environment)が有効になっていることを示しています。
-
② バージョンの確認
- 起動したAnaconda Promptに、以下のコマンドを1行ずつ入力し、それぞれEnterキーを押して実行してみてください。
bash
python --version
実行結果の例:Python 3.11.5
(インストールしたバージョンが表示されます)bash
conda --version
実行結果の例:conda 23.7.2
(condaのバージョンが表示されます)bash
conda list
実行結果: インストールされているライブラリの一覧(numpy, pandasなど)がズラッと表示されます。 -
これらのコマンドがエラーなく実行でき、バージョン情報やライブラリ一覧が表示されれば、Anacondaのインストールと環境構築は完璧に成功しています!
-
第4章: 【実践】Anacondaのインストール (macOS編)
次に、macOSをお使いの方向けに、Anacondaのインストール手順を解説します。基本的な流れはWindowsと似ていますが、mac特有の点もありますので注意して進めましょう。
ステップ1: Anacondaインストーラーのダウンロード
-
まず、ご自身のMacが搭載しているCPUの種類を確認します。
- 画面左上のアップルメニューから「このMacについて」を選択します。
- 「プロセッサ」または「チップ」の項目を確認し、「Apple M1/M2/M3…」と表示されていればAppleシリコン、「Intel Core i…」と表示されていればIntel製CPUです。この違いによってダウンロードするインストーラーが変わります。
-
Webブラウザ(Safariなど)でAnacondaの公式サイトにアクセスします。(
https://www.anaconda.com/
) -
「Download」ボタンなどをクリックしてダウンロードページに進みます。
-
macOSのセクションを見つけ、先ほど確認したCPUの種類に合わせてインストーラーを選択します。
- Appleシリコンの場合: 「M1/M2」や「Apple Silicon」といった表記のあるインストーラーを選びます。
- Intel製CPUの場合: 「Intel」や「x86」といった表記のあるインストーラーを選びます。
- 通常は「Graphical Installer」(ファイル拡張子が
.pkg
のもの)を選択するのが簡単でおすすめです。
-
クリックすると、インストーラーファイルのダウンロードが始まります。完了まで待ちましょう。
ステップ2: インストーラーの実行と設定
ダウンロードが完了したら、Finderの「ダウンロード」フォルダなどにある .pkg
ファイルをダブルクリックしてインストーラーを起動します。
-
はじめに:
- インストーラーが起動し、概要が表示されます。「続ける」をクリックします。
-
大切な情報 (Readme):
- 注意事項などが表示されます。一読して「続ける」をクリックします。
-
使用許諾契約 (License):
- ライセンス契約書が表示されます。「続ける」をクリックし、確認ダイアログで「同意する」をクリックします。
-
インストール先の選択 (Destination Select):
- 通常は変更する必要はありません。そのまま「続ける」をクリックします。
-
インストールの種類 (Installation Type):
- ここでインストール先をカスタマイズできますが、ほとんどの場合、「このコンピュータのすべてのユーザ用にインストール」ではなく、「自分専用にインストール」 を選択するのが良いでしょう。これにより、管理者パスワードの入力が不要になり、ホームディレクトリ内にインストールされます。
- 「インストール」ボタンをクリックします。
- (もし「すべてのユーザ用に~」を選択した場合は、ここでMacのログインパスワードを求められます。)
-
インストールが開始されます。ファイルが書き込まれるまで数分間待ちます。
ステップ3: インストールの完了と確認
-
概要 (Summary):
- インストールが正常に完了したことを示す画面が表示されます。「閉じる」をクリックしてインストーラーを終了します。インストーラーファイルをゴミ箱に入れるか聞かれたら、入れてしまって構いません。
-
インストール後の動作確認:
-
macOSでは「ターミナル」というアプリを使ってコマンドを実行します。
-
① ターミナルの起動
- Launchpad(ロケットのアイコン)から「その他」フォルダの中にある「ターミナル」を起動するか、画面右上の虫眼鏡アイコン(Spotlight検索)をクリックして「ターミナル」と入力して起動します。
-
② シェルの初期化
- インストーラーが、ターミナルの設定ファイル(
.zshrc
など)にAnacondaを有効化するための設定を書き込んでいます。初めてターミナルを起動した際に、conda init
を実行するかどうか聞かれる場合があります。指示に従ってyes
と入力するなどして初期化を完了させてください。 - ターミナルを一度閉じて、再度開き直すと、プロンプト(入力待ちの行)の先頭に
(base)
と表示されるようになります。これが表示されていれば、Anacondaが正しく有効化されています。
- インストーラーが、ターミナルの設定ファイル(
-
③ バージョンの確認
- 起動したターミナルに、Windowsの時と同じように以下のコマンドを入力し、Enterキーで実行します。
bash
python --version
実行結果の例:Python 3.11.5
bash
conda --version
実行結果の例:conda 23.7.2
bash
conda list
実行結果: numpy, pandasなどを含むライブラリの一覧が表示されます。
これらのコマンドが正常に実行されれば、macOSへのAnacondaのインストールは成功です!
-
第5章: Pythonを使ってみよう! – はじめてのプログラミング体験
環境構築、お疲れ様でした!これであなたはAI・データサイエンスの世界の住人です。早速、構築した環境を使って、Pythonに触れてみましょう。ここでは、データサイエンスで最もよく使われるツール「Jupyter Notebook」の使い方を紹介します。
Jupyter Notebookとは?
Jupyter Notebook(ジュピター・ノートブック)は、Webブラウザ上で動作する、非常にインタラクティブなPythonの実行環境です。その最大の特徴は、「セル」と呼ばれるブロックにプログラムコード、説明文、実行結果、グラフなどをまとめて記述できる点にあります。
- コードの実行と結果の確認が容易: コードを少し書いては実行し、結果を確認するという、データ分析の試行錯誤のプロセスに最適です。
- 思考のプロセスを記録できる: Markdownという記法を使って、コードの間に見出しや説明文、箇条書きなどを自由に挿入できます。これにより、分析の目的や考察などをコードと一緒に記録した「実行可能なドキュメント」を作成できます。
- 結果の共有がしやすい: 分析結果のグラフや表を含んだノートブックファイルをそのまま共有できるため、他の人への報告や説明が非常にスムーズになります。
Jupyter Notebookの起動方法
起動方法は2つあります。
-
Anaconda Navigatorから起動 (GUI):
- WindowsのスタートメニューやmacOSのLaunchpadから「Anaconda Navigator」を起動します。
- 少し待つと、様々なツールのアイコンが並んだ画面が表示されます。
- その中から「Jupyter Notebook」の「Launch」ボタンをクリックします。
-
Anaconda Prompt / ターミナルから起動 (CUI):
- Windowsなら「Anaconda Prompt」、macOSなら「ターミナル」を起動します。
- 以下のコマンドを入力してEnterキーを押します。
bash
jupyter notebook
いずれかの方法で起動すると、自動的にWebブラウザが立ち上がり、Jupyter Notebookの「ダッシュボード」画面が表示されます。この画面には、コマンドを実行した場所(ホームディレクトリなど)のファイル一覧が表示されています。
Jupyter Notebookの基本操作
-
新しいNotebookの作成:
- ダッシュボード画面の右上にある「New」ボタンをクリックし、ドロップダウンメニューから「Python 3 (ipykernel)」(またはそれに類する名前)を選択します。
- すると、新しいタブで「Untitled.ipynb」という名前のノートブックが開きます。これがあなたの作業スペースです。
-
セルの種類:
- ノートブックは「セル」の集まりで構成されます。重要なのは2種類です。
- Codeセル: Pythonのコードを書き、実行するためのセルです。(デフォルト)
- Markdownセル: 見出しや文章など、メモを書くためのセルです。セルの種類は、上部のツールバーで切り替えられます。
-
コードの入力と実行:
- 最初に表示されている長方形の枠(Codeセル)に、以下のコードを入力してみましょう。
python
print("Hello, AI World!")- コードを入力したら、
Shift + Enter
キーを同時に押します。これが「セルの実行」のショートカットです。 - すると、セルのすぐ下に
Hello, AI World!
と実行結果が表示され、新しいセルが下に追加されます。
-
もう少しデータサイエンスらしいことをしてみよう:
-
新しいCodeセルに、以下のコードを順番に入力して、それぞれ
Shift + Enter
で実行してみてください。 -
① ライブラリの読み込み
python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
(これは、NumPy, Pandas, Matplotlibを使うための準備のおまじないです)- ② 簡単なデータを作成
python
data = {'year': [2020, 2021, 2022, 2023, 2024],
'subscribers': [100, 150, 220, 350, 500]}
df = pd.DataFrame(data)
df
(Pandasを使って、年ごとの登録者数を表形式のデータにしています。最後のdf
だけで実行すると、綺麗な表が表示されるはずです。)- ③ データをグラフで可視化
python
plt.plot(df['year'], df['subscribers'], marker='o')
plt.title('Subscribers Growth')
plt.xlabel('Year')
plt.ylabel('Number of Subscribers')
plt.grid(True)
plt.show()
(Matplotlibを使って、先ほどのデータを折れ線グラフにしています。セルの下にグラフが表示されたら大成功です!) -
-
Notebookの保存と終了:
- 左上の「Untitled」をクリックして、好きな名前(例:
my_first_analysis
)に変更できます。 - Notebookは自動的に保存されますが、フロッピーディスクのアイコンをクリックして手動で保存もできます。
- 作業を終えるには、ブラウザのタブを閉じるだけです。
- Jupyter Notebook自体を終了させるには、起動に使ったAnaconda Prompt / ターミナルで
Ctrl + C
を2回押します。
- 左上の「Untitled」をクリックして、好きな名前(例:
第6章: 環境管理の基礎 – Condaコマンド入門
最後に、Anacondaの心臓部とも言える conda
コマンドを使った「仮想環境」の管理について、その基礎を学んでおきましょう。これは少し上級者向けの内容ですが、知っておくと将来必ず役立ちます。
なぜ仮想環境が必要なのか?
あなたが今後、複数のプロジェクトに関わることを想像してみてください。
* プロジェクトAでは、TensorFlow 2.8 と Pandas 1.5 が必要。
* プロジェクトBでは、最新のTensorFlow 3.0 と Pandas 2.1 が必要。
もし、これらを1つの環境(base環境)にインストールしようとすると、ライブラリのバージョンが衝突してしまい、どちらかのプロジェクトが動かなくなってしまいます。
仮想環境とは、こうした問題を解決するために、プロジェクトごとに独立したPythonの実行環境(ライブラリのセット)を作成する仕組みです。まるで、プロジェクトごとに専用のPCルームを用意するようなものです。これにより、他のプロジェクトに影響を与えることなく、ライブラリを自由にインストール・管理できます。
基本的なCondaコマンド
(※コマンドはすべてAnaconda Prompt / ターミナルで実行します)
-
仮想環境の作成:
my_project_env
という名前で、Python 3.10 を使う環境を作成する場合
bash
conda create --name my_project_env python=3.10
途中で[y/n]
と聞かれたらy
を入力してEnterを押します。 -
仮想環境の一覧表示:
bash
conda env list
base
環境と、今作成したmy_project_env
が表示されるはずです。アスタリスク*
が付いているのが現在有効な環境です。 -
仮想環境の有効化 (アクティベート):
- 作成した環境に「入る」操作です。
bash
conda activate my_project_env
実行すると、プロンプトの(base)
が(my_project_env)
に変わります。この状態になれば、ここからインストールするライブラリはmy_project_env
の中にだけインストールされます。 -
ライブラリのインストール:
- 有効化した環境に、特定のライブラリをインストールします。
bash
conda install numpy pandas scikit-learn -
仮想環境の無効化 (ディアクティベート):
- 現在の環境から「出る」操作です。
base
環境に戻ります。
bash
conda deactivate
プロンプトが(base)
に戻ります。 - 現在の環境から「出る」操作です。
-
仮想環境の削除:
- 不要になった環境を完全に削除します。
bash
conda env remove --name my_project_env
最初は base
環境で学習を進めて全く問題ありませんが、本格的な開発や複数のチュートリアルを試すようになったら、この仮想環境の考え方をぜひ活用してください。
おわりに:あなたの旅は、今始まったばかり
ここまで本当にお疲れ様でした!この記事を最後まで読み進め、実際に手を動かしたあなたは、もはや「何から始めればいいか分からない」初心者ではありません。AI・データサイエンスの世界で戦うための最も重要な武器、Pythonの実行環境を手に入れた、正真正銘の冒険者です。
この記事では、以下のことを学びました。
- PythonがAI・データサイエンスに最適な理由
- 初心者にとってAnacondaが最良の選択であること
- WindowsとmacOSそれぞれにおける、Anacondaの具体的なインストール手順
- データ分析の強力なツール、Jupyter Notebookの基本的な使い方
- 将来役立つ、Condaによる仮想環境管理の基礎
これはゴールではなく、壮大な旅のスタートラインです。あなたの目の前には、データを解き明かし、未来を予測し、新たな価値を創造するための無限の可能性が広がっています。
次のステップへの道しるべとして、以下のような学習に進むことをお勧めします。
-
Pythonの基礎文法を学ぶ:
- 変数、データ型、if文、for文、関数など、プログラミングの基本的なルールを学びましょう。Progate, PyQ, Udemyといったオンライン学習サイトや、入門者向けの書籍が役立ちます。
-
データサイエンスライブラリを深く学ぶ:
- Pandasを使ったデータ操作、MatplotlibやSeabornを使ったデータ可視化のテクニックを、チュートリアルなどを通じて集中的に学びましょう。
-
小さな分析に挑戦する:
- Kaggleなどのデータ分析コンペサイトには、初心者向けのチュートリアル用データセットが豊富にあります。タイタニック号の生存者予測などは、定番の入門課題です。
学習の過程では、エラーが出たり、分からないことにぶつかったりすることもあるでしょう。しかし、心配はいりません。今のあなたには、世界中の開発者が集う巨大なコミュニティがついています。エラーメッセージを検索すれば、ほとんどの場合、解決策が見つかるはずです。
探求心を忘れず、楽しみながら一歩一歩進んでいってください。あなたの手でデータが意味を持ち、コードが知性を生み出す瞬間は、何物にも代えがたい感動を与えてくれるはずです。
あなたのAI・データサイエンスの旅が、実り多き素晴らしいものになることを心から応援しています!