はい、承知いたしました。
pandasでDataFrameをリストに変換する際にto_list()
が最適解である理由について、詳細な説明を含む約5000語の記事を作成します。
【完全版】pandasでDataFrameをリストに変換するならto_list()
が最適解な理由
はじめに:なぜPandasのデータをリストに変換するのか?
データ分析の強力なライブラリであるPandasは、DataFrame
という二次元の表形式データ構造を主軸に、多種多様なデータ操作を可能にします。データの読み込み、クリーニング、集計、結合といった一連のプロセスを、Pandasのエコシステム内で完結させることも少なくありません。
しかし、データ分析のワークフローはPandasだけで終わるわけではありません。多くの場合、整形・加工したデータをPandasの外、つまり他のライブラリやシステムと連携させる必要があります。このような場面で頻繁に登場するのが、「DataFrame(あるいはその一部であるSeries)をPythonのネイティブなlist
に変換する」という操作です。
具体的には、以下のようなシーンでリストへの変換が求められます。
-
機械学習ライブラリへの入力:
scikit-learn
などの機械学習ライブラリは、特徴量やターゲット変数の入力としてNumPy配列やPythonのリストを受け取ることが多いです。Pandas DataFrameで前処理を終えた後、特定の列をリストに変換してモデルに渡すのは典型的なパターンです。 -
Web APIへのデータ送信 (JSON形式):
Webアプリケーションやマイクロサービスと連携する際、データをJSON形式でやり取りするのが一般的です。DataFrameを直接JSONに変換することも可能ですが、特定の列の値をリストとして抽出し、JSONペイロードの一部として組み込むケースも多々あります。 -
データベースへの一括挿入:
executemany
のようなデータベースAPIを使い、複数のレコードを一度に挿入する場合、タプルのリストや値のリストといった形式でデータを用意する必要があります。Pandasで処理した結果をリストに変換し、データベースに効率的に書き込むことができます。 -
Pythonネイティブな処理との連携:
Pandasが提供する機能よりも、Pythonの標準ライブラリや他のサードパーティライブラリの方が特定の処理に適している場合があります。そのようなライブラリがリストを引数として要求する場合、変換が必要になります。 -
レポートや描画ライブラリへのデータ渡し:
Matplotlib
やSeaborn
はPandas DataFrameを直接受け取ることができますが、よりカスタマイズ性の高いプロットを作成する場合や、Plotly
などの一部の機能では、データをリスト形式で渡す方が便利なことがあります。
このように、DataFrameからリストへの変換は、データ分析実務において避けては通れない基本的な操作です。そして、この操作には驚くほど多くの方法が存在します。list()
コンストラクタを使う方法、NumPy配列を経由する方法、ループを使う方法など様々です。
では、数ある選択肢の中で、なぜSeries.to_list()
が「最適解」と呼べるのでしょうか?
本記事では、まず結論としてto_list()
が優れている理由を簡潔に述べた後、他の変換方法と比較しながら、その優位性を「可読性」「パフォーマンス」「一貫性」という3つの観点から徹底的に掘り下げていきます。具体的なコード例やパフォーマンスのベンチマークも交えながら、あなたのPandasコーディングを一段上のレベルに引き上げるための知識を提供します。
結論ファースト:to_list()
が最適解である理由
もしあなたがPandasの特定の列(これはSeries
オブジェクトです)をリストに変換したいのであれば、df['column_name'].to_list()
を使うのが最善の選択です。その理由は、以下の3点に集約されます。
-
直感的で読みやすい(可読性):
to_list()
というメソッド名は、「リストに変換する」という操作の意図を明確に表現しています。コードを読む誰もが、一目で何をしているのかを理解できます。 -
高速なパフォーマンス:
to_list()
は、内部的にC言語で最適化された処理を用いており、Pythonの素のループなどと比較して圧倒的に高速です。大規模なデータセットを扱う際には、このパフォーマンスの差が顕著になります。 -
Pandasの流儀に沿った一貫性(保守性):
Pandasにはto_csv()
,to_dict()
,to_json()
など、データを特定の形式に変換するためのto_...()
という命名規則のメソッドが数多く存在します。to_list()
もこの規則に則っており、PandasのAPIとしての統一感を保っています。この一貫性は、コードの学習コストを下げ、保守性を高めます。
シンプルさ、速さ、そして明瞭さ。この三拍子が揃っているからこそ、to_list()
は単なる一つの方法ではなく、「最適解」なのです。
Pandasのデータをリストに変換する多彩な方法
to_list()
の素晴らしさを理解するために、まずは他にどのような変換方法があるのかを知ることから始めましょう。ここでは、代表的な方法をコード例と共に紹介します。
サンプルとして、以下のようなDataFrameを使用します。
“`python
import pandas as pd
import numpy as np
data = {
‘name’: [‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Emily’],
‘age’: [25, 32, 18, 47, 25],
‘score’: [88.5, 91.0, np.nan, 76.5, 91.0],
‘city’: [‘New York’, ‘London’, ‘Paris’, ‘Tokyo’, ‘London’]
}
df = pd.DataFrame(data)
print(df)
name age score city
0 Alice 25 88.5 New York
1 Bob 32 91.0 London
2 Charlie 18 NaN Paris
3 David 47 76.5 Tokyo
4 Emily 25 91.0 London
“`
3-1. Series.to_list()
/ Index.to_list()
:王道
これは本記事の主役です。PandasのSeries
(DataFrameの単一列)やIndex
オブジェクトに用意されているメソッドです。
“`python
‘name’列をリストに変換
name_list = df[‘name’].to_list()
print(name_list)
[‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Emily’]
Indexをリストに変換
index_list = df.index.to_list()
print(index_list)
[0, 1, 2, 3, 4]
“`
特徴:
* Series
またはIndex
オブジェクト専用のメソッド。
* メソッド名が操作内容を直接表しており、非常に明快。
* 高速に動作する。
3-2. values
属性 + tolist()
:伝統的な方法
Pandas 1.0以前からよく使われてきた方法です。.values
属性でSeriesをNumPy配列に変換し、さらにNumPy配列の.tolist()
メソッドでPythonのリストに変換します。
“`python
.valuesでNumPy配列を取得し、.tolist()でリストに変換
age_list = df[‘age’].values.tolist()
print(age_list)
[25, 32, 18, 47, 25]
“`
特徴:
* NumPy配列を中間生成物として利用する。
* 比較的古くからある方法で、多くの既存コードで見られる。
* .values
属性は、返すものがNumPy配列である保証がなく、将来的に挙動が変わる可能性があるため、現在では.to_numpy()
の使用が推奨されています。
3-3. to_numpy()
メソッド + tolist()
:現代的な推奨方法
.values
の問題点を解消するために導入されたのが.to_numpy()
メソッドです。これにより、確実にNumPy配列を取得できます。その後の手順はvalues
と同様です。
“`python
.to_numpy()でNumPy配列を取得し、.tolist()でリストに変換
score_list = df[‘score’].to_numpy().tolist()
print(score_list)
[88.5, 91.0, nan, 76.5, 91.0]
“`
特徴:
* .values
よりも推奨される、現代的なアプローチ。
* to_list()
とパフォーマンス面ではほぼ同等。
* to_list()
に比べると、to_numpy().tolist()
と少し冗長。
3-4. list()
コンストラクタ:Pythonicなアプローチ
Pythonの組み込み関数であるlist()
を使って、Seriesを直接リストに変換することもできます。
“`python
list()コンストラクタにSeriesを渡す
city_list = list(df[‘city’])
print(city_list)
[‘New York’, ‘London’, ‘Paris’, ‘Tokyo’, ‘London’]
“`
特徴:
* 非常にシンプルでPythonらしい書き方。
* to_list()
とパフォーマンスはほぼ同等。
* PandasのオブジェクトをPythonの組み込み関数で扱う形になる。
3-5. ループ処理(リスト内包表記、forループ):柔軟だが遅い
最も基本的なPythonの機能であるループを使ってもリストを作成できます。リスト内包表記を使うと簡潔に書けます。
“`python
リスト内包表記
name_list_comprehension = [name for name in df[‘name’]]
print(name_list_comprehension)
[‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Emily’]
通常のforループ
name_list_forloop = []
for name in df[‘name’]:
name_list_forloop.append(name)
print(name_list_forloop)
[‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Emily’]
“`
特徴:
* 変換の過程で各要素に追加の処理を加えたい場合に柔軟に対応できる。
* PandasやNumPyの内部最適化の恩恵を受けられないため、データ量が大きくなると著しくパフォーマンスが低下する。
* 単純な変換目的で使うのは非効率。
3-6. iterrows()
/ itertuples()
:行ごとの処理には向くが、リスト変換には不向き
iterrows()
やitertuples()
はDataFrameを行ごとに反復処理するためのメソッドです。これらを使ってリストを作ることも技術的には可能ですが、全く推奨されません。
“`python
iterrows() – 非推奨
age_list_iterrows = [row[‘age’] for index, row in df.iterrows()]
print(age_list_iterrows)
[25, 32, 18, 47, 25]
“`
特徴:
* 行ごとに複雑な処理が必要な場合に使うメソッドであり、単純なリスト変換が目的ではない。
* iterrows()
は各行でSeries
オブジェクトを生成するため、極めてパフォーマンスが悪い。
* アンチパターンとして有名。
3-7. to_dict('list')
:列名をキーとする辞書を得る方法
これは少し毛色が異なりますが、関連する変換として紹介します。to_dict('list')
は、各列をリストに変換し、列名をキーとする辞書を作成します。
“`python
data_dict = df.to_dict(‘list’)
print(data_dict)
{
‘name’: [‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Emily’],
‘age’: [25, 32, 18, 47, 25],
‘score’: [88.5, 91.0, nan, 76.5, 91.0],
‘city’: [‘New York’, ‘London’, ‘Paris’, ‘Tokyo’, ‘London’]
}
この辞書から特定の列のリストを取得
age_list_from_dict = data_dict[‘age’]
print(age_list_from_dict)
[25, 32, 18, 47, 25]
“`
特徴:
* DataFrame全体を一度に、列ごとのリストの集合(辞書)に変換する。
* 複数の列をリストとして扱いたい場合に便利。
* 単一の列をリストにしたいだけなら、遠回りな方法。
徹底比較!なぜto_list()
は優れているのか?
さて、様々な変換方法を見てきました。これらの中で、なぜto_list()
が頭一つ抜けているのでしょうか。その理由を「可読性」「パフォーマンス」「一貫性」の観点から深掘りします。
4-1. 可読性と保守性:コードは未来の自分のために書く
ソフトウェア開発の有名な格言に、「コードはコンピュータが理解するために書かれる。良いコードは人間が理解するために書かれる」というものがあります。データ分析のコードも例外ではありません。数週間後、数ヶ月後に自分自身がコードを読み返したとき、あるいは同僚がコードレビューをするとき、その意図が瞬時に理解できることが非常に重要です。
この「可毒性」の観点で、各方法を比較してみましょう。
“`python
どのコードが最も「age列をリストにする」という意図を明確に伝えているか?
A: to_list()
list_a = df[‘age’].to_list()
B: to_numpy().tolist()
list_b = df[‘age’].to_numpy().tolist()
C: list()コンストラクタ
list_c = list(df[‘age’])
D: ループ
list_d = [age for age in df[‘age’]]
“`
to_list()
の圧勝
list_a
のコードは、英語の文章を読むかのように自然です。「DataFrameの’age’列を、リストにしなさい(to list)」。これ以上ないほど直接的で、誤解の余地がありません。Pandasの操作をしている文脈の中で、to_list()
というメソッドが出てくれば、誰もがその役割を即座に理解できます。
to_numpy().tolist()
の評価
list_b
も意図は伝わりますが、ワンステップ余計です。「NumPy配列に変換し(to_numpy)、それをリストに変換する(tolist)」。なぜ一度NumPyを経由する必要があるのか?という疑問が読み手の頭をよぎるかもしれません。最終目的がリストであるならば、to_list()
の方がより直接的です。
list()
コンストラクタの評価
list_c
は非常にPythonicで、多くのPythonプログラマにとって馴染み深い書き方です。しかし、Pandasの文脈においては、to_list()
の方が「Pandasオブジェクトを操作している」という意識を明確に保てます。list()
はジェネリックなコンストラクタであり、to_list()
はSeries
オブジェクトに特化したメソッドです。特化したメソッドがある場合は、そちらを使う方がコードの意図がよりシャープになります。これは好みの問題も含まれますが、チーム開発などでは規約としてto_list()
に統一する方が、コードベースの一貫性が高まります。
ループの評価
list_d
は、単純な変換以上のことをしているのではないか?と読み手に勘ぐらせる可能性があります。「なぜわざわざループを?何か要素ごとに特別な処理をしているのか?」とコードの内部を精査する必要が出てきます。単純な変換には冗長であり、可読性を損ないます。
結論として、可読性と保守性の観点ではto_list()
が群を抜いて優れています。 意図が明確なコードは、バグの温床になりにくく、将来のメンテナンスを容易にします。
4-2. パフォーマンスベンチマーク:速さは正義
データ分析では、数百万、数千万行のデータを扱うことも珍しくありません。そのような状況では、処理のパフォーマンスがプロジェクト全体の生産性に直結します。ここでは、各方法の速度をtimeit
モジュールを使って実際に計測し、比較してみましょう。
データサイズを3段階(100行、10万行、100万行)で用意し、それぞれの方法でage
列をリストに変換する時間を計測します。
計測コード:
“`python
import pandas as pd
import numpy as np
import timeit
def benchmark(size):
df = pd.DataFrame({‘age’: np.random.randint(18, 65, size=size)})
s = df[‘age’]
results = {}
# 1. to_list()
t = timeit.timeit(lambda: s.to_list(), number=100)
results['to_list()'] = t
# 2. to_numpy().tolist()
t = timeit.timeit(lambda: s.to_numpy().tolist(), number=100)
results['to_numpy().tolist()'] = t
# 3. list()コンストラクタ
t = timeit.timeit(lambda: list(s), number=100)
results['list()'] = t
# 4. .values.tolist()
t = timeit.timeit(lambda: s.values.tolist(), number=100)
results['values.tolist()'] = t
# 5. リスト内包表記
t = timeit.timeit(lambda: [x for x in s], number=100)
results['list comprehension'] = t
# 6. iterrows() - 非常に遅いのでnumberを調整
if size <= 10000:
t = timeit.timeit(lambda: [row['age'] for _, row in df.iterrows()], number=1)
results['iterrows()'] = t * 100 # 他とスケールを合わせるため100倍
else:
results['iterrows()'] = float('inf') # 時間がかかりすぎるため計測スキップ
return results
ベンチマーク実行
sizes = [100, 100_000, 1_000_000]
all_results = {}
for s in sizes:
print(f”— Benchmarking for {s:,} rows —“)
all_results[s] = benchmark(s)
結果の表示
result_df = pd.DataFrame(all_results).T
result_df.index.name = ‘Num Rows’
print(“\n— Benchmark Results (seconds for 100 loops) —“)
print(result_df)
“`
予想される結果(環境により変動します):
Num Rows | to_list() | to_numpy().tolist() | list() | values.tolist() | list comprehension | iterrows() |
---|---|---|---|---|---|---|
100 | 0.001 | 0.001 | 0.001 | 0.001 | 0.002 | 0.250 |
100,000 | 0.150 | 0.155 | 0.160 | 0.155 | 1.100 | inf |
1,000,000 | 1.500 | 1.550 | 1.600 | 1.550 | 11.200 | inf |
考察:
-
高速グループ:
to_list()
,to_numpy().tolist()
,list()
,values.tolist()
この4つの方法は、データサイズが大きくなっても非常に高速に動作します。パフォーマンスの差はごくわずかで、実用上は同等と考えて差し支えありません。なぜ速いのかというと、これらの処理がPandasやNumPyの内部で、高度に最適化されたC言語のコードによって実行されるためです。Pythonレベルでのループを回避し、データを一括でメモリコピーに近い形で処理しているため、驚異的な速度を実現できます。 -
低速グループ:リスト内包表記
リスト内包表記は、Pythonicで美しいコードですが、パフォーマンスの観点では高速グループに大きく劣ります。データが100万行になると、10倍近い差が開くこともあります。これは、for x in s
の部分で、Seriesの要素を一つずつPythonオブジェクトとして取り出す処理にオーバーヘッドがあるためです。 -
論外:
iterrows()
iterrows()
は桁違いに遅いです。100行のデータですら、他の方法の100倍以上の時間がかかります。これは、iterrows
がループの各反復で、行データを含む新しいSeries
オブジェクトを生成するためです。このオブジェクト生成コストが非常に高く、パフォーマンスの致命的なボトルネックとなります。リスト変換の目的でiterrows()
を使うことは、絶対に避けるべきアンチパターンです。
結論として、パフォーマンスの観点ではto_list()
は最速グループに属しており、大規模データにも安心して使えます。 可読性が高く、かつパフォーマンスも最高レベルであること。これがto_list()
を強力に後押しする第二の理由です。
4-3. Pandasの哲学との整合性
優れたライブラリは、一貫性のあるAPI設計を持っています。ユーザーが一度学習したパターンを、他の機能にも応用できるからです。Pandasはこの点で非常に優れており、to_...()
という命名規則はその象徴です。
df.to_csv('data.csv')
: CSVファイルに出力df.to_excel('data.xlsx')
: Excelファイルに出力df.to_json()
: JSON文字列に変換df.to_dict()
: Pythonの辞書に変換df.to_html()
: HTMLテーブルに変換s.to_list()
: Pythonのリストに変換
このように、to_list()
は「Pandasオブジェクトを別の形式に変換する」という一連のメソッド群の中に、自然に位置づけられています。この一貫性により、Pandasユーザーはto_...
とタイプすれば、IDEの補完機能などを使って目的の変換メソッドを簡単に見つけることができます。
一方で、list(s)
やs.to_numpy().tolist()
といった方法は、このPandasの流儀から少し外れます。list()
はPythonの汎用的な機能であり、to_numpy()
はNumPyの世界への橋渡しです。どちらも有効な方法ですが、「Pandasの流儀」に則ってコードを書きたいのであれば、to_list()
を選ぶのが最も自然な選択と言えるでしょう。
また、to_list()
はNumPyへの依存を隠蔽してくれるという利点もあります。Pandasは内部でNumPyを多用していますが、Pandasユーザーが必ずしもNumPyの詳細を意識する必要はありません。s.to_numpy().tolist()
というコードはNumPyの存在を明確に意識させますが、s.to_list()
はPandasのAPIの範囲内で完結しているように見えます。これにより、コードの抽象度が保たれ、よりPandas中心の思考でプログラミングを続けることができます。
実践!ユースケース別to_list()
活用術
理論だけでなく、実際のコードでto_list()
がどのように活躍するのかを見ていきましょう。
5-1. 基本:単一の列をリストに
最も基本的で、最も頻繁に使われるパターンです。
“`python
‘city’列のユニークな値をリストで取得したい
unique_cities = df[‘city’].unique().tolist()
print(unique_cities)
[‘New York’, ‘London’, ‘Paris’, ‘Tokyo’]
.unique()はNumPy配列を返すため、.tolist()でリストに変換するのが一般的
``
pd.Series.unique()
*補足:はNumPy配列を返しますが、
pd.Index.unique()はIndexオブジェクトを返します。後者の場合は
.to_list()が使えます。このようにPandas内でも返り値の型が異なる場合があるため、確実にリストが欲しい場合は最後に
.tolist()や
.to_list()`をつけるのが安全です。*
5-2. 応用:インデックスをリストに
DataFrameのインデックスもIndex
オブジェクトであり、to_list()
メソッドを持っています。
“`python
‘name’列を新しいインデックスに設定
df_named = df.set_index(‘name’)
インデックス(名前)をリストとして取得
name_index_list = df_named.index.to_list()
print(name_index_list)
[‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Emily’]
“`
5-3. 応用:複数列をまとめてリストのリストに
ここで一つ重要な注意点があります。to_list()
はSeries
とIndex
のメソッドであり、DataFrame
のメソッドではありません。 そのため、DataFrame全体や複数列を直接to_list()
でリストのリスト(ネストしたリスト)に変換することはできません。
“`python
これはエラーになる
nested_list = df[[‘name’, ‘age’]].to_list() # AttributeError: ‘DataFrame’ object has no attribute ‘to_list’
“`
このような場合は、to_numpy().tolist()
(または古いvalues.tolist()
)を使うのが正解です。これはto_list()
が最適解ではない、数少ない例外的なケースです。
“`python
DataFrameの複数列をリストのリストに変換する
nested_list = df[[‘name’, ‘age’]].to_numpy().tolist()
print(nested_list)
[[‘Alice’, 25], [‘Bob’, 32], [‘Charlie’, 18], [‘David’, 47], [‘Emily’, 25]]
“`
この使い分けを理解することが重要です。
* 単一の列(Series)をリストにする → s.to_list()
* DataFrameをリストのリストにする → df.to_numpy().tolist()
本記事の主題は「DataFrame(の列)をリストに変換する」ことであり、その中核をなすSeries
からlist
への変換においては、依然としてto_list()
が最適解であると言えます。
5-4. 応用:条件で絞り込んだ結果をリストに
Pandasの強力なフィルタリング機能と組み合わせることで、特定の条件を満たすデータだけを簡単にリスト化できます。
“`python
30歳以上の人の名前をリストで取得
names_over_30 = df[df[‘age’] >= 30][‘name’].to_list()
print(names_over_30)
[‘Bob’, ‘David’]
scoreが90点以上の人の都市をリストで取得(重複あり)
high_scorer_cities = df[df[‘score’] >= 90][‘city’].to_list()
print(high_scorer_cities)
[‘London’, ‘London’]
“`
このように、メソッドチェーンの中で自然にto_list()
を使うことで、非常に読みやすく効率的なコードが書けます。
5-5. 欠損値(NaN)の扱い
データに欠損値(np.nan
)が含まれている場合、to_list()
はそれをそのままリストの要素として保持します。
“`python
score_list = df[‘score’].to_list()
print(score_list)
[88.5, 91.0, nan, 76.5, 91.0]
欠損値を除外してからリストにしたい場合
score_list_no_na = df[‘score’].dropna().to_list()
print(score_list_no_na)
[88.5, 91.0, 76.5, 91.0]
``
dropna()`などの前処理メソッドと組み合わせることで、期待通りのリストを柔軟に作成できます。
避けるべきアンチパターン
最後に、リスト変換においてやってはいけない、あるいは避けるべき実装を再確認しておきましょう。
-
for
ループやiterrows()
でのリスト作成
本記事で何度も強調した通り、パフォーマンス上の理由から、単純なリスト変換のためにこれらの方法を使うべきではありません。コードが冗長になるだけでなく、実行速度が桁違いに遅くなります。常にベクトル化された操作(Pandas/NumPyのメソッド)を優先してください。 -
values
属性への過度な依存
.values
は長らく使われてきましたが、Pandasの公式ドキュメントでは.to_numpy()
の使用が推奨されています。.values
は返すオブジェクトの型が曖昧になることがあるのに対し、.to_numpy()
は一貫してNumPy配列を返すことが保証されているためです。古いコードをメンテナンスする場合は別として、新しいコードを書く際には.to_numpy()
を選ぶ方が堅牢です。
まとめ:あなたのコードを次のレベルへ
Pandas DataFrame(の列)からPythonのリストへの変換は、データ分析の現場で頻繁に発生する基本的なタスクです。この単純なタスクにも、to_list()
, to_numpy().tolist()
, list()
コンストラクタ, ループ処理など、数多くの方法が存在します。
本記事を通して、これらの選択肢を「可読性」「パフォーマンス」「一貫性」の3つの軸で徹底的に比較してきました。その結果は明らかです。
Series.to_list()
は、単一の列をリストに変換する上で、最もバランスの取れた「最適解」です。
df['col'].to_list()
: 意図が明確で、誰が読んでも理解しやすい。- 高速: C言語レベルで最適化されており、大規模データにも対応可能。
- Pandasの流儀:
to_...()
という一貫したAPI設計に沿っており、学習しやすく保守性が高い。
もちろん、状況に応じた使い分けは必要です。DataFrame全体をリストのリストに変換したい場合はdf.to_numpy().tolist()
が最適ですし、各要素に複雑な処理を加えながらリストを生成したい場合はリスト内包表記が役立つ場面もあるでしょう。
しかし、日常的なデータ分析業務で発生する「この列の値をリストで欲しい」という要求の9割以上は、to_list()
を使うことで、最もクリーンで、最も効率的で、最もPandasらしいコードを書くことができます。
今日からあなたのコードにto_list()
を取り入れてみてください。それは単なるメソッドの変更ではなく、より読みやすく、より速く、より洗練されたデータサイエンスの実践への第一歩となるはずです。