Pandas DataFrameの作成
Pandas DataFrameは、Pythonのデータ分析ライブラリPandasの中心的なデータ構造です。2次元のラベル付きデータ構造で、異なる型の列を持つことができます。以下に、Pandas DataFrameの作成方法を示します。
まず、Pandasライブラリをインポートします。
import pandas as pd
次に、データを作成します。ここでは、Pythonの辞書を使用してデータを作成します。辞書の各キーがDataFrameの列名になり、各値がその列のデータになります。
data = {
'Name': ['John', 'Anna', 'Peter', 'Linda'],
'Age': [28, 24, 35, 32],
'City': ['New York', 'Paris', 'Berlin', 'London']
}
最後に、このデータからDataFrameを作成します。
df = pd.DataFrame(data)
これで、Pandas DataFrameが作成されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Name Age City
0 John 28 New York
1 Anna 24 Paris
2 Peter 35 Berlin
3 Linda 32 London
これが、Pandas DataFrameの基本的な作成方法です。次のセクションでは、空のPandas DataFrameの作成方法について説明します。
空のPandas DataFrameの作成
Pandas DataFrameを空で作成することも可能です。これは、データがまだ利用できない場合や、データを後から追加したい場合に便利です。以下に、空のPandas DataFrameの作成方法を示します。
まず、空のDataFrameを作成します。
df = pd.DataFrame()
これで、空のPandas DataFrameが作成されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Empty DataFrame
Columns: []
Index: []
この出力からわかるように、作成したDataFrameは列も行も持っていません。つまり、完全に空です。
次のセクションでは、列を持つ空のPandas DataFrameの作成方法について説明します。この方法は、列の構造は既知で、データは後から追加される場合に便利です。また、特定の列名を持つ空のDataFrameが必要な場合にも使用できます。具体的な方法については、次のセクションで詳しく説明します。
列を持つ空のPandas DataFrameの作成
列の構造が既知で、データは後から追加される場合、または特定の列名を持つ空のDataFrameが必要な場合には、列を持つ空のPandas DataFrameを作成することができます。以下に、その方法を示します。
まず、列名をリストとして定義します。
columns = ['Name', 'Age', 'City']
次に、これらの列を持つ空のDataFrameを作成します。
df = pd.DataFrame(columns=columns)
これで、指定した列を持つ空のPandas DataFrameが作成されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Empty DataFrame
Columns: [Name, Age, City]
Index: []
この出力からわかるように、作成したDataFrameは行を持っていませんが、指定した列を持っています。つまり、列の構造が定義された空のDataFrameです。
次のセクションでは、列とインデックスを持つ空のPandas DataFrameの作成方法について説明します。この方法は、列とインデックスの構造は既知で、データは後から追加される場合に便利です。具体的な方法については、次のセクションで詳しく説明します。
列とインデックスを持つ空のPandas DataFrameの作成
列とインデックスの構造が既知で、データは後から追加される場合には、列とインデックスを持つ空のPandas DataFrameを作成することができます。以下に、その方法を示します。
まず、列名とインデックスをリストとして定義します。
columns = ['Name', 'Age', 'City']
index = ['Person 1', 'Person 2', 'Person 3', 'Person 4']
次に、これらの列とインデックスを持つ空のDataFrameを作成します。
df = pd.DataFrame(columns=columns, index=index)
これで、指定した列とインデックスを持つ空のPandas DataFrameが作成されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Name Age City
Person 1 NaN NaN NaN
Person 2 NaN NaN NaN
Person 3 NaN NaN NaN
Person 4 NaN NaN NaN
この出力からわかるように、作成したDataFrameは行と列を持っていますが、全てのセルがNaN(Not a Number)で、つまりデータが存在しない状態です。これは、列とインデックスの構造が定義された空のDataFrameです。
次のセクションでは、空のDataFrameにデータを追加する方法について説明します。具体的な方法については、次のセクションで詳しく説明します。
空のDataFrameにデータを追加する
空のPandas DataFrameにデータを追加する方法はいくつかあります。以下に、その中でも基本的な方法を示します。
まず、空のDataFrameを作成します。
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
次に、新しい行を追加します。新しい行を追加するには、loc
プロパティを使用します。loc
プロパティは、ラベルベースのインデックスアクセスを提供します。以下の例では、新しい行のインデックスラベルとして’Person 1’を使用しています。
df.loc['Person 1'] = ['John', 28, 'New York']
これで、新しい行がDataFrameに追加されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Name Age City
Person 1 John 28 New York
この出力からわかるように、作成したDataFrameに新しい行が追加されました。
同様に、他の行も追加できます。
df.loc['Person 2'] = ['Anna', 24, 'Paris']
df.loc['Person 3'] = ['Peter', 35, 'Berlin']
df.loc['Person 4'] = ['Linda', 32, 'London']
これで、複数の行がDataFrameに追加されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Name Age City
Person 1 John 28 New York
Person 2 Anna 24 Paris
Person 3 Peter 35 Berlin
Person 4 Linda 32 London
これが、空のPandas DataFrameにデータを追加する基本的な方法です。次のセクションでは、空のPandas DataFrameにデータを追加する他の方法について説明します。具体的な方法については、次のセクションで詳しく説明します。
空のPandas DataFrameにデータを追加する
空のPandas DataFrameにデータを追加する方法はいくつかあります。以下に、その中でも基本的な方法を示します。
まず、空のDataFrameを作成します。
df = pd.DataFrame(columns=['Name', 'Age', 'City'])
次に、新しい行を追加します。新しい行を追加するには、loc
プロパティを使用します。loc
プロパティは、ラベルベースのインデックスアクセスを提供します。以下の例では、新しい行のインデックスラベルとして’Person 1’を使用しています。
df.loc['Person 1'] = ['John', 28, 'New York']
これで、新しい行がDataFrameに追加されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Name Age City
Person 1 John 28 New York
この出力からわかるように、作成したDataFrameに新しい行が追加されました。
同様に、他の行も追加できます。
df.loc['Person 2'] = ['Anna', 24, 'Paris']
df.loc['Person 3'] = ['Peter', 35, 'Berlin']
df.loc['Person 4'] = ['Linda', 32, 'London']
これで、複数の行がDataFrameに追加されました。DataFrameを表示するには、単にその名前をタイプします。
df
これにより、以下のような出力が得られます。
Name Age City
Person 1 John 28 New York
Person 2 Anna 24 Paris
Person 3 Peter 35 Berlin
Person 4 Linda 32 London
これが、空のPandas DataFrameにデータを追加する基本的な方法です。次のセクションでは、空のPandas DataFrameにデータを追加する他の方法について説明します。具体的な方法については、次のセクションで詳しく説明します。