Python 处理 Pandas DataFrame 中的行和列
作者:海拥
前言:
数据框是一种二维数据结构,即数据以表格的方式在行和列中对齐。我们可以对行/列执行基本操作,例如选择、删除、添加和重命名。在本文中,我们使用的是nba.csv
文件。
处理列
为了处理列,我们对列执行基本操作,例如选择、删除、添加和重命名。
列选择:为了在 Pandas DataFrame 中选择一列,我们可以通过列名调用它们来访问这些列。
# Import pandas package import pandas as pd # 定义包含员工数据的字典 data = {'Name':['Jai', 'Princi', 'Gaurav', 'Anuj'], 'Age':[27, 24, 22, 32], 'Address':['Delhi', 'Kanpur', 'Allahabad', 'Kannauj'], 'Qualification':['Msc', 'MA', 'MCA', 'Phd']} # 将字典转换为 DataFrame df = pd.DataFrame(data) # 选择两列 print(df[['Name', 'Qualification']])
输出:
列添加:为了在 Pandas DataFrame 中添加列,我们可以将新列表声明为列并添加到现有数据框。
# Import pandas package import pandas as pd # 定义包含学生数据的字典 data = {'Name': ['Jai', 'Princi', 'Gaurav', 'Anuj'], 'Height': [5.1, 6.2, 5.1, 5.2], 'Qualification': ['Msc', 'MA', 'Msc', 'Msc']} # 将字典转换为 DataFrame df = pd.DataFrame(data) # 声明要转换为列的列表 address = ['Delhi', 'Bangalore', 'Chennai', 'Patna'] # 使用“地址”作为列名并将其等同于列表 df['Address'] = address # 观察结果 print(df)
输出:
有关更多示例,请参阅在 Pandas列删除中向现有 DataFrame 添加新列:为了删除 Pandas DataFrame 中的列,我们可以使用该方法。通过删除具有列名的列来删除列。drop()
# importing pandas module import pandas as pd # 从csv文件制作数据框 data = pd.read_csv("nba.csv", index_col ="Name" ) # 删除通过的列 data.drop(["Team", "Weight"], axis = 1, inplace = True) # 展示 print(data)
输出:如输出图像所示,新输出没有传递的列。这些值被删除,因为轴设置为等于 1,并且由于 inplace 为 True,因此在原始数据框中进行了更改。
删除列之前的数据框- 删除列:
之后的数据框:
处理行
为了处理行,我们可以对行执行基本的操作,例如选择、删除、添加和重命名。
行选择Pandas 提供了一种从数据框中检索行的独特方法。DataFrame.loc[]
方法用于从 Pandas DataFrame 中检索行。也可以通过将整数位置传递给 iloc[] 函数来选择行。
# importing pandas package import pandas as pd # 从csv文件制作数据框 data = pd.read_csv("nba.csv", index_col ="Name") # 通过 loc 方法检索行 first = data.loc["Avery Bradley"] second = data.loc["R.J. Hunter"] print(first, "\n\n\n", second)
输出:如输出图像所示,由于两次都只有一个参数,因此返回了两个系列。
有关更多示例,请参阅Pandas 使用 .loc Row Addition提取行:为了在 Pandas DataFrame 中添加一行,我们可以将旧数据帧与新数据帧连接。
# importing pandas module import pandas as pd # 制作数据框 df = pd.read_csv("nba.csv", index_col ="Name") df.head(10) new_row = pd.DataFrame({'Name':'Geeks', 'Team':'Boston', 'Number':3, 'Position':'PG', 'Age':33, 'Height':'6-2', 'Weight':189, 'College':'MIT', 'Salary':99999}, index =[0]) # 简单地连接两个数据框 df = pd.concat([new_row, df]).reset_index(drop = True) df.head(5)
输出:添加行前的数据框- 添加行
后的数据框-
删除行:为了删除 Pandas DataFrame 中的一行,我们可以使用 drop() 方法。通过按索引标签删除行来删除行。
# importing pandas module import pandas as pd # 从csv文件制作数据框 data = pd.read_csv("nba.csv", index_col ="Name" ) # 删除传递的值 data.drop(["Avery Bradley", "John Holland", "R.J. Hunter", "R.J. Hunter"], inplace = True) # 展示 data
输出:如输出图像所示,新输出没有传递的值。由于 inplace 为 True,因此删除了这些值并在原始数据框中进行了更改。
删除值之前的数据框- 删除值
后的数据框:
到此这篇关于Python 处理 Pandas DataFrame 中的行和列的文章就介绍到这了,更多相关Python Pandas DataFrame 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!