浅析python中的二元嵌套列表分组
作者:python收藏家
有时候,在处理数据库时,我们需要执行某些列表操作,这些操作更像是查询语言,例如,将嵌套的列表元素相对于其他索引元素进行分组。本文讨论二元嵌套列表,并将每个嵌套列表元素相对于其其他索引元素进行分组。
1. 列表解析
# initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] # using list comprehension # to perform binary list grouping temp = set(map(lambda i: i[1], test_list)) res = [[j[0] for j in test_list if j[1] == i] for i in temp] # printing result print("The grouped list is : " + str(res))
输出
The grouped list is : [['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']]
2. 使用itertools.groupby + itemgetter
我们也可以使用groupby函数来执行这个特定的任务。该方法遵循2-3个步骤。首先,序列相对于第二个元素进行排序,现在可以将其馈送以进行分组。最后,我们根据结果的要求打印第一个元素。
from itertools import groupby from operator import itemgetter # Initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] # Performing binary list grouping # using itertools.groupby() + itemgetter() test_list.sort(key=itemgetter(1)) groups = groupby(test_list, itemgetter(1)) res = [[i[0] for i in val] for (key, val) in groups] # Printing the resultant list print("The grouped list is : " + str(res))
输出
The grouped list is : [['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']]
3. 使用collections.defaultdict()
import collections # initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] # using collections.defaultdict() # to perform binary list grouping res = collections.defaultdict(list) for val in test_list: res[val[1]].append(val[0]) # printing result print("The grouped list is : " + str(res.values()))
输出
The grouped list is : dict_values([['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']])
4. 使用for循环 + sort
启动for循环以查找唯一的1索引元素
启动了一个嵌套的for循环,将所有具有相同1索引元素的字符分组
显示分组列表
# initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] # using list comprehension # to perform binary list grouping x = [] for i in test_list: if i[1] not in x: x.append(i[1]) x.sort() res = [] for i in x: a = [] for j in test_list: if j[1] == i: a.append(j[0]) res.append(a) # printing result print("The grouped list is : " + str(res))
输出
The grouped list is : [['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']]
5. 使用numpy
导入别名np的numpy库。
创建输入列表test_list。
使用np.array函数将test_list转换为numpy数组,并将结果赋给变量arr
使用np.unique函数获取arr第二列的唯一值,并将结果赋给变量unique_values。
创建名为result_list的空列表。
对于unique_values中的每个唯一值i,执行以下操作:
a.使用布尔索引来选择arr中第二列等于i的行
b.从选定行的第一列提取值,并将其转换为列表。
c.将结果列表附加到result_list。
打印生成的分组列表。
import numpy as np # initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] arr = np.array(test_list) # Storing all unique values unique_values = np.unique(arr[:, 1]) result_list = [list(arr[arr[:, 1] == i, 0]) for i in unique_values] # Printing the result print("The grouped list is:", result_list)
输出
The grouped list is: [['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']]
6. 使用dictionary和setdefault
此方法使用字典按条目的第二个元素对条目进行分组,该元素充当字典中的键。setdefault方法用于创建一个空列表作为新键的值,或者将当前项的第一个元素附加到与该键关联的列表中。然后将生成的字典值转换为列表以获得最终结果。
# initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] # Using dictionary and setdefault() to perform binary list grouping group_dict = {} for item in test_list: group_dict.setdefault(item[1], []).append(item[0]) res = list(group_dict.values()) # printing result print ("The grouped list is : " + str(res))
输出
The grouped list is : [['G', 'F', 'G'], ['B', 'E', 'S', 'T'], ['I', 'S']]
7. 使用pandas
它初始化一个名为test_list的列表,其中包含两个元素的子列表。然后,它将列表转换为pandas DataFrame,按每个子列表的第二个元素对DataFrame进行分组,应用lambda函数选择每个子列表的第一个元素,将结果pandas Series转换为列表,并打印分组后的列表。
import pandas as pd # initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] # converting list to DataFrame df = pd.DataFrame(test_list, columns=['value', 'group']) # grouping by group grouped = df.groupby('group')['value'].apply(lambda x: x.tolist()).tolist() # printing result print("The grouped list is: " + str(grouped))
输出
The grouped list is: [['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']]
8. 使用列表和索引
# Initializing list test_list = [["G", 0], ["F", 0], ["B", 2], ["E", 2], ['I', 1], ['S', 1], ['S', 2], ['T', 2], ['G', 0]] num_groups = max([elem[1] for elem in test_list]) + 1 grouped = [[] for _ in range(num_groups)] # Iterating over our input list for elem in test_list: grouped[elem[1]].append(elem[0]) grouped = [lst for lst in grouped if lst] # Printing the result print("The grouped list is:", grouped)
输出
The grouped list is: [['G', 'F', 'G'], ['I', 'S'], ['B', 'E', 'S', 'T']]
到此这篇关于浅析python中的二元嵌套列表分组的文章就介绍到这了,更多相关python二元嵌套列表内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!