java8 Stream大数据量List分批处理切割方式
作者:zhaoyang10
这篇文章主要介绍了java8 Stream大数据量List分批处理切割方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
java8 Stream大数据量List分批处理
//按每3个一组分割 private static final Integer MAX_NUMBER = 3; /** * 计算切分次数 */ private static Integer countStep(Integer size) { return (size + MAX_NUMBER - 1) / MAX_NUMBER; } public static void main(String[] args) { List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7); int limit = countStep(list.size()); //方法一:使用流遍历操作 List<List<Integer>> mglist = new ArrayList<>(); Stream.iterate(0, n -> n + 1).limit(limit).forEach(i -> { mglist.add(list.stream().skip(i * MAX_NUMBER).limit(MAX_NUMBER).collect(Collectors.toList())); }); System.out.println(mglist); //方法二:获取分割后的集合 List<List<Integer>> splitList = Stream.iterate(0, n -> n + 1).limit(limit).parallel().map(a -> list.stream().skip(a * MAX_NUMBER).limit(MAX_NUMBER).parallel().collect(Collectors.toList())).collect(Collectors.toList()); System.out.println(splitList); }
使用google guava对List进行分割
//使用guava对list进行分割 List<User> users = userService.findAll(); //按每50个一组分割 List<List<User>> parts = Lists.partition(users, 50); parts.stream().forEach(list -> { process(list); });
使用apache common collection
List<Integer> intList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8); List<List<Integer>> subs = ListUtils.partition(intList, 3);
java 手写将一个List等分成n个list
public static <T> List<List<T>> averageAssign(List<T> source, int n) { List<List<T>> result = new ArrayList<>(); //(先计算出余数) int remainder = source.size() % n; //然后是商 int number = source.size() / n; //偏移量 int offset = 0; for (int i = 0; i < n; i++) { List<T> value; if (remainder > 0) { value = source.subList(i * number + offset, (i + 1) * number + offset + 1); remainder--; offset++; } else { value = source.subList(i * number + offset, (i + 1) * number + offset); } result.add(value); } return result; }
java8部分特性及list的常见操作
主要记录如何使用Java8中的流式处理,简洁的处理各种常见的操作。
注意:
数组转集合,体现的是适配器模式,只是转换接口,后台的数据仍是数组。所以使用集合相关的操作add、remove、clear会抛异常:UNSupportOperationException。
List<String> list = Arrays.asList("官僚","买办","资产阶级");
集合转数组,不能直接使用无参toArray()方法,该方法返回的是Object[],若强转可能会存在转换异常。带参的大小,必须要跟集合list保持一致,否则会涉及重新分配内存。
Lambda表达式
- 格式(params) -> {expression}
- 比如我们实现一个Runnable接口
Runnable run = new Runnable() { @Override public void run() { // TODO } }
使用Lambda表达式:Runnable run = () -> {# TODO}
函数式接口,规范:
- 接口中只能有一个抽象方法
- (可选)在接口上添加@FunctionalInterface注解,这样可以检验它是否一个函数式接口
比如:
@FunctionalInterface public interface MyFun { void fun(); } //也可以使用泛型 @FunctionalInterface public interface MyFun1<T> { void fun(T t); }
使用的时候
public static void domething(MyFun myfun) { myfun.fun(); } public static void domething(MyFun1<User> myFun) { User user = new User(); user.setName("我是泛型"); myFun.fun(user); } public static void main(String[] args) { domething(() -> {System.out.println("通过lambda表达式执行了函数式接口");}); domething1((item) -> { item.setId(100); item.setAge(20); System.out.println("这是MyFun1函数式接口真正的执行逻辑,最终的结果是:" + JsonObject.toJsonString(item);) }); }
常见的list操作
/** * 数组转集合,体现的是适配器模式,只是转换接口,后台的数据仍是数组。 * 所以使用集合相关的操作add/remove/clear会抛错:unSupportOperationException * */ List<String> arrList = Arrays.asList("买办", "资产阶级", "官僚"); /** * 集合转数组,不能直接使用无参toArray()方法,该方法的返回类型是Object[],若强转,可能存在转换异常 * 带参的大小,必须要跟集合list保持一致,否则会涉及内存的重新分配 */ List<String> list = new ArrayList<>(); list.add("买办"); list.add("官僚"); list.add("资产阶级"); // 注意:大小必须和list保持一致,若小于3,则需要重新分配内存地址,并返回新数组地址; // 若数组元素大于所需,则下标为[list.size()]的元素置为null,其他元素为原值 // 所以最好将数组大小跟集合大小保持一致,可以验证new String[1],new String[5]的输出值 String[] arr = new String[list.size()]; arr = list.toArray(arr); System.out.println("arr :" + Arrays.toString(arr)); // list 初始化(guava) List<String> initList = Lists.newArrayList("Java", "Python", "Javascript"); List<User> students = new ArrayList<>(); User st1 = new User(); st1.setId(123); st1.setAge(10); User st2 = new User(); st2.setId(123); st2.setAge(20); User st3 = new User(); st3.setId(456); st3.setAge(20); students.add(st1); students.add(st2); students.add(st3); // list 分割(guava) List<List<User>> splits = Lists.partition(students, 2); System.out.println("list分割:" + JsonUtil.toJSONString(splits)); // list分组 Map<Integer, List<User>> groupStu = students.stream().collect( Collectors.groupingBy(User::getAge)); System.out.println("list分组:" + JsonUtil.toJSONString(groupStu)); // list转map, (k,v),若集合中有重复的key,会抛异常:Duplicate key…… // 通过(k1, k2)->k1来处理重复情况,保留k1,舍弃k2 Map<Integer, Integer> studentIdMap = students.stream().collect( Collectors.toMap(User::getId, User::getAge, (k1, k2) -> k1)); System.out.println("list转map, (k,v) :" + studentIdMap); // list转map, (k,t) Map<Integer, User> studenteMap = students.stream().collect( Collectors.toMap(User::getId, Function.identity(), (k1, k2) -> k1)); System.out.println("list转map, (k,t) :" + studenteMap); // list过滤 List<User> oldStu = students.stream().filter( student -> student.getAge() > 10).collect(Collectors.toList()); System.out.println("list过滤filter :" + JsonUtil.toJSONString(oldStu)); // list对象转换 List<Teacher> teachers = students.stream().map( student -> { Teacher teacher = new Teacher(); BeanUtils.copyProperties(student, teacher); teacher.setTitle("教师"); return teacher; }).collect(Collectors.toList()); System.out.println("list对象转化:" + JsonUtil.toJSONString(teachers)); // list转set Set<Integer> ages = students.stream().map(User::getAge).collect(Collectors.toSet()); System.out.println("list转set:" + ages); // 过滤掉空元素后再map public static void main(String[] args) { List<Customer> customerList = new ArrayList<>(); customerList.add(new Customer(1L, "Ryu")); customerList.add(new Customer(2L, "Ken")); customerList.add(new Customer(3L, null)); customerList.add(null); customerList.add(new Customer(5L, null)); customerList.add(new Customer(6L, "Zangief")); List<String> nameList1 = customerList.stream() .filter(Objects::nonNull) // 過濾掉Customer為null的元素 .map(e -> e.getName()) .filter(Objects::nonNull) // 過濾掉Customer.getName()為null的元素 .collect(Collectors.toList()); System.out.println(nameList1); // [Ryu, Ken, Zangief] }
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。