java8-用流收集数据-6

本章内容
口用co1lectors类创建和使用收集器
口将数据流归约为一个值
口汇总:归约的特殊情况
数据分组和分区口
口 开发自己的自定义收集器

    我们在前一章中学到,流可以用类似于数据库的操作帮助你处理集合。你可以把Java8的流看作花哨又懒惰的数据集迭代器。它们支持两种类型的操作:中间操作(如fi1ter或map)和终端操作(如count、findrirst、forEach和reduce)。中间操作可以链接起来,将一个流转换为另一个流。这些操作不会消耗流,其目的是建立一个流水线。与此相反,终端操作会消耗流,以产生一个最终结果,例如返回流中的最大元素。它们通常可以通过优化流水线来缩短计算时间。
我们已经在第4章和第5章中用过co11ect终端操作了,当时主要是用来把stream中所有的元素结合成一个List。在本章中,你会发现co1lect是一个归约操作,就像reduce一样可以接受各种做法作为参数,将流中的元素累积成一个汇总结果。具体的做法是通过定义新的Co1lector接口来定义的,因此区分collection、collector和co1lect是很重要的。下面是一些查询的例子,看看你用collect和收集器能够做什么。口对一个交易列表按货币分组,获得该货币的所有交易额总和(返回一个Map<currency,Integer>)口将交易列表分成两组:贵的和不贵的(返回一个Map<Boolean,List<Transaction>>)。口创建多级分组,比如按城市对交易分组,然后进一步按照贵或不贵分组(返回一个Map<Boolean,List<Transaction>>激动吗?很好,我们先来看一个利用收集器的例子。想象一下,你有一个由Transaction构成的List,并且想按照名义货币进行分组。在没有Lambda的Java里,哪怕像这种简单的用例实现起来都很啰嗦,就像下面这样。

6.1 收集器简介
    前一个例子清楚地展示了函数式编程相对于指令式编程的一个主要优势:你只需指出希望的结果--“做什么”,而不用操心执行的步骤--“如何做”。在上一个例子里,传递给collect方法的参数是co1lector接口的一个实现,也就是给stream中元素做汇总的方法。上一章里的toList只是说“按顺序给每个元素生成一个列表”;在本例中,groupingBy说的是“生成一个Map,它的键是(货币)桶,值则是桶中那些元素的列表”。
要是做多级分组,指令式和函数式之间的区别就会更加明显:由于需要好多层嵌套循环和条件,指令式代码很快就变得更难阅读、更难维护、更难修改。相比之下,函数式版本只要再加上一个收集器就可以轻松地增强功能了,你会在6.3节中看到它。
6.1.1 收集器用作高级归约
刚刚的结论又引出了优秀的函数式API设计的另一个好处:更易复合和重用。收集器非常有用,因为用它可以简洁而灵活地定义co1lect用来生成结果集合的标准。更具体地说,对流调用co1lect方法将对流中的元素触发一个归约操作(由co1lector来参数化)。图6-1所示的归约操作所做的工作和代码清单6-1中的指令式代码一样。它遍历流中的每个元素,并让collector进行处理。

一般来说,collector会对元素应用一个转换函数(很多时候是不体现任何效果的恒等转换,例如toList),并将结果累积在一个数据结构中,从而产生这一过程的最终输出。例如,在前面所示的交易分组的例子中,转换函数提取了每笔交易的货币,随后使用货币作为键,将交易本身
累积在生成的Map中。如货币的例子中所示,collector接口中方法的实现决定了如何对流执行归约操作。我们会在6.5节和6.6节研究如何创建自定义收集器。但co1lectors实用类提供了很多静态工厂方法,可以方便地创建常见收集器的实例,只要拿来用就可以了。最直接和最常用的收集器是toList静态方法,它会把流中所有的元素收集到一个ist中:
 

List<Transaction>transactions=transactiongtream.collect(Collectors.toList())

6.1.2 预定义收集器
在本章剩下的部分中,我们主要探讨预定义收集器的功能,也就是那些可以从co1lectors类提供的工厂方法(例如groupingBy)创建的收集器。它们主要提供了三大功能:
口将流元素归约和汇总为一个值
口 元素分组
口 元素分区

我们先来看看可以进行归约和汇总的收集器。它们在很多场合下都很方便,比如前面例子中提到的求一系列交易的总交易额。
然后你将看到如何对流中的元素进行分组,同时把前一个例子推广到多层次分组,或把不同
的收集器结合起来,对每个子组进行进一步归约操作。我们还将谈到分组的特殊情况“分区”即使用谓词(返回一个布尔值的单参数函数)作为分组函数。
6.4节末有一张表,总结了本章中探讨的所有预定义收集器。在6.5节你将了解更多有关co1lector接口的内容。在6.6节中你会学到如何创建自己的自定义收集器,用于co1lectors类的工厂方法无效的情况。
6.2 归约和汇总
为了说明从Collectors工厂类中能创建出多少种收集器实例,我们重用一下前一章的例包含一张佳看列表的菜单!
就像你刚刚看到的,在需要将流项目重组成集合时,一般会使用收集器( stream方法co1lect的参数)。再宽泛一点来说,但凡要把流中所有的项目合并成一个结果时就可以用。这个结果可以是任何类型,可以复杂如代表一棵树的多级映射,或是简单如一个整数--也许代表了菜单的热量总和。这两种结果类型我们都会讨论:6.2.2节讨论单个整数,6.3.1节讨论多级分组。我们先来举一个简单的例子,利用counting工厂方法返回的收集器,数一数菜单里有多少种菜:

long howManyDishes = menu.stream().collect (Collectors .counting());

这还可以写得更为直接:

long howManyDishes =menu.stream().count()

counting收集器在和其他收集器联合使用的时候特别有用,后面会谈到这一点。在本章后面的部分,我们假定你已导人了co1lectors类的所有静态工厂方法:
import static java.util.stream.Collectors.*;这样你就可以写counting()而用不着写collectors.counting()之类的了。让我们来继续探讨简单的预定义收集器,看看如何找到流中的最大值和最小值。
6.2.1 查找流中的最大值和最小值
假设你想要找出菜单中热量最高的菜。你可以使用两个收集器,Collectors.maxBy和Collectors.minBy,来计算流中的最大或最小值。这两个收集器接收一个comparator参数来比较流中的元素。你可以创建一个comparator来根据所含热量对菜看进行比较,并把它传递给Collectors .maxBy:
 

Comparator<Dish>dishCaloriesComparator=Comparator.comparingInt(Dish::getCalories):
Optiona1l<Dish>mostCalorieDish=menu.stream()
.collect(maxBy(dishCaloriesComparator));

你可能在想optional<Dish>是怎么回事。要回答这个问题,我们需要问“要是menu为空怎么办”。那就没有要返回的菜了!Java8引|人了optiona1,它是一个容器,可以包含也可以不包含值。这里它完美地代表了可能也可能不返回菜看的情况。我们在第5章讲findAny方法的时候简要提到过它。现在不用担心,我们专门用第10章来研究optional<T>及其操作。另一个常见的返回单个值的归约操作是对流中对象的一个数值字段求和。或者你可能想要求平均数。这种操作被称为汇总操作。让我们来看看如何使用收集器来表达汇总操作。

6.2.3 连接字符串
joining工厂方法返回的收集器会把对流中每一个对象应用tostring方法得到的所有字符串连接成一个字符串。这意味着你把菜单中所有菜看的名称连接起来,如下所示:

String shortMenu = menu.stream().map(Dish::getName).collect (joining());

请注意,joining在内部使用了stringBuilder来把生成的字符串逐个追加起来。此外还要注意,如果Dish类有一个tostring方法来返回菜看的名称,那你无需用提取每一道菜名称的函数来对原流做映射就能够得到相同的结果:

String shortMenu =menu.stream().collect(joining());


二者均可产生以下字符串:
porkbeefchickenfrench friesriceseason fruitpizzaprawnssalmon
但该字符串的可读性并不好。幸好,joining工厂方法有一个重载版本可以接受元素之间的分界符,这样你就可以得到一个逗号分隔的菜看名称列表:

String shortMenu = menu.stream().map(Dish::getName) .collect (joining(","));

正如我们预期的那样,它会生成:
pork,beef,chicken,french fries,rice,season fruit,pizza,prawns, salmon
到目前为止,我们已经探讨了各种将流归约到一个值的收集器。在下一节中,我们会展示为什么所有这种形式的归约过程,其实都是co1lectors.reducing工厂方法提供的更广义归约收集器的特殊情况。

6.2.4 广义的归约汇总
事实上,我们已经讨论的所有收集器,都是一个可以用reducing工厂方法定义的归约过程的特殊情况而已。co11ectors.reducing工厂方法是所有这些特殊情况的一般化。可以说,先前讨论的案例仅仅是为了方便程序员而已。(但是,请记得方便程序员和可读性是头等大事!)例如,可以用reducing方法创建的收集器来计算你菜单的总热量,如下所示:

int totalCalories =menu.stream().collect(reducing(0,Dish::getCalories,(i,j)->i +j))

它需要三个参数。
口第一个参数是归约操作的起始值,也是流中没有元素时的返回值,所以很显然对于数值和而言0是一个合适的值。
口第二个参数就是你在6.2.2节中使用的函数,将菜看转换成一个表示其所含热量的int。

口第三个参数是一个Binaryoperator,将两个项目累积成一个同类型的值。这里它就是对两个int求和。同样,你可以使用下面这样单参数形式的reducing来找到热量最高的菜,如下所示:

Optional<Dish>mostCalorieDish =
menu.stream().collect(reducing((d1,d2)->dl.getCalories()>d2.getCalories()?d1 :d2));

你可以把单参数reducing工厂方法创建的收集器看作三参数方法的特殊情况,它把流中的第一个项目作为起点,把恒等函数(即一个函数仅仅是返回其输入参数)作为一个转换函数。这也意味着,要是把单参数reducing收集器传递给空流的co1lect方法,收集器就没有起点;正如我们在6.2.1节中所解释的,它将因此而返回一个optional<pish>对象。
收集与归约
在上一章和本章中讨论了很多有关归约的内容。你可能想知道,stream接口的collect和reduce方法有何不同,因为两种方法通常会获得相同的结果。例如,你可以像下面这样使用reduce方法来实现toListCollector所做的工作:
 

Stream<Integer>stream=Arrays.asList(l,2,3,4,5,6).stream();List<Integer>numbersstream.reduce(
new rrayList<Integer>()
(List<Integer>l,Integer e)->{1 .add(e);
return li
}
(List<Integer>1l,List<Integer>12)->{
11.addд11(12);
return 11;});


这个解决方案有两个问题:一个语义问题和一个实际问题。语义问题在于,reduce方法旨在把两个值结合起来生成一个新值,它是一个不可变的归约。与此相反,collect方法的设计就是要改变容器,从而累积要输出的结果。这意味着,上面的代码片段是在滥用reduce方法,因为它在原地改变了作为累加器的List。你在下一章中会更详细地看到,以错误的语义使用reduce方法还会造成一个实际问题:这个归约过程不能并行工作,因为由多个线程并发修改同一个数据结构可能会破坏List本身。在这种情况下,如果你想要线程安全,就需要每次分配一个新的List,而对象分配又会影响性能。这就是co1lect方法特别适合表达可变容器上的归约的原因,更关键的是它适合并行操作,本章后面会谈到这一点。
1.收集框架的灵活性:以不同的方法执行同样的操作你还可以进一步简化前面使用reducing收集器的求和例子--引用Integer类的sum方法,而不用去写一个表达同一操作的Lammbda表达式。这会得到以下程序:
int totalCalories =menu.stream().collect(reducing(0,4-- 初始值Dish::getCalories,◁-转换函数Integer::sum))i4- 累积函数
从逻辑上说,归约操作的工作原理如图6-3所示:利用累积函数,把一个初始化为起始值的累加器,和把转换函数应用到流中每个元素上得到的结果不断迭代合并起来。

6.3 分组
一个常见的数据库操作是根据一个或多个属性对集合中的项目进行分组。就像前面讲到按货币对交易进行分组的例子一样,如果用指令式风格来实现的话,这个操作可能会很麻烦、啰嗦而且容易出错。但是,如果用Java8所推崇的函数式风格来重写的话,就很容易转化为一个非常容易看懂的语句。我们来看看这个功能的第二个例子:假设你要把菜单中的菜按照类型进行分类,有肉的放一组,有鱼的放一组,其他的都放另一组。用collectors.groupingBy工厂方法返回的收集器就可以轻松地完成这项任务,如下所示:

Map<Dish.Type,List<Dish>>dishesByType =
menu.stream().collect(groupingBy(Dish::getType));

其结果是下面的Map:
(FISH=lprawns,salmon],0THER=[french fries,rice,season fruit,pizza],MEAT=[pork,beef,chickenl}
这里,你给groupingBy方法传递了一个Function(以方法引用的形式),它提取了流中每:道Dish的Dish.ype。我们把这个Function叫作分类函数,因为它用来把流中的元素分成不同的组。如图6-4所示,分组操作的结果是一个ap,把分组函数返回的值作为映射的键,把流中所有具有这个分类值的项目的列表作为对应的映射值。在菜单分类的例子中,键就是菜的类型,

但是,分类函数不一定像方法引用那样可用,因为你想用以分类的条件可能比简单的属性访问器要复杂。例如,你可能想把热量不到400卡路里的菜划分为“低热量”(diet),热量400到700卡路里的菜划为“普通”(normal),高于700卡路里的划为“高热量”(fat)。由于pish类的作者没有把这个操作写成一个方法,你无法使用方法引用,但你可以把这个逻辑写成Lambda表达式:

public enum CaloricLevel(DIET,NORMAL,FAT
Map<CaloricLevel,List<Dish>> dishesByCaloricLevel = menu.stream().collect (groupingBy(dish>if (dish.getCalories()<= 400)return CaloricLevel.DIET;else if (dish.getCalories()<= 700)return
CaloricLeve1.NORMAL:
else returnaricevel.FT:

现在,你已经看到了如何对菜单中的菜看按照类型和热量进行分组,但要是想同时按照这两个标准分类怎么办呢?分组的强大之处就在于它可以有效地组合。让我们来看看怎么做。

6.4 分区
分区是分组的特殊情况:由一个谓词(返回一个布尔值的函数)作为分类函数,它称分区函数。分区函数返回一个布尔值,这意味着得到的分组Map的键类型是Boolean,于是它最多可以分为两组--true是一组,false是一组。例如,如果你是素食者或是请了一位素食的朋友来共进晚餐,可能会想要把菜单按照素食和非素食分开:
分区函数

Map<Boolean,List<Dish>> partitionedMenumenu.stream().collect(partitioningBy(Dish::isVegetarian));

这会返回下面的Map:

false=lpork,beef,chicken,prawns,salmon]true=lfrench fries,rice,season fruit,pizza]}

那么通过Map中键为true的值,就可以找出所有的素食菜看了
List<Dish> vegetarianDishes = partitionedMenu.get(true);
请注意,用同样的分区谓词,对菜单ist创建的流作筛选,然后把结果收集到另外一个List中也可以获得相同的结果:

List<Dish> vegetarianDishes=
menu.stream().filter(Dish::isVegetarian).collect (toList());

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/471459.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nuxt3+Vue3(Composition API)+TS+Vite+Ant Design Vue 搭建

最近官网搭建选择了nuxtjs&#xff0c;由于框架更新了&#xff0c;其中语法也有很多变化&#xff0c;中间遇到了一些问题点做下总结。 nuxt3官方文档地址&#xff1a;https://nuxt.com/docs/getting-started/installation 安装 在安装Nuxt3之前&#xff0c;你需要保证你的nod…

中科星图——LANDSAT_8/02/T1/RAW的Landsat8_C2_RAW类数据集

数据名称&#xff1a; Landsat8_C2_RAW 数据来源&#xff1a; USGS 时空范围&#xff1a; 2020年1月-2023年3月 空间范围&#xff1a; 全国 数据简介&#xff1a; Landsat8_C2_RAW数据集是经过缩放和校准的辐射亮度产品&#xff0c;按照数据质量划分为T1和T2。数据质量…

进程地址空间

虚拟地址&#xff1a; 引子&#xff1a; 我们在Linux中使用fork函数创建子进程时是否会产生一下几个疑惑。 为什么一个变量id具有两个值&#xff1f; 学习C语言后&#xff0c;我们都知道一个函数是不会返回两个值的&#xff0c;那么我们只能猜测是fork函数return了两次。 事实…

(16)Hive——企业调优经验

前言 本篇文章主要整理hive-3.1.2版本的企业调优经验&#xff0c;有误请指出~ 一、性能评估和优化 1.1 Explain查询计划 使用explain命令可以分析查询计划&#xff0c;查看计划中的资源消耗情况&#xff0c;定位潜在的性能问题&#xff0c;并进行相应的优化。 explain执行计划…

基于Python实现的元宵节猜灯谜兑奖软件源码,输入灯谜序号,获取谜面及谜底

基于Python实现的元宵节猜灯谜兑奖软件源码&#xff0c;输入灯谜序号&#xff0c;获取谜面及谜底 核心代码&#xff1a; import sys from time import sleep import xlrd import os import tkintertable_listA "" table_listB ""filename os.getcwd()&…

一个简单的链接脚本,用来将两个以上的.o文件合并在一起,以及如何看机器码的含义

下面是一个简单的lds链接脚本&#xff0c;用来将两个以上的.o文件合并在一起&#xff0c;并且用来指定链接后的代码加载到内存中的起始地址。 SECTIONS 说明这是段的描述脚本 {. 0xD0020010; 加载代码到内存中的起始地址为0xD0020010.text : { 代码段mystart.o mystar…

Java图形化界面编程——五子棋游戏 笔记

2.8.5 五子棋 接下来&#xff0c;我们使用之前学习的绘图技术&#xff0c;做一个五子棋的游戏。 注意&#xff0c;这个代码只实现了五子棋的落子、删除棋子和动画等逻辑实现&#xff0c;并没有把五子棋的游戏逻辑编写完整&#xff0c;比较简单易上手。 图片素材 package…

[嵌入式系统-14]:常见实时嵌入式操作系统比较:RT-Thread、uC/OS-II和FreeRTOS、Linux

目录 一、实时嵌入式操作系统 1.1 概述 1.2 什么“实时” 1.3 什么是硬实时和软实时 1.4 什么是嵌入式 1.5 什么操作系统 二、常见重量级操作系统 三、常见轻量级嵌入式操作系统 3.1 概述 3.2 FreeRTOS 3.3 uC/OS-II 3.4 RT-Thread 3.5 RT-Thread、uC/OS-II、Free…

智能汽车行业产业研究报告:毫米波雷达优势明显,核心壁垒是芯片、天线阵列、波形设计

今天分享的是智能汽车系列深度研究报告&#xff1a;《智能汽车行业产业研究报告&#xff1a;毫米波雷达优势明显&#xff0c;核心壁垒是芯片、天线阵列、波形设计》。 &#xff08;报告出品方&#xff1a;国泰君安证券&#xff09; 报告共计&#xff1a;67页 毫米波雷达被广泛…

浅谈业务场景中缓存的使用

浅谈缓存 一、背景二、缓存分类1.本地缓存2.分布式缓存 三、缓存读写模式1.读请求2.写请求 四、缓存穿透1.缓存空对象2.请求校验3.请求来源限制4.布隆过滤器 五、缓存击穿1.改变过期时间2.串行访问数据库 六、缓存雪崩1.避免集中过期2.提前更新缓存 七、缓存与数据库一致性1.设…

超详细的介绍Python语句

一、 常用命令 在介绍Python语句之前&#xff0c;先介绍一下几个有用的Python命令。 dir(模块名或类名或变量名或表达式名)&#xff1a;获得当前模块、变量对应类型、表达式计算值对应类的属性列表 type&#xff08;变量名或表达式名&#xff09;:获取变量或表达式计算值的对…

ChatGPT绘图指南:DALL.E3玩法大全(一)

一、 DALLE.3 模型介绍 1、什么是 DALLE.3 模型&#xff1f; DALLE-3模型&#xff0c;是一种由OpenAI研发的技术&#xff0c;它是一种先进的生成模型&#xff0c;可以将文字描述转化为清晰的图片。这种模型的名称"DALLE"实际上是"Deep Auto-regressive Latent …