一、题目
给你一个整数数组nums
,请你找出一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。子数组 是数组中的一个连续部分。
示例 1:
输入:nums = [-2,1,-3,4,-1,2,1,-5,4]
输出:6
解释:连续子数组[4,-1,2,1]
的和最大,为6
。
示例 2:
输入:nums = [1]
输出:1
示例 3:
输入:nums = [5,4,-1,7,8]
输出:23
1 <= nums.length <= 105
-104 <= nums[i] <= 104
进阶: 如果你已经实现复杂度为O(n)
的解法,尝试使用更为精妙的 分治法 求解。
二、代码
【1】动态规划: 假设nums
数组的长度是n
,下标从0
到n−1
。我们用f(i)
代表以第i
个数结尾的「连续子数组的最大和」,那么很显然我们要求的答案就是:max0≤i≤n−1{f(i)}
因此我们只需要求出每个位置的f(i)
,然后返回f
数组中的最大值即可。那么我们如何求f(i)
呢?我们可以考虑nums[i]
单独成为一段还是加入f(i−1)
对应的那一段,这取决于nums[i]
和f(i−1)+nums[i]
的大小,我们希望获得一个比较大的,于是可以写出这样的动态规划转移方程:f(i)=max{f(i−1)+nums[i],nums[i]}
不难给出一个时间复杂度O(n)
、空间复杂度O(n)
的实现,即用一个f
数组来保存f(i)
的值,用一个循环求出所有f(i)
。考虑到f(i)
只和f(i−1)
相关,于是我们可以只用一个变量pre
来维护对于当前f(i)
的f(i−1)
的值是多少,从而让空间复杂度降低到O(1)
,这有点类似「滚动数组」的思想。
class Solution {public int maxSubArray(int[] nums) {int pre = 0, maxAns = nums[0];for (int x : nums) {pre = Math.max(pre + x, x);maxAns = Math.max(maxAns, pre);}return maxAns;}
}
时间复杂度: O(n)
,其中n
为nums
数组的长度。我们只需要遍历一遍数组即可求得答案。
空间复杂度: O(1)
。我们只需要常数空间存放若干变量。
【2】分治: 这个分治方法类似于「线段树求解最长公共上升子序列问题」的pushUp
操作。 也许读者还没有接触过线段树,没有关系,方法二的内容假设你没有任何线段树的基础。当然,如果读者有兴趣的话,推荐阅读线段树区间合并法解决多次询问的「区间最长连续上升序列问题」和「区间最大子段和问题」,还是非常有趣的。
我们定义一个操作get(a, l, r)
表示查询a
序列[l,r]
区间内的最大子段和,那么最终我们要求的答案就是get(nums, 0, nums.size() - 1)
。如何分治实现这个操作呢?对于一个区间[l,r]
,我们取m=⌊l+r2⌋
,对区间[l,m]
和[m+1,r]
分治求解。当递归逐层深入直到区间长度缩小为1
的时候,递归「开始回升」。这个时候我们考虑如何通过[l,m]
区间的信息和[m+1,r]
区间的信息合并成区间[l,r]
的信息。最关键的两个问题是:
1、我们要维护区间的哪些信息呢?
2、我们如何合并这些信息呢?
对于一个区间[l,r]
,我们可以维护四个量:
1、lSum
表示[l,r]
内以l
为左端点的最大子段和
2、rSum
表示[l,r]
内以r
为右端点的最大子段和
3、mSum
表示[l,r]
内的最大子段和
4、iSum
表示[l,r]
的区间和
以下简称[l,m]
为[l,r]
的「左子区间」,[m+1,r]
为[l,r]
的「右子区间」。我们考虑如何维护这些量呢(如何通过左右子区间的信息合并得到[l,r]
的信息)?对于长度为1
的区间[i,i]
,四个量的值都和nums[i]
相等。对于长度大于1
的区间:
1、首先最好维护的是iSum
,区间[l,r]
的iSum
就等于「左子区间」的iSum
加上「右子区间」的iSum
。
2、对于[l,r]
的lSum
,存在两种可能,它要么等于「左子区间」的lSum
,要么等于「左子区间」的iSum
加上「右子区间」的lSum
,二者取大。
3、对于[l,r]
的rSum
,同理,它要么等于「右子区间」的rSum
,要么等于「右子区间」的iSum
加上「左子区间」的rSum
,二者取大。
4、当计算好上面的三个量之后,就很好计算[l,r]
的mSum
了。我们可以考虑[l,r]
的mSum
对应的区间是否跨越m
——它可能不跨越m
,也就是说[l,r]
的mSum
可能是「左子区间」的mSum
和 「右子区间」的mSum
中的一个;它也可能跨越m
,可能是「左子区间」的rSum
和 「右子区间」的lSum
求和。三者取大。
这样问题就得到了解决。
class Solution {public class Status {public int lSum, rSum, mSum, iSum;public Status(int lSum, int rSum, int mSum, int iSum) {this.lSum = lSum;this.rSum = rSum;this.mSum = mSum;this.iSum = iSum;}}public int maxSubArray(int[] nums) {return getInfo(nums, 0, nums.length - 1).mSum;}public Status getInfo(int[] a, int l, int r) {if (l == r) {return new Status(a[l], a[l], a[l], a[l]);}int m = (l + r) >> 1;Status lSub = getInfo(a, l, m);Status rSub = getInfo(a, m + 1, r);return pushUp(lSub, rSub);}public Status pushUp(Status l, Status r) {int iSum = l.iSum + r.iSum;int lSum = Math.max(l.lSum, l.iSum + r.lSum);int rSum = Math.max(r.rSum, r.iSum + l.rSum);int mSum = Math.max(Math.max(l.mSum, r.mSum), l.rSum + r.lSum);return new Status(lSum, rSum, mSum, iSum);}
}
假设序列a
的长度为n
。
时间复杂度: 假设我们把递归的过程看作是一颗二叉树的先序遍历,那么这颗二叉树的深度的渐进上界为O(logn)
,这里的总时间相当于遍历这颗二叉树的所有节点,故总时间的渐进上界是O(∑i=1logn2i−1)=O(n)
,故渐进时间复杂度为O(n)
。
空间复杂度: 递归会使用O(logn)
的栈空间,故渐进空间复杂度为O(logn)
。
题外话: 「方法二」相较于「方法一」来说,时间复杂度相同,但是因为使用了递归,并且维护了四个信息的结构体,运行的时间略长,空间复杂度也不如方法一优秀,而且难以理解。那么这种方法存在的意义是什么呢?
对于这道题而言,确实是如此的。但是仔细观察「方法二」,它不仅可以解决区间[0,n−1]
,还可以用于解决任意的子区间[l,r]
的问题。如果我们把[0,n−1]
分治下去出现的所有子区间的信息都用堆式存储的方式记忆化下来,即建成一棵真正的树之后,我们就可以在O(logn)
的时间内求到任意区间内的答案,我们甚至可以修改序列中的值,做一些简单的维护,之后仍然可以在O(logn)
的时间内求到任意区间内的答案,对于大规模查询的情况下,这种方法的优势便体现了出来。这棵树就是上文提及的一种神奇的数据结构——线段树。