最长递增子序列

✍ dations ◷ 2024-10-19 00:30:25 #组合数学,动态规划

在计算机科学中,最长递增子序列(longest increasing subsequence)问题是指,在一个给定的数值序列中,找到一个子序列,使得这个子序列元素的数值依次递增,并且这个子序列的长度尽可能地大。最长递增子序列中的元素在原序列中不一定是连续的。许多与数学、算法、随机矩阵理论(英语:random matrix theory)、表示论相关的研究都会涉及最长递增子序列。解决最长递增子序列问题的算法最低要求O( log )的时间复杂度,这里表示输入序列的规模。

对于以下的原始序列

最长递增子序列为

值得注意的是原始序列的最长递增子序列并不一定唯一,对于该原始序列,实际上还有以下两个最长递增子序列

最长递增子序列问题与最长公共子序列问题密切相关,后者具有动态规划解决方案(时间复杂度为O):序列S的最长递增子序列是S和T的最长公共子序列,其中T是对S进行排序的结果。但对于特殊情况,输入是整数 1, 2, ..., , 的排列,解决方案可以进一步改进,从而使时间复杂度降为O( log ) 。

排列图(permutaion graph)中的最大团是由'定义该图的排列中最长的递减子序列'定义的, 求最长的递减子序列在计算复杂度上(通过对所有数取它的负数)等同于求最长的递增子序列。 因此,最长递增子序列算法可用于有效地解决排列图中的分团问题。

下面概述的算法使用数组和二分查找算法有效地解决了最长递增子序列问题。 它依次处理序列元素,保存当前找到的最长的递增子序列, 比如: ,X ]。在处理X之后,算法会将值存储在两个数组中:

另外,该算法还存储了一个变量L,该变量L表示到目前为止找到的最长的递增子序列的长度。 下面的算法使用基于零的编号,为了清楚起见,M用M 填充,而M 未使用,因此M 对应于长度j的子序列。 实际的实现可以跳过M 并相应地调整索引。

请注意,在算法的任何时候,序列

是递增的。 因为,如果长度的子序列以X ]结尾,则长度的子序列以较小的值结尾:即以X 结尾的子序列 ]。 因此,我们可以使用二分查找在时间内完成搜索。

伪代码如下:

P = array of length NM = array of length N + 1L = 0for i in range 0 to N-1:    // Binary search for the largest positive j ≤ L    // such that X] <= X    lo = 1    hi = L    while lo ≤ hi:        mid = ceil((lo+hi)/2)        if X] < X:            lo = mid+1        else:            hi = mid-1    // After searching, lo is 1 greater than the    // length of the longest prefix of X    newL = lo    // The predecessor of X is the last index of     // the subsequence of length newL-1    P = M    M = i        if newL > L:        // If we found a subsequence longer than any we've        // found yet, update L        L = newL// Reconstruct the longest increasing subsequenceS = array of length Lk = Mfor i in range L-1 to 0:    S = X    k = Preturn S

由于该算法对每个序列元素都执行二分查找,因此时间复杂度为O( log )。 弗雷德曼 Fredman (1975)讨论了该算法的一种变体,他将其归功于高德纳。 在他研究的变体中,该算法在进行二分查找之前,测试每个值X 是否可以在常数时间内扩展当前最长的递增序列。 通过这种修改,算法在最坏的情况下只会进行 log2 − log2log2 + O()个比较,对于比较算法(最高为O() 项中的恒定因子)而言,这是最佳选择。

相关

  • 欧洲共同体本文是 欧洲联盟的政治与政府 系列条目之一欧洲共同体(英语:European Community;单数)是欧洲联盟官方已不再使用的组织名称,使用于1993至2009年。1993年11月1日生效的《马斯垂特
  • 宋微波宋微波(1958年12月-),生于山东省微山县,籍贯江苏睢宁,中国海洋大学教授。宋微波是中国原生动物学家,主要从事纤毛虫及其他原生动物的分类学、系统学和细胞学三方面的研究。2015年获
  • 守恒量在经典力学里,对于一个动力系统,随着时间的演进,所有保持不变的物理量都称为守恒量(conserved quantity),又称为运动常数。由于很多物理定律会表达某种守恒行为,对应的守恒量时常会
  • 敏感性灵敏度和特异度(Sensitivity and specificity),是统计学中用来表征二项分类测试特征的数据。灵敏度可以作为避免假阴性的量化指标,而特异度可以作为避免假阳性的量化指标。对于
  • 星期二星期二,又称为礼拜二或周二。是指在星期一和星期三之间的一天。拉丁语名字为dies Martis来源于古罗马神话战神玛尔斯或火星;法语为mardi,来源于拉丁语;英文名字(Tuesday)来源于北
  • 化学评论《化学评论》(英语:,通常缩写为)是一本同行评审的科学杂志,由美国化学会于1924年创刊并发行至今。如其名称所示,该杂志发表某一领域内的综合性的批判性的评论(即综述),不发表原创研究
  • 卡美哈梅哈四世卡美哈梅哈四世(Kamehameha IV,1834年-1863年)原名亚历山大·伊奥拉尼·利霍利霍·柯阿威努伊(Alexander ʻIolani Liholiho Keawenui),是夏威夷王国第四代国王,1855年1月11日至1863
  • 普尔加奥恩普尔加奥恩(Pulgaon),是印度马哈拉施特拉邦Wardha县的一个城镇。总人口36506(2001年)。该地2001年总人口36506人,其中男性18942人,女性17564人;0—6岁人口3689人,其中男1928人,女1761
  • 须臾须臾(muhūrta),中文数字单位10-15,和佛教时间单位。根据佛教《僧祇律》中记载:“刹那者为一念, 二十念为一瞬, 二十瞬为一弹指,二十弹指为一罗预, 二十罗预为一须臾, 一日一夜为三十
  • Burrows-Wheeler变换Burrows–Wheeler Transform(简称BWT,也称作块排序压缩),是一个被应用在数据压缩技术(如bzip2)中的算法。该算法于1994年被Michael Burrows(英语:Michael Burrows)和David Wheeler(英