Skip to content

Latest commit

 

History

History
1239 lines (752 loc) · 33.4 KB

README.md

File metadata and controls

1239 lines (752 loc) · 33.4 KB

二分查找

704. 二分查找

(1)某一个数 (2)最后一个小于目标值target的数 (3)最后一个小于等于目标值target的数 (3)第一个大于目标值target的数 (5)第一个大于等于目标值target的数

某一个数

定义 target 是在一个在左闭右闭的区间里,也就是[left, right] (这个很重要非常重要)

区间的定义这就决定了二分法的代码应该如何写,因为定义target在[left, right]区间,所以有如下两点:

  • while (left <= right) 要使用 <= ,因为left == right是有意义的,所以使用 <=
  • if (nums[middle] > target) right 要赋值为 middle - 1,因为当前这个nums[middle]一定不是target,那么接下来要查找的左区间结束下标位置就是 middle - 1
int binartSearch(vector<int> &nums, int target) {
    int lo = 0, hi = nums.size() - 1;
    while (lo <= hi) {
        int mid = lo + ((hi - lo) / 2); // 防止溢出 等同于(left + right)/2
        
        if (nums[mid] == target) {
            return mid;
        } else if (nums[mid] > target) {
            hi = mid - 1;
        } else {
            lo = mid + 1;
        }
    }
    
    return -1;
}

左边界

第一个大于等于目标值target的数

int getLeftBorder(vector<int>& nums, int target) {
    int lo = 0, hi = nums.size() - 1;

    while (lo <= hi) {
        int mid = lo + (hi - lo) / 2;

        if (nums[mid] >= target) {		// ==target 一直往左压缩,直到压缩到不等
            hi = mid - 1;
        } else if (nums[mid] < target) { 
            lo = mid + 1;
        }
    }

    return hi + 1;	// 因为相等还要执行hi = mid-1,所以需要+1
    //return hi + 1 等价于 return lo
    //因为 hi+1 是左边界了,所以 hi 是小于target的最后一个数
}

getLeftBorder target = 8

0 1 2 3 4 5

5 7 7 8 8 10

L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ LMR

0 1 2 3 4 5

5 7 7 8 8 10

​ R L

返回时 R 指向的是第一个比 target 小的数字,L/R+1为target第一次出现的位置

右边界

最后一个小于等于目标值target的数,

int getRightBorder(vector<int>& nums, int target) {
    int lo = 0, hi = nums.size() - 1;

    while (lo <= hi) {
        int mid = lo + (hi - lo) / 2;

        if (nums[mid] > target) {
            hi = mid - 1;
        } else if (nums[mid] <= target) {	// ==target 一直往右压缩,直到压缩到不等
            lo = mid + 1;
        }
    }

    return lo - 1;	// 
    return lo;		// 因为lo-1 是右边界了, lo-1 + 1 就是第一个大于的数
}

getRightBorder target = 8

0 1 2 3 4 5

5 7 7 8 8 10

L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ LMR

0 1 2 3 4 5

5 7 7 8 8 10

​ R L

返回时 L 指向的是第一个比 target 大的数字,R/L-1为target第一次出现的位置

https://blog.csdn.net/qq_41221520/article/details/108277801

最后一个小于target的数

int binartSearch(vector<int> &nums, int target) {
    int mid = 0, lo = 0, hi = nums.size() - 1;
    
    while (left <= right) {
        mid = lo + ((hi - lo) / 2);
        
        if (nums[mid] >= target) {	// !!!!!!  >=
            hi = mid - 1;
        } else {
            lo = mid + 1;
        }
    }
    
    return hi;		// 小于 target 最后一个位置
}

第一个大于target的数

int binartSearch(vector<int> &nums, int target) {
    int mid = 0, lo = 0, hi = nums.size() - 1;
    
    while (left <= right) {
        mid = lo + ((hi - lo) / 2);
        
        if (nums[mid] > target) {	// !!!!!!  >
            hi = mid - 1;
        } else {
            lo = mid + 1;
        }
    }
    
    return lo; 		// 大于 target 第一个位置
}

35.搜索插入位置

这道题目,要在数组中插入目标值,无非是这四种情况。

35_搜索插入位置3

  • 目标值在数组所有元素之前
  • 目标值等于数组中某一个元素
  • 目标值插入数组中的位置
  • 目标值在数组所有元素之后
int searchInsert(vector<int>& nums, int target) {
    int n = nums.size();
    int left = 0;
    int right = n - 1; // 定义target在左闭右闭的区间里,[left, right]
    
    while (left <= right) { // 当left==right,区间[left, right]依然有效
        int middle = left + ((right - left) / 2);// 防止溢出 等同于(left + right)/2
        if (nums[middle] > target) {
            right = middle - 1; // target 在左区间,所以[left, middle - 1]
        } else if (nums[middle] < target) {
            left = middle + 1; // target 在右区间,所以[middle + 1, right]
        } else { // nums[middle] == target
            return middle;
        }
    }
    
    // 分别处理如下四种情况
    // 目标值在数组所有元素之前  [0, -1] return  right + 1 (right=-1)
    // 目标值等于数组中某一个元素  return middle;
    // 目标值插入数组中的位置 [left, right],return  right + 1
    // 目标值在数组所有元素之后的情况 [left, right], return right + 1
    return right + 1;
}

💗34.在排序数组中查找元素的第一个和最后一个位置(

寻找target在数组里的左右边界,有如下三种情况:

  • 情况一:target 在数组范围的右边或者左边,例如数组{3, 4, 5},target为2或者数组{3, 4, 5},target为6,此时应该返回{-1, -1}
  • 情况二:target 在数组范围中,且数组中不存在target,例如数组{3,6,7},target为5,此时应该返回{-1, -1}
  • 情况三:target 在数组范围中,且数组中存在target,例如数组{3,6,7},target为6,此时应该返回{1, 1}

寻找右边界

先来寻找右边界,确定好:计算出来的右边界是不包含target的右边界,左边界同理。可以写出如下代码

// 二分查找,寻找target的右边界(不包括target)
// 如果rightBorder为没有被赋值(即target在数组范围的左边,例如数组[3,3],target为2),为了处理情况一
int getRightBorder(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
    int rightBorder = -2; // 记录一下rightBorder没有被赋值的情况
    
    while (left <= right) { // 当left==right,区间[left, right]依然有效
        int middle = left + ((right - left) / 2);
        
        if (nums[middle] > target) {
            right = middle - 1; // target 在左区间,所以[left, middle - 1]
        } else { // 当nums[middle] == target的时候,更新left,这样才能得到target的右边界
            left = middle + 1;
            rightBorder = left;
        }
    }
    
    return rightBorder;
}

寻找左边界

// 二分查找,寻找target的左边界leftBorder(不包括target)
// 如果leftBorder没有被赋值(即target在数组范围的右边,例如数组[3,3],target为4),为了处理情况一
int getLeftBorder(vector<int>& nums, int target) {
    int left = 0;
    int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
    int leftBorder = -2; // 记录一下leftBorder没有被赋值的情况
    while (left <= right) {
        int middle = left + ((right - left) / 2);
        if (nums[middle] >= target) { // 寻找左边界,就要在nums[middle] == target的时候更新right
            right = middle - 1;
            leftBorder = right;
        } else {
            left = middle + 1;
        }
    }
    return leftBorder;
}

处理三种情况

左右边界计算完之后,看一下主体代码,这里把上面讨论的三种情况,都覆盖了

class Solution {
public:
    vector<int> searchRange(vector<int>& nums, int target) {
        int leftBorder = getLeftBorder(nums, target);
        int rightBorder = getRightBorder(nums, target);
        // 情况一
        if (leftBorder == -2 || rightBorder == -2) return {-1, -1};
        // 情况三
        if (rightBorder - leftBorder > 1) return {leftBorder + 1, rightBorder - 1};
        // 情况二
        return {-1, -1};
    }
private:
     int getRightBorder(vector<int>& nums, int target) {
        int left = 0;
        int right = nums.size() - 1;
        int rightBorder = -2; // 记录一下rightBorder没有被赋值的情况
        while (left <= right) {
            int middle = left + ((right - left) / 2);
            if (nums[middle] > target) {
                right = middle - 1;
            } else { // 寻找右边界,nums[middle] == target的时候更新left
                left = middle + 1;
                rightBorder = left;
            }
        }
        return rightBorder;
    }
    int getLeftBorder(vector<int>& nums, int target) {
        int left = 0;
        int right = nums.size() - 1;
        int leftBorder = -2; // 记录一下leftBorder没有被赋值的情况
        while (left <= right) {
            int middle = left + ((right - left) / 2);
            if (nums[middle] >= target) { // 寻找左边界,nums[middle] == target的时候更新right
                right = middle - 1;
                leftBorder = right;
            } else {
                left = middle + 1;
            }
        }
        return leftBorder;
    }
};

初学者建议大家一块一块的去分拆这道题目,正如本题解描述,想清楚三种情况之后,先专注于寻找右区间,然后专注于寻找左区间,左右根据左右区间做最后判断。

Mine!!!!

int getLeftBorder(vector<int>& nums, int target) {
    int lo = 0, hi = nums.size() - 1;

    while (lo <= hi) {
        int mid = lo + (hi - lo) / 2;

        if (nums[mid] >= target) {
            hi = mid - 1;
        } else if (nums[mid] < target) {
            lo = mid + 1;
        }
    }

    return hi + 1;
}

int getRightBorder(vector<int>& nums, int target) {
    int lo = 0, hi = nums.size() - 1;

    while (lo <= hi) {
        int mid = lo + (hi - lo) / 2;

        if (nums[mid] > target) {
            hi = mid - 1;
        } else if (nums[mid] <= target) {	// ==target 一直往右压缩,直到压缩到
            lo = mid + 1;
        }
    }

    return lo - 1;
}

getLeftBorder target = 8

0 1 2 3 4 5

5 7 7 8 8 10

L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ LMR

0 1 2 3 4 5

5 7 7 8 8 10

​ R L

返回时 R 指向的是第一个比 target 小的数字,R+1为target第一次出现的位置

getRightBorder target = 8

0 1 2 3 4 5

5 7 7 8 8 10

L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ L M R

0 1 2 3 4 5

5 7 7 8 8 10

​ LMR

0 1 2 3 4 5

5 7 7 8 8 10

​ R L

返回时 L 指向的是第一个比 target 大的数字,R/L-1为target第一次出现的位置


69.x 的平方根

二分查找第一个 res^2 大于x的元素,然后再减一

通过不断猜测一个数字的平方 == x ? 然后不断修正这个数字

int mySqrt(int x) {
    int left = 1;  
    int right = x;
    int mid;

    while (left <= right) {
        mid = left + (right - left) / 2;

        if (pow(mid, 2) > x) {
            right = mid - 1;
        } else {
            left  = mid + 1; 
        } 
    }

    return left - 1;
}

367.有效的完全平方数

bool isPerfectSquare(int num) {
    if (num == 1) return true;
    if (num == 2 | num == 3) return false;

    int left = 0;
    int right = num / 2;
    int mid;
    while (left <= right) {
        mid = left + (right - left) / 2;
        if (pow(mid, 2) > num) {
            right = mid - 1;
        } else if (pow(mid, 2) < num) {
            left = mid + 1;
        } else {
            return true;
        }
    }

    return false;
}

14. 最长公共前缀

fig4

最长公共前缀的长度不会超过字符串数组中的最短字符串的长度。用 $\textit{minLength}$ 表示字符串数组中的最短字符串的长度,则可以在 $[0,\textit{minLength}]$ 的范围内通过二分查找得到最长公共前缀的长度。每次取查找范围的中间值 $\textit{mid}$,判断每个字符串的长度为 $\textit{mid}$ 的前缀是否相同,如果相同则最长公共前缀的长度一定大于或等于 $\textit{mid}$,如果不相同则最长公共前缀的长度一定小于 $\textit{mid}$,通过上述方式将查找范围缩小一半,直到得到最长公共前缀的长度。


644. 子数组最大平均数 II

连续数组

min 表示数组 nums 的最小值,max 表示数组 nums 的最大值。最大平均字段和 一定在最大值与最小值之间,即区间 (min, max) 之间。

因为值全是max的时候,平均数是max;全是min的时候,平均数是min

二分思想是:通过不断猜测最大平均值,再通过验证更新猜测值,使每次猜测更加接近正确值。

  • 如果猜测值太大,下一次猜一个更小的值
  • 如果猜测值太小,下一次猜一个更大的值

以 max 和 min 作为猜测边界,每次猜测值为 mid = min + (max - min) /2。接下来寻找是否存在长度 >= k 的连续子数组的平均值大于 mid。

假设在数组 num 中存在一个长度为 j 的子数组,它的元素为 $a_1, a_2, a_3...,a_j$,它们的平均值 >= mid,即

  • $(a_1+a_2+ a_3...+a_j)/j \geq mid$
  • $(a_1+a_2+ a_3...+a_j) \geq j*mid$
  • $(a_1-mid) +(a_2-mid)+ (a_3-mid) ...+(a_j-mid) \geq 0$

数组中每个元素都减去 mid 后,如果存在长度 >= k 的子数组之和 >= 0,则表明数组 nums 中存在子数组的平均和 >= mid,此时令猜测区间的下边界为 mid;否则令猜测区间的上边界为 mid,然后继续该过程

在遍历数组 nums 时,将 nums[i] - mid 加到 sum[i] 上。如果 sum[k] >= 0,则直接令猜测区间的下界变为 mid。否则,按照下面思路不断求 nums 的前 i 项之和。

数组的前 j 项之和分别为 $sum_j$$sum_i$。因此第 j 到 i 项之和为 $sum_j - sum_i$。我们希望找到一对 i 和 j,使得 $j-i \ge k$ 时,有 $sum_j - sum_i \ge 0$。为了实现这一点,只需要计算第 $j-k$$j$ 项之和。这是因为如果最小的 $sum_i$ 都不能满足条件,则更大的值也无法满足条件。

使用 prev 变量存储从第 k 个位置开始的累加和。然后记录 prev 中出现过的最小值,即最小和。

每次寻找到一个新的 mid 后,都将它作为猜测区间的上边界或下边界,以不断缩小猜测范围。为了保证精度,使用 error 保证区间宽度小于 10-5 时,结束猜测。

bool check(vector<int>& nums, double mid, int k) {
    int n = nums.size();

    vector<double> preSum(n + 1, 0);

    for (int i = 1; i <= n; ++i) {
        preSum[i] = preSum[i - 1] + nums[i - 1] - mid;
    }

    double preMin = preSum[0];
    for (int i = k; i <= n; ++i) {
        preMin = min(preMin, preSum[i - k]);    //   每次更新 preMin 最小值
        if (preSum[i] - preMin >= 0) return true;
    }

    return false;
}

double findMaxAverage(vector<int>& nums, int k) {
    int n = nums.size();
    double maxV = *max_element(nums.begin(), nums.end());
    double minV = *min_element(nums.begin(), nums.end());

    while ((maxV - minV) >  1e-5) {
        double mid = minV + (maxV - minV) / 2;

        if (check(nums, mid, k)) {
            minV = mid;
        } else {
            maxV = mid;
        }

    }

    return maxV;
}

实现 Check函数,就是前缀和的计算,即通过 目前和 - 前缀和 获取当前范围和。

特别要注意的是:条件是说 大于等于 k, 所以我们前缀和的计算数组的大小是 0 到 n-k

前缀和add,维护ij,addj-minAddi来求平均数,不需要固定i,只需要维护历史上最小的addi,也就是只需要固定j


643. 子数组最大平均数 I

bool check(vector<int>& nums, double mid, int k) {
    int n = nums.size();
    vector<double> preSum(n + 1, 0);

    for (int i = 1; i <= n; ++i) {
        preSum[i] = preSum[i-1] + nums[i-1] - mid;
    }


    for (int i = k; i <= n; ++i) {
        if (preSum[i] - preSum[i-k] >= 0) return true;
    }

    return false;
}

double findMaxAverage(vector<int>& nums, int k) {
    int n = nums.size();
    double maxV = *max_element(nums.begin(), nums.end());
    double minV = *min_element(nums.begin(), nums.end());

    while (maxV - minV > 1e-5) {
        double mid = minV + (maxV - minV) / 2;
        if (check(nums, mid, k)) {
            minV = mid;
        } else {    // 不满足说明值太大,所以maxV变小为mid
            maxV = mid;
        }
    }

    return minV;
}

209. 长度最小的子数组

int minSubArrayLen(int target, vector<int>& nums) {
    int n = nums.size();

    vector<int> preSum(n + 1, 0);

    for (int i = 0; i < n; ++i) {
        preSum[i+1] = preSum[i] + nums[i];
    }

    int res = INT_MAX;
    for (int i = 1; i <= n; ++i) {
        int lo = 0, hi = i;

        while (lo <= hi) {
            int mid = lo + (hi - lo) / 2;
            if (preSum[i] - preSum[mid] >= target) {
                res = min(res, i - mid);
                lo = mid + 1;          
            } else {
                hi = mid - 1; 
            }
        }
    }        

    return res == INT_MAX ? 0 : res;
}

优化一下

int minSubArrayLen(int target, vector<int>& nums) {
    int n = nums.size();

    vector<int> preSum(n + 1, 0);

    for (int i = 0; i < n; ++i) {
        preSum[i+1] = preSum[i] + nums[i];
    }

    int res = INT_MAX;
    for (int i = 0; i <= n; ++i) {
        int findT = preSum[i] + target;
        auto bound = lower_bound(preSum.begin(), preSum.end(), findT);
        if (bound != preSum.end()) { //如果存在
            int nLen = static_cast<int>((bound - preSum.begin()) - i);  // 第一个比findT大的数到i的位置
            res = min(res, nLen);
        }
    }        

    return res == INT_MAX ? 0 : res;
}

面试题 17.11. 单词距离

int findClosest(vector<string>& words, string word1, string word2) {
    vector<int> w1, w2;
    for (int i = 0; i < words.size(); ++i) {
        if (words[i] == word1) w1.push_back(i);
        if (words[i] == word2) w2.push_back(i);
    }

    int res = 0x3f3f3f3f;
    for (int i = 0; i < w2.size(); ++i) {           // 对每个w2里的元素 在w1里找与其插值最小的下标
        auto first = lower_bound(w1.begin(), w1.end(), w2[i]);

        int dis = distance(w1.begin(), first);      
        //如果为空,则局部最小值是与w1最后一个元素的差值
        if (first == w1.end()) res = min(res, abs(w2[i] - w1[w1.size()-1]));    
        else {
            res = min(res, abs(w2[i] - w1[dis]));
            // 如果dis不是w1首元素,则局部最小值可能是dis,也可能是dis-1
            if (dis != 0) res = min(res, abs(w2[i] - w1[dis-1]));   
        }
    }

    return res;
}

O(NlogN)

发现 dis-1 跟 w1.size()-1 可以优化一下

int findClosest(vector<string>& words, string word1, string word2) {
    vector<int> w1, w2;
    for (int i = 0; i < words.size(); ++i) {
        if (words[i] == word1) w1.push_back(i);
        if (words[i] == word2) w2.push_back(i);
    }

    int res = 0x3f3f3f3f;
    for (int i = 0; i < w2.size(); ++i) {           // 对每个w2里的元素 在w1里找与其插值最小的下标
        auto first = lower_bound(w1.begin(), w1.end(), w2[i]);

        int dis = distance(w1.begin(), first);      
        //如果为空,则局部最小值是与w1最后一个元素的差值
        if (first != w1.end()) res = min(res, abs(w2[i] - w1[dis]));
        if (dis != 0) res = min(res, abs(w2[i] - w1[dis-1]));
    }

    return res;
}

但事实是反向优化


719. 找出第 K 小的数对距离

先将数组 nums 从小到大进行排序。因为第 k 小的数对距离必然在区间 [0, max (nums) - min(nums)] 内,令 left=0,right=max(nums)−min(nums),我们在区间 [left,right] 上进行二分。

对于当前搜索的距离 mid,计算所有距离小于等于 mid 的数对数目 cnt,如果 $\textit{cnt} \ge k$,那么 right = mid - 1,否则 left=mid+1。当 left>right 时,终止搜索,那么第 k 小的数对距离为 left。

给定距离 mid,计算所有距离小于等于 mid 的数对数目 cnt 可以使用二分查找:枚举所有数对的右端点 j,二分查找大于等于 nums[j]−mid 的最小值的下标 i,那么右端点为 j 且距离小于等于 mid 的数对数目为 j−i,计算这些数目之和。

class Solution {
public:
    int getCnt(vector<int>& nums, int mid) {
        int cnt = 0;

        for (int j = 0; j < nums.size(); j++) {  // 枚举所有数对的右端点 j
            int i = lower_bound(nums.begin(), nums.begin() + j, nums[j] - mid) - nums.begin(); // 查找大于等于 nums[j]−mid 的最小值的下标 i
            cnt += j - i; // 那么右端点为 j 且距离小于等于 mid 的数对数目为 j−i
        }
        return cnt;
    }

    int smallestDistancePair(vector<int>& nums, int k) {
        sort(nums.begin(), nums.end());
        int maxn = *max_element(nums.begin(), nums.end());
        int minn = *min_element(nums.begin(), nums.end());

        int left = 0, right = maxn - minn;

        while (left <= right) {
            int mid = left + (right - left) / 2;
            int cnt = getCnt(nums, mid);

            if (cnt >= k) {
                right = mid - 1;
            } else if (cnt < k) {
                left = mid + 1;
            }
            
        }


        return left;
    }
};

532. 数组中的 k-diff 数对

int findPairs(vector<int>& nums, int k) {
    /*负数映射到正数区间*/
    int minn = *min_element(nums.begin(), nums.end());

    if (minn < 0) {
        for (auto &n : nums) {
            n += abs(minn);
        }
    }

    sort(nums.begin(), nums.end());
	/* k == 0 用 hashmap */
    if (k == 0) {
        unordered_map<int, int> ump;
        for (int i = 1; i < nums.size(); ++i) {
            if (ump.count(nums[i]) == 0) {
                if (nums[i] == nums[i-1]) ump[nums[i]] = 1;
            }
        } 
        return ump.size();
    } 
	
    /*k != 0 用二分找*/
    nums.erase(unique(nums.begin(), nums.end()), nums.end());
    int cnt = 0;
    for (int j = 1; j < nums.size(); ++j) {
        auto find = lower_bound(nums.begin(), nums.end(), nums[j] - k);
        if (find != nums.end()) {
            int idx = find - nums.begin();
            if (nums[idx] == nums[j] - k) cnt++;
        }
    }

    return cnt;
}

4. 寻找两个正序数组的中位数

根据中位数的定义,当 m+n 是奇数时,中位数是两个有序数组中的第 (m+n)/2 个元素,当 m+n 是偶数时,中位数是两个有序数组中的第 (m+n)/2 个元素和第 (m+n)/2+1 个元素的平均值。

因此,这道题可以转化成寻找两个有序数组中的第 k 小的数,其中 k 为 (m+n)/2 或 (m+n)/2+1。

假设两个有序数组分别是 A 和 B。要找到第 k 个元素,我们可以比较 A[k/2−1] 和 B[k/2−1],其中 / 表示整数除法。

由于A[k/2−1] 和 B[k/2−1] 的前面分别有 A[0..k/2−2] 和 B[0..k/2−2],即 k/2−1 个元素,对于 A[k/2−1] 和 B[k/2−1] 中的较小值,最多只会有 (k/2−1)+(k/2−1)≤k−2 个元素比它小,那么它就不能是第 k 小的数了。

因此我们可以归纳出三种情况:

  • 如果 $A[k/2−1]&lt;B[k/2−1]$,则比 A[k/2−1] 小的数最多只有 A 的前 k/2−1 个数和 B 的前 k/2−1 个数,即比 A[k/2−1] 小的数最多只有 k−2 个,因此 A[k/2−1] 不可能是第 k 个数,A[0] 到 A[k/2−1] 也都不可能是第 k 个数,可以全部排除。

  • 如果 $A[k/2−1]&gt;B[k/2−1]$,同理可以排除 B[0] 到 B[k/2−1]。

  • 如果 $A[k/2−1]=B[k/2−1]$,则可以归入第一种情况处理。

可以看到,比较 A[k/2−1] 和 B[k/2−1] 之后,可以排除 k/2 个不可能是第 k 小的数,查找范围缩小了一半。同时,我们将在排除后的新数组上继续进行二分查找,并且根据我们排除数的个数,减少 k 的值,这是因为我们排除的数都不大于第 k 小的数。

有以下三种情况需要特殊处理:

  • 如果 A[k/2−1] 或者 \text{B}[k/2-1]B[k/2−1] 越界,那么我们可以选取对应数组中的最后一个元素。在这种情况下,我们必须根据排除数的个数减少 kk 的值,而不能直接将 kk 减去 k/2k/2。

  • 如果一个数组为空,说明该数组中的所有元素都被排除,我们可以直接返回另一个数组中第 kk 小的元素。

  • 如果 k=1,我们只要返回两个数组首元素的最小值即可。

class Solution {
public:
    int getKthElement(const vector<int>& nums1, const vector<int>& nums2, int k) {
        /* 主要思路:要找到第 k (k>1) 小的元素,那么就取 pivot1 = nums1[k/2-1] 和 pivot2 = nums2[k/2-1] 进行比较
         * 这里的 "/" 表示整除
         * nums1 中小于等于 pivot1 的元素有 nums1[0 .. k/2-2] 共计 k/2-1 个
         * nums2 中小于等于 pivot2 的元素有 nums2[0 .. k/2-2] 共计 k/2-1 个
         * 取 pivot = min(pivot1, pivot2),两个数组中小于等于 pivot 的元素共计不会超过 (k/2-1) + (k/2-1) <= k-2 个
         * 这样 pivot 本身最大也只能是第 k-1 小的元素
         * 如果 pivot = pivot1,那么 nums1[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums1 数组
         * 如果 pivot = pivot2,那么 nums2[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums2 数组
         * 由于我们 "删除" 了一些元素(这些元素都比第 k 小的元素要小),因此需要修改 k 的值,减去删除的数的个数
         */

        int m = nums1.size();
        int n = nums2.size();
        int index1 = 0, index2 = 0;

        while (true) {
            // 边界情况
            if (index1 == m) {
                return nums2[index2 + k - 1];
            }
            if (index2 == n) {
                return nums1[index1 + k - 1];
            }
            if (k == 1) {
                return min(nums1[index1], nums2[index2]);
            }

            // 正常情况
            int newIndex1 = min(index1 + k / 2 - 1, m - 1);
            int newIndex2 = min(index2 + k / 2 - 1, n - 1);
            int pivot1 = nums1[newIndex1];
            int pivot2 = nums2[newIndex2];
            if (pivot1 <= pivot2) {
                k -= newIndex1 - index1 + 1;
                index1 = newIndex1 + 1;
            }
            else {
                k -= newIndex2 - index2 + 1;
                index2 = newIndex2 + 1;
            }
        }
    }

    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int totalLength = nums1.size() + nums2.size();
        if (totalLength % 2 == 1) {
            return getKthElement(nums1, nums2, (totalLength + 1) / 2);
        }
        else {
            return (getKthElement(nums1, nums2, totalLength / 2) + getKthElement(nums1, nums2, totalLength / 2 + 1)) / 2.0;
        }
    }
};

作者:LeetCode-Solution
链接:https://leetcode.cn/problems/median-of-two-sorted-arrays/solution/xun-zhao-liang-ge-you-xu-shu-zu-de-zhong-wei-s-114/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

头条2018后端笔试-用户喜好

https://blog.csdn.net/flushhip/article/details/79416715

题目

为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜好值为 k。因为一些特殊的原因,不会出现一个查询的用户区间完全覆盖另一个查询的用户区间(不存在L1<=L2<=R2<=R1)。

输入

第 1 行为 n 代表用户的个数

第 2 行为 n 个整数,第 i 个代表用户标号为 i 的用户对某类文章的喜好度

第3行为一个正整数 q 代表查询的组数,

第4行到第(3+q)行,每行包含3个整数 l,r,k 代表一组查询,即标号为 l<=i<=r 的用户中对这类文章喜好值为 k 的用户的个数。 数据范围 n<=3e5, q<=3e5,k是整型。

输出

一共q行,每行一个整数代表喜好值为k的用户的个数。

样例输入

5
1 2 3 3 5
3
1 2 1
2 4 5
3 5 3

样例输出

1
0
2

数据很大,询问 300000 次,那么每次询问对应的操作的时间复杂度必须是 O(1) 或 O(logn) ;

这就为我们思考算法提供了方向,O(1) 显然是不可能的,那么操作的时间复杂度为 O(logn) 的算法只能是二分查找了

二分的要求是序列有序,因此不管那么多,先排序,可是按照什么东西来排序呢?由于题目要求在一个时间范围内喜好为 k 的有多少人,那么可以把相同 k 值的人放到一起形成一个子序列,然后再根据时间的范围在这个子序列中查找,因此用结构体的二级排序,先按 k 值的大小升序排序,如果 k 值相同,再按时间顺序升序排序;

bool sort_cmp (const pair<int, int> &A, const pair<int, int> &B)
{
	if (A.first == B.first)
        return A.second < B.second;
    
    return A.first < B.first;
}

这样的二级排序是稳定排序,故排序后整个序列是k值升序的,各个子序列中的时间也是升序的。

排好序后,就是查找的过程,先用equal_range找到序列中k值为目标k值的子序列,然后用lower_bound与upper_bound在子序列中找到目标时间范围内的最长子序列(用lower_bound找到第一个大于或等于左端点的位置,用upper_bound找到最后一个小于或等于右端点的位置),比如目标时间范围是[3, 7],那么假设最大子序列为[4, 5],[4,5]⊂[3,7][4,5]⊂[3,7],答案就是最长子序列的长度。

#include <bits/stdc++.h>

using namespace std;

bool sort_cmp(const pair<int, int> &A, const pair<int, int> &B)
{
    return A.first == B.first ? A.second < B.second :
        A.first < B.first;
}

struct find_first_cmp {
    bool operator()(const pair<int, int> &P, int k) const
    {
        return P.first < k;
    }

    bool operator()(int k, const pair<int, int> &P) const
    {
        return k < P.first;
    }
};

struct find_second_cmp {
    bool operator()(const pair<int, int> &P, int k) const
    {
        return P.second < k;
    }

    bool operator()(int k, const pair<int, int> &P) const
    {
        return k < P.second;
    }
};

int main()
{
    int n, q;
    while (EOF != scanf("%d", &n)) {
        vector<pair<int, int> > arr;
        for (int i = 0, x; i < n; cin >> x, arr.emplace_back(x, ++i)) {}
        sort(arr.begin(), arr.end(), sort_cmp);

        for (scanf("%d", &q); q--;) {
            int L, R, k;
            scanf("%d%d%d", &L, &R, &k);
            pair<vector<pair<int, int> >::iterator, vector<pair<int, int> >::iterator> sd =
                equal_range(arr.begin(), arr.end(), k, find_first_cmp{});
            
            printf("%d\n", upper_bound(sd.first, sd.second, R, find_second_cmp{}) -
                lower_bound(sd.first, sd.second, L, find_second_cmp{}));
        }
    }
    return 0;
}