(1)某一个数 (2)最后一个小于目标值target的数 (3)最后一个小于等于目标值target的数 (3)第一个大于目标值target的数 (5)第一个大于等于目标值target的数
定义 target 是在一个在左闭右闭的区间里,也就是[left, right] (这个很重要非常重要)。
区间的定义这就决定了二分法的代码应该如何写,因为定义target在[left, right]区间,所以有如下两点:
- while (left <= right) 要使用 <= ,因为left == right是有意义的,所以使用 <=
- if (nums[middle] > target) right 要赋值为 middle - 1,因为当前这个nums[middle]一定不是target,那么接下来要查找的左区间结束下标位置就是 middle - 1
int binartSearch(vector<int> &nums, int target) {
int lo = 0, hi = nums.size() - 1;
while (lo <= hi) {
int mid = lo + ((hi - lo) / 2); // 防止溢出 等同于(left + right)/2
if (nums[mid] == target) {
return mid;
} else if (nums[mid] > target) {
hi = mid - 1;
} else {
lo = mid + 1;
}
}
return -1;
}
第一个大于等于目标值target的数
int getLeftBorder(vector<int>& nums, int target) {
int lo = 0, hi = nums.size() - 1;
while (lo <= hi) {
int mid = lo + (hi - lo) / 2;
if (nums[mid] >= target) { // ==target 一直往左压缩,直到压缩到不等
hi = mid - 1;
} else if (nums[mid] < target) {
lo = mid + 1;
}
}
return hi + 1; // 因为相等还要执行hi = mid-1,所以需要+1
//return hi + 1 等价于 return lo
//因为 hi+1 是左边界了,所以 hi 是小于target的最后一个数
}
getLeftBorder target = 8
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
LMR
0 1 2 3 4 5
5 7 7 8 8 10
R L
返回时 R 指向的是第一个比 target 小的数字,L/R+1为target第一次出现的位置
最后一个小于等于目标值target的数,
int getRightBorder(vector<int>& nums, int target) {
int lo = 0, hi = nums.size() - 1;
while (lo <= hi) {
int mid = lo + (hi - lo) / 2;
if (nums[mid] > target) {
hi = mid - 1;
} else if (nums[mid] <= target) { // ==target 一直往右压缩,直到压缩到不等
lo = mid + 1;
}
}
return lo - 1; //
return lo; // 因为lo-1 是右边界了, lo-1 + 1 就是第一个大于的数
}
getRightBorder target = 8
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
LMR
0 1 2 3 4 5
5 7 7 8 8 10
R L
返回时 L 指向的是第一个比 target 大的数字,R/L-1为target第一次出现的位置
https://blog.csdn.net/qq_41221520/article/details/108277801
最后一个小于target的数
int binartSearch(vector<int> &nums, int target) {
int mid = 0, lo = 0, hi = nums.size() - 1;
while (left <= right) {
mid = lo + ((hi - lo) / 2);
if (nums[mid] >= target) { // !!!!!! >=
hi = mid - 1;
} else {
lo = mid + 1;
}
}
return hi; // 小于 target 最后一个位置
}
第一个大于target的数
int binartSearch(vector<int> &nums, int target) {
int mid = 0, lo = 0, hi = nums.size() - 1;
while (left <= right) {
mid = lo + ((hi - lo) / 2);
if (nums[mid] > target) { // !!!!!! >
hi = mid - 1;
} else {
lo = mid + 1;
}
}
return lo; // 大于 target 第一个位置
}
这道题目,要在数组中插入目标值,无非是这四种情况。
- 目标值在数组所有元素之前
- 目标值等于数组中某一个元素
- 目标值插入数组中的位置
- 目标值在数组所有元素之后
int searchInsert(vector<int>& nums, int target) {
int n = nums.size();
int left = 0;
int right = n - 1; // 定义target在左闭右闭的区间里,[left, right]
while (left <= right) { // 当left==right,区间[left, right]依然有效
int middle = left + ((right - left) / 2);// 防止溢出 等同于(left + right)/2
if (nums[middle] > target) {
right = middle - 1; // target 在左区间,所以[left, middle - 1]
} else if (nums[middle] < target) {
left = middle + 1; // target 在右区间,所以[middle + 1, right]
} else { // nums[middle] == target
return middle;
}
}
// 分别处理如下四种情况
// 目标值在数组所有元素之前 [0, -1] return right + 1 (right=-1)
// 目标值等于数组中某一个元素 return middle;
// 目标值插入数组中的位置 [left, right],return right + 1
// 目标值在数组所有元素之后的情况 [left, right], return right + 1
return right + 1;
}
寻找target在数组里的左右边界,有如下三种情况:
- 情况一:target 在数组范围的右边或者左边,例如数组{3, 4, 5},target为2或者数组{3, 4, 5},target为6,此时应该返回{-1, -1}
- 情况二:target 在数组范围中,且数组中不存在target,例如数组{3,6,7},target为5,此时应该返回{-1, -1}
- 情况三:target 在数组范围中,且数组中存在target,例如数组{3,6,7},target为6,此时应该返回{1, 1}
先来寻找右边界,确定好:计算出来的右边界是不包含target的右边界,左边界同理。可以写出如下代码
// 二分查找,寻找target的右边界(不包括target)
// 如果rightBorder为没有被赋值(即target在数组范围的左边,例如数组[3,3],target为2),为了处理情况一
int getRightBorder(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
int rightBorder = -2; // 记录一下rightBorder没有被赋值的情况
while (left <= right) { // 当left==right,区间[left, right]依然有效
int middle = left + ((right - left) / 2);
if (nums[middle] > target) {
right = middle - 1; // target 在左区间,所以[left, middle - 1]
} else { // 当nums[middle] == target的时候,更新left,这样才能得到target的右边界
left = middle + 1;
rightBorder = left;
}
}
return rightBorder;
}
// 二分查找,寻找target的左边界leftBorder(不包括target)
// 如果leftBorder没有被赋值(即target在数组范围的右边,例如数组[3,3],target为4),为了处理情况一
int getLeftBorder(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1; // 定义target在左闭右闭的区间里,[left, right]
int leftBorder = -2; // 记录一下leftBorder没有被赋值的情况
while (left <= right) {
int middle = left + ((right - left) / 2);
if (nums[middle] >= target) { // 寻找左边界,就要在nums[middle] == target的时候更新right
right = middle - 1;
leftBorder = right;
} else {
left = middle + 1;
}
}
return leftBorder;
}
左右边界计算完之后,看一下主体代码,这里把上面讨论的三种情况,都覆盖了
class Solution {
public:
vector<int> searchRange(vector<int>& nums, int target) {
int leftBorder = getLeftBorder(nums, target);
int rightBorder = getRightBorder(nums, target);
// 情况一
if (leftBorder == -2 || rightBorder == -2) return {-1, -1};
// 情况三
if (rightBorder - leftBorder > 1) return {leftBorder + 1, rightBorder - 1};
// 情况二
return {-1, -1};
}
private:
int getRightBorder(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1;
int rightBorder = -2; // 记录一下rightBorder没有被赋值的情况
while (left <= right) {
int middle = left + ((right - left) / 2);
if (nums[middle] > target) {
right = middle - 1;
} else { // 寻找右边界,nums[middle] == target的时候更新left
left = middle + 1;
rightBorder = left;
}
}
return rightBorder;
}
int getLeftBorder(vector<int>& nums, int target) {
int left = 0;
int right = nums.size() - 1;
int leftBorder = -2; // 记录一下leftBorder没有被赋值的情况
while (left <= right) {
int middle = left + ((right - left) / 2);
if (nums[middle] >= target) { // 寻找左边界,nums[middle] == target的时候更新right
right = middle - 1;
leftBorder = right;
} else {
left = middle + 1;
}
}
return leftBorder;
}
};
初学者建议大家一块一块的去分拆这道题目,正如本题解描述,想清楚三种情况之后,先专注于寻找右区间,然后专注于寻找左区间,左右根据左右区间做最后判断。
int getLeftBorder(vector<int>& nums, int target) {
int lo = 0, hi = nums.size() - 1;
while (lo <= hi) {
int mid = lo + (hi - lo) / 2;
if (nums[mid] >= target) {
hi = mid - 1;
} else if (nums[mid] < target) {
lo = mid + 1;
}
}
return hi + 1;
}
int getRightBorder(vector<int>& nums, int target) {
int lo = 0, hi = nums.size() - 1;
while (lo <= hi) {
int mid = lo + (hi - lo) / 2;
if (nums[mid] > target) {
hi = mid - 1;
} else if (nums[mid] <= target) { // ==target 一直往右压缩,直到压缩到
lo = mid + 1;
}
}
return lo - 1;
}
getLeftBorder target = 8
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
LMR
0 1 2 3 4 5
5 7 7 8 8 10
R L
返回时 R 指向的是第一个比 target 小的数字,R+1为target第一次出现的位置
getRightBorder target = 8
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
L M R
0 1 2 3 4 5
5 7 7 8 8 10
LMR
0 1 2 3 4 5
5 7 7 8 8 10
R L
返回时 L 指向的是第一个比 target 大的数字,R/L-1为target第一次出现的位置
二分查找第一个 res^2 大于x的元素,然后再减一
通过不断猜测一个数字的平方 == x ? 然后不断修正这个数字
int mySqrt(int x) {
int left = 1;
int right = x;
int mid;
while (left <= right) {
mid = left + (right - left) / 2;
if (pow(mid, 2) > x) {
right = mid - 1;
} else {
left = mid + 1;
}
}
return left - 1;
}
bool isPerfectSquare(int num) {
if (num == 1) return true;
if (num == 2 | num == 3) return false;
int left = 0;
int right = num / 2;
int mid;
while (left <= right) {
mid = left + (right - left) / 2;
if (pow(mid, 2) > num) {
right = mid - 1;
} else if (pow(mid, 2) < num) {
left = mid + 1;
} else {
return true;
}
}
return false;
}
最长公共前缀的长度不会超过字符串数组中的最短字符串的长度。用
连续数组
min 表示数组 nums 的最小值,max 表示数组 nums 的最大值。最大平均字段和 一定在最大值与最小值之间,即区间 (min, max) 之间。
因为值全是max的时候,平均数是max;全是min的时候,平均数是min
二分思想是:通过不断猜测最大平均值,再通过验证更新猜测值,使每次猜测更加接近正确值。
- 如果猜测值太大,下一次猜一个更小的值
- 如果猜测值太小,下一次猜一个更大的值
以 max 和 min 作为猜测边界,每次猜测值为 mid = min + (max - min) /2。接下来寻找是否存在长度 >= k 的连续子数组的平均值大于 mid。
假设在数组 num 中存在一个长度为 j 的子数组,它的元素为
-
$(a_1+a_2+ a_3...+a_j)/j \geq mid$ 或 -
$(a_1+a_2+ a_3...+a_j) \geq j*mid$ 或 $(a_1-mid) +(a_2-mid)+ (a_3-mid) ...+(a_j-mid) \geq 0$
数组中每个元素都减去 mid 后,如果存在长度 >= k 的子数组之和 >= 0,则表明数组 nums 中存在子数组的平均和 >= mid,此时令猜测区间的下边界为 mid;否则令猜测区间的上边界为 mid,然后继续该过程
在遍历数组 nums 时,将 nums[i] - mid 加到 sum[i] 上。如果 sum[k] >= 0,则直接令猜测区间的下界变为 mid。否则,按照下面思路不断求 nums 的前 i 项之和。
数组的前 j 项之和分别为
使用 prev
变量存储从第 k 个位置开始的累加和。然后记录 prev
中出现过的最小值,即最小和。
每次寻找到一个新的 mid 后,都将它作为猜测区间的上边界或下边界,以不断缩小猜测范围。为了保证精度,使用 error
保证区间宽度小于 10-5
时,结束猜测。
bool check(vector<int>& nums, double mid, int k) {
int n = nums.size();
vector<double> preSum(n + 1, 0);
for (int i = 1; i <= n; ++i) {
preSum[i] = preSum[i - 1] + nums[i - 1] - mid;
}
double preMin = preSum[0];
for (int i = k; i <= n; ++i) {
preMin = min(preMin, preSum[i - k]); // 每次更新 preMin 最小值
if (preSum[i] - preMin >= 0) return true;
}
return false;
}
double findMaxAverage(vector<int>& nums, int k) {
int n = nums.size();
double maxV = *max_element(nums.begin(), nums.end());
double minV = *min_element(nums.begin(), nums.end());
while ((maxV - minV) > 1e-5) {
double mid = minV + (maxV - minV) / 2;
if (check(nums, mid, k)) {
minV = mid;
} else {
maxV = mid;
}
}
return maxV;
}
实现 Check函数,就是前缀和的计算,即通过 目前和 - 前缀和 获取当前范围和。
特别要注意的是:条件是说 大于等于 k, 所以我们前缀和的计算数组的大小是 0 到 n-k
前缀和add,维护ij,addj-minAddi来求平均数,不需要固定i,只需要维护历史上最小的addi,也就是只需要固定j
bool check(vector<int>& nums, double mid, int k) {
int n = nums.size();
vector<double> preSum(n + 1, 0);
for (int i = 1; i <= n; ++i) {
preSum[i] = preSum[i-1] + nums[i-1] - mid;
}
for (int i = k; i <= n; ++i) {
if (preSum[i] - preSum[i-k] >= 0) return true;
}
return false;
}
double findMaxAverage(vector<int>& nums, int k) {
int n = nums.size();
double maxV = *max_element(nums.begin(), nums.end());
double minV = *min_element(nums.begin(), nums.end());
while (maxV - minV > 1e-5) {
double mid = minV + (maxV - minV) / 2;
if (check(nums, mid, k)) {
minV = mid;
} else { // 不满足说明值太大,所以maxV变小为mid
maxV = mid;
}
}
return minV;
}
int minSubArrayLen(int target, vector<int>& nums) {
int n = nums.size();
vector<int> preSum(n + 1, 0);
for (int i = 0; i < n; ++i) {
preSum[i+1] = preSum[i] + nums[i];
}
int res = INT_MAX;
for (int i = 1; i <= n; ++i) {
int lo = 0, hi = i;
while (lo <= hi) {
int mid = lo + (hi - lo) / 2;
if (preSum[i] - preSum[mid] >= target) {
res = min(res, i - mid);
lo = mid + 1;
} else {
hi = mid - 1;
}
}
}
return res == INT_MAX ? 0 : res;
}
优化一下
int minSubArrayLen(int target, vector<int>& nums) {
int n = nums.size();
vector<int> preSum(n + 1, 0);
for (int i = 0; i < n; ++i) {
preSum[i+1] = preSum[i] + nums[i];
}
int res = INT_MAX;
for (int i = 0; i <= n; ++i) {
int findT = preSum[i] + target;
auto bound = lower_bound(preSum.begin(), preSum.end(), findT);
if (bound != preSum.end()) { //如果存在
int nLen = static_cast<int>((bound - preSum.begin()) - i); // 第一个比findT大的数到i的位置
res = min(res, nLen);
}
}
return res == INT_MAX ? 0 : res;
}
int findClosest(vector<string>& words, string word1, string word2) {
vector<int> w1, w2;
for (int i = 0; i < words.size(); ++i) {
if (words[i] == word1) w1.push_back(i);
if (words[i] == word2) w2.push_back(i);
}
int res = 0x3f3f3f3f;
for (int i = 0; i < w2.size(); ++i) { // 对每个w2里的元素 在w1里找与其插值最小的下标
auto first = lower_bound(w1.begin(), w1.end(), w2[i]);
int dis = distance(w1.begin(), first);
//如果为空,则局部最小值是与w1最后一个元素的差值
if (first == w1.end()) res = min(res, abs(w2[i] - w1[w1.size()-1]));
else {
res = min(res, abs(w2[i] - w1[dis]));
// 如果dis不是w1首元素,则局部最小值可能是dis,也可能是dis-1
if (dis != 0) res = min(res, abs(w2[i] - w1[dis-1]));
}
}
return res;
}
O(NlogN)
发现 dis-1 跟 w1.size()-1 可以优化一下
int findClosest(vector<string>& words, string word1, string word2) {
vector<int> w1, w2;
for (int i = 0; i < words.size(); ++i) {
if (words[i] == word1) w1.push_back(i);
if (words[i] == word2) w2.push_back(i);
}
int res = 0x3f3f3f3f;
for (int i = 0; i < w2.size(); ++i) { // 对每个w2里的元素 在w1里找与其插值最小的下标
auto first = lower_bound(w1.begin(), w1.end(), w2[i]);
int dis = distance(w1.begin(), first);
//如果为空,则局部最小值是与w1最后一个元素的差值
if (first != w1.end()) res = min(res, abs(w2[i] - w1[dis]));
if (dis != 0) res = min(res, abs(w2[i] - w1[dis-1]));
}
return res;
}
但事实是反向优化
先将数组 nums 从小到大进行排序。因为第 k 小的数对距离必然在区间 [0, max (nums) - min(nums)] 内,令 left=0,right=max(nums)−min(nums),我们在区间 [left,right] 上进行二分。
对于当前搜索的距离 mid,计算所有距离小于等于 mid 的数对数目 cnt,如果
给定距离 mid,计算所有距离小于等于 mid 的数对数目 cnt 可以使用二分查找:枚举所有数对的右端点 j,二分查找大于等于 nums[j]−mid 的最小值的下标 i,那么右端点为 j 且距离小于等于 mid 的数对数目为 j−i,计算这些数目之和。
class Solution {
public:
int getCnt(vector<int>& nums, int mid) {
int cnt = 0;
for (int j = 0; j < nums.size(); j++) { // 枚举所有数对的右端点 j
int i = lower_bound(nums.begin(), nums.begin() + j, nums[j] - mid) - nums.begin(); // 查找大于等于 nums[j]−mid 的最小值的下标 i
cnt += j - i; // 那么右端点为 j 且距离小于等于 mid 的数对数目为 j−i
}
return cnt;
}
int smallestDistancePair(vector<int>& nums, int k) {
sort(nums.begin(), nums.end());
int maxn = *max_element(nums.begin(), nums.end());
int minn = *min_element(nums.begin(), nums.end());
int left = 0, right = maxn - minn;
while (left <= right) {
int mid = left + (right - left) / 2;
int cnt = getCnt(nums, mid);
if (cnt >= k) {
right = mid - 1;
} else if (cnt < k) {
left = mid + 1;
}
}
return left;
}
};
int findPairs(vector<int>& nums, int k) {
/*负数映射到正数区间*/
int minn = *min_element(nums.begin(), nums.end());
if (minn < 0) {
for (auto &n : nums) {
n += abs(minn);
}
}
sort(nums.begin(), nums.end());
/* k == 0 用 hashmap */
if (k == 0) {
unordered_map<int, int> ump;
for (int i = 1; i < nums.size(); ++i) {
if (ump.count(nums[i]) == 0) {
if (nums[i] == nums[i-1]) ump[nums[i]] = 1;
}
}
return ump.size();
}
/*k != 0 用二分找*/
nums.erase(unique(nums.begin(), nums.end()), nums.end());
int cnt = 0;
for (int j = 1; j < nums.size(); ++j) {
auto find = lower_bound(nums.begin(), nums.end(), nums[j] - k);
if (find != nums.end()) {
int idx = find - nums.begin();
if (nums[idx] == nums[j] - k) cnt++;
}
}
return cnt;
}
根据中位数的定义,当 m+n 是奇数时,中位数是两个有序数组中的第 (m+n)/2 个元素,当 m+n 是偶数时,中位数是两个有序数组中的第 (m+n)/2 个元素和第 (m+n)/2+1 个元素的平均值。
因此,这道题可以转化成寻找两个有序数组中的第 k 小的数,其中 k 为 (m+n)/2 或 (m+n)/2+1。
假设两个有序数组分别是 A 和 B。要找到第 k 个元素,我们可以比较 A[k/2−1] 和 B[k/2−1],其中 / 表示整数除法。
由于A[k/2−1] 和 B[k/2−1] 的前面分别有 A[0..k/2−2] 和 B[0..k/2−2],即 k/2−1 个元素,对于 A[k/2−1] 和 B[k/2−1] 中的较小值,最多只会有 (k/2−1)+(k/2−1)≤k−2 个元素比它小,那么它就不能是第 k 小的数了。
因此我们可以归纳出三种情况:
-
如果
$A[k/2−1]<B[k/2−1]$ ,则比 A[k/2−1] 小的数最多只有 A 的前 k/2−1 个数和 B 的前 k/2−1 个数,即比 A[k/2−1] 小的数最多只有 k−2 个,因此 A[k/2−1] 不可能是第 k 个数,A[0] 到 A[k/2−1] 也都不可能是第 k 个数,可以全部排除。 -
如果
$A[k/2−1]>B[k/2−1]$ ,同理可以排除 B[0] 到 B[k/2−1]。 -
如果
$A[k/2−1]=B[k/2−1]$ ,则可以归入第一种情况处理。
可以看到,比较 A[k/2−1] 和 B[k/2−1] 之后,可以排除 k/2 个不可能是第 k 小的数,查找范围缩小了一半。同时,我们将在排除后的新数组上继续进行二分查找,并且根据我们排除数的个数,减少 k 的值,这是因为我们排除的数都不大于第 k 小的数。
有以下三种情况需要特殊处理:
-
如果 A[k/2−1] 或者 \text{B}[k/2-1]B[k/2−1] 越界,那么我们可以选取对应数组中的最后一个元素。在这种情况下,我们必须根据排除数的个数减少 kk 的值,而不能直接将 kk 减去 k/2k/2。
-
如果一个数组为空,说明该数组中的所有元素都被排除,我们可以直接返回另一个数组中第 kk 小的元素。
-
如果 k=1,我们只要返回两个数组首元素的最小值即可。
class Solution {
public:
int getKthElement(const vector<int>& nums1, const vector<int>& nums2, int k) {
/* 主要思路:要找到第 k (k>1) 小的元素,那么就取 pivot1 = nums1[k/2-1] 和 pivot2 = nums2[k/2-1] 进行比较
* 这里的 "/" 表示整除
* nums1 中小于等于 pivot1 的元素有 nums1[0 .. k/2-2] 共计 k/2-1 个
* nums2 中小于等于 pivot2 的元素有 nums2[0 .. k/2-2] 共计 k/2-1 个
* 取 pivot = min(pivot1, pivot2),两个数组中小于等于 pivot 的元素共计不会超过 (k/2-1) + (k/2-1) <= k-2 个
* 这样 pivot 本身最大也只能是第 k-1 小的元素
* 如果 pivot = pivot1,那么 nums1[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums1 数组
* 如果 pivot = pivot2,那么 nums2[0 .. k/2-1] 都不可能是第 k 小的元素。把这些元素全部 "删除",剩下的作为新的 nums2 数组
* 由于我们 "删除" 了一些元素(这些元素都比第 k 小的元素要小),因此需要修改 k 的值,减去删除的数的个数
*/
int m = nums1.size();
int n = nums2.size();
int index1 = 0, index2 = 0;
while (true) {
// 边界情况
if (index1 == m) {
return nums2[index2 + k - 1];
}
if (index2 == n) {
return nums1[index1 + k - 1];
}
if (k == 1) {
return min(nums1[index1], nums2[index2]);
}
// 正常情况
int newIndex1 = min(index1 + k / 2 - 1, m - 1);
int newIndex2 = min(index2 + k / 2 - 1, n - 1);
int pivot1 = nums1[newIndex1];
int pivot2 = nums2[newIndex2];
if (pivot1 <= pivot2) {
k -= newIndex1 - index1 + 1;
index1 = newIndex1 + 1;
}
else {
k -= newIndex2 - index2 + 1;
index2 = newIndex2 + 1;
}
}
}
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int totalLength = nums1.size() + nums2.size();
if (totalLength % 2 == 1) {
return getKthElement(nums1, nums2, (totalLength + 1) / 2);
}
else {
return (getKthElement(nums1, nums2, totalLength / 2) + getKthElement(nums1, nums2, totalLength / 2 + 1)) / 2.0;
}
}
};
作者:LeetCode-Solution
链接:https://leetcode.cn/problems/median-of-two-sorted-arrays/solution/xun-zhao-liang-ge-you-xu-shu-zu-de-zhong-wei-s-114/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
https://blog.csdn.net/flushhip/article/details/79416715
题目
为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜好值为 k。因为一些特殊的原因,不会出现一个查询的用户区间完全覆盖另一个查询的用户区间(不存在L1<=L2<=R2<=R1)。
输入
第 1 行为 n 代表用户的个数
第 2 行为 n 个整数,第 i 个代表用户标号为 i 的用户对某类文章的喜好度
第3行为一个正整数 q 代表查询的组数,
第4行到第(3+q)行,每行包含3个整数 l,r,k 代表一组查询,即标号为 l<=i<=r 的用户中对这类文章喜好值为 k 的用户的个数。 数据范围 n<=3e5, q<=3e5,k是整型。
输出
一共
q
行,每行一个整数代表喜好值为k
的用户的个数。
样例输入:
5
1 2 3 3 5
3
1 2 1
2 4 5
3 5 3
样例输出:
1
0
2
数据很大,询问 300000 次,那么每次询问对应的操作的时间复杂度必须是 O(1) 或 O(logn) ;
这就为我们思考算法提供了方向,O(1) 显然是不可能的,那么操作的时间复杂度为 O(logn) 的算法只能是二分查找了
二分的要求是序列有序,因此不管那么多,先排序,可是按照什么东西来排序呢?由于题目要求在一个时间范围内喜好为 k 的有多少人,那么可以把相同 k 值的人放到一起形成一个子序列,然后再根据时间的范围在这个子序列中查找,因此用结构体的二级排序,先按 k 值的大小升序排序,如果 k 值相同,再按时间顺序升序排序;
bool sort_cmp (const pair<int, int> &A, const pair<int, int> &B)
{
if (A.first == B.first)
return A.second < B.second;
return A.first < B.first;
}
这样的二级排序是稳定排序,故排序后整个序列是k
值升序的,各个子序列中的时间也是升序的。
排好序后,就是查找的过程,先用equal_range找到序列中k值为目标k值的子序列,然后用lower_bound与upper_bound在子序列中找到目标时间范围内的最长子序列(用lower_bound找到第一个大于或等于左端点的位置,用upper_bound找到最后一个小于或等于右端点的位置),比如目标时间范围是[3, 7],那么假设最大子序列为[4, 5],[4,5]⊂[3,7][4,5]⊂[3,7],答案就是最长子序列的长度。
#include <bits/stdc++.h>
using namespace std;
bool sort_cmp(const pair<int, int> &A, const pair<int, int> &B)
{
return A.first == B.first ? A.second < B.second :
A.first < B.first;
}
struct find_first_cmp {
bool operator()(const pair<int, int> &P, int k) const
{
return P.first < k;
}
bool operator()(int k, const pair<int, int> &P) const
{
return k < P.first;
}
};
struct find_second_cmp {
bool operator()(const pair<int, int> &P, int k) const
{
return P.second < k;
}
bool operator()(int k, const pair<int, int> &P) const
{
return k < P.second;
}
};
int main()
{
int n, q;
while (EOF != scanf("%d", &n)) {
vector<pair<int, int> > arr;
for (int i = 0, x; i < n; cin >> x, arr.emplace_back(x, ++i)) {}
sort(arr.begin(), arr.end(), sort_cmp);
for (scanf("%d", &q); q--;) {
int L, R, k;
scanf("%d%d%d", &L, &R, &k);
pair<vector<pair<int, int> >::iterator, vector<pair<int, int> >::iterator> sd =
equal_range(arr.begin(), arr.end(), k, find_first_cmp{});
printf("%d\n", upper_bound(sd.first, sd.second, R, find_second_cmp{}) -
lower_bound(sd.first, sd.second, L, find_second_cmp{}));
}
}
return 0;
}