2018 蓝桥杯 日志统计 尺取法

这是2018年蓝桥杯C语言省赛B组的第八题

题目描述
小明维护着一个程序员论坛。现在他收集了一份”点赞”日志,日志共有N行。
其中每一行的格式是:ts id。表示在ts时刻编号id的帖子收到一个”赞”。
现在小明想统计有哪些帖子曾经是”热帖”。
如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞,小明就认为这个帖子曾是”热帖”。
具体来说,如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个赞,该帖就曾是”热帖”。
给定日志,请你帮助小明统计出所有曾是”热帖”的帖子编号。

输入
第一行包含三个整数N、D和K。
以下N行每行一条日志,包含两个整数ts和id。
1 <= K <= N <= 100000 0 <= ts <= 100000 0 <= id <= 100000

输出
按从小到大的顺序输出热帖id。每个id一行。

样例输入
7 10 2
0 1
0 10
10 10
10 1
9 1
100 3
100 3

样例输出
1
3

OJ链接

思路:我的思路是一个二维数组储存每个id的点赞时间,即maps[id][]=ts。然后根据maps数组对每个id运用尺取法进行条件判定,如果符合要求就是答案。
为了减少对数组的搜索,我引入了一个set用来储存出现过的id号,然后对出现过的id号关联的数组进行查询即可。

尺取法: 我认为就是在一个连续的集合里,设定一个子集的首位位置和末尾位置,然后不断的推进首尾位置,寻找符合条件的子集。因为这题要计算相差的时间,所以数据必须是有序的,所以下面的代码中我使用了sort对maps数组进行排序。

AC代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
#include <bits/stdc++.h>
using namespace std;

vector<int>maps[100001]; //二维数组储存每个节点的被点赞的时间 maps[x][0]就是x号帖子第一次被点赞的时间
set<int>alls; //储存出现的帖子编号 与maps配合 避免不必要的查询 直接maps[alls][]就行

int main()
{
int n,d,k,ts,id;
scanf("%d %d %d",&n,&d,&k);

while(n--)
{
scanf("%d %d",&ts,&id);
alls.insert(id); //储存出现的id号
maps[id].push_back(ts); //将点赞时间储存至maps[id][]
}

for(set<int>::iterator iter=alls.begin();iter!=alls.end();iter++) //对整个maps[alls][]数组进行排序 方便后面的时间统计
{
sort(maps[*iter].begin(),maps[*iter].end()); //对有数据的数组进行排序 即 maps[alls][]
}

for(set<int>::iterator iter=alls.begin();iter!=alls.end();iter++) //对有数据的maps数组进行查找
{
int all=0,first=0,end=0; //点赞数量 第一个赞的位置 最后一个赞的位置
while(1) //尺取法
{
while(all<k&&end<maps[*iter].size()) //点赞数小于要求 && 数组里的数据还没有统计完
{
all++;
end++;
}
if(all<k) //统计完了 赞也不够
break;
if(maps[*iter][end-1]-maps[*iter][first]<d) //赞够 并且 第一个赞和末尾赞的时间相隔符合要求
{
printf("%d\n",*iter); //由于set有序 所以直接输出即可
break;
}
all--;
first++;
}
}

return 0;
}