题目:统计一个数字在排序数组中出现的次数。例如输入排序数组{1,2,3,3,3,3,4,5}和数字3,由于3在这个数组中出现了4次,因此输出4。
既然输入的数组是排序的,那么我们很自然地就能想到用二分查找算法。在题目给出的例子中,我们可以先用二分查找算法找到一个3。由于3可能出现多次,因此我们找到的3的左右两边可能都有3,于是我们在找到的3的左右两边顺序扫描,分别找出第一个3和最后一个3。因为要查找的数字在长度为n的数组中有可能出现O(n)次,所以顺序扫描的时间复杂度是O(n)。因此这种算法的效率和直接从头到尾顺序扫描整个数组统计3出现的次数的方法是一样的。
接下来我们思考如何更好地利用二分查找算法。假设我们是统计数字k在排序数组中出现的次数。在前面的算法中时间主要消耗在如何确定重复出现的数字的第一个k和最后一个k的位置上,有没有可能用二分查找算法直接找到第一个k及最后一个k呢?
我们先分析如何用二分查找算法在数组中找到第一个k。二分查找算法总是先拿数组中间的数字和k作比较。如果中间的数字比k大,那么k只有可能出现在数组的前半段,下一轮我们只在数组的前半段查找就可以了。如果中间的数字比k小,那么k只有可能出现在数组的后半段,下一轮我们只在数组的后半段查找就可以了。如果中间的数字和k相等呢?我们先判断这个数字是不是第一个k。如果位于中间数字的前面一个数字不是k,此时中间的数字刚好就是第一个k。如果中间数字的前面一个数字也是k,也就是说第一个k肯定在数组的前半段,下一轮我们仍然需要在数组的前半段查找。
(1)GetFirstK:找到数组中第一个k的下标。如果数组中不存在k,返回-1
private static int GetFirstK(int[] data, int k, int start, int end)
{
if (start > end)
{
return -1;
}
int middIndex = (start + end) / 2;
int middData = data[middIndex];
if (middData == k)
{
if ((middIndex > 0 && data[middIndex - 1] != k) || middIndex == 0)
{
return middIndex;
}
else
{
end = middIndex - 1;
}
}
else if (middData > k)
{
end = middIndex - 1;
}
else
{
start = middIndex + 1;
}
return GetFirstK(data, k, start, end);
}
(2)GetLastK:找到数组中最后一个k的下标。如果数组中不存在k,返回-1
private static int GetLastK(int[] data, int k, int start, int end)
{
if (start > end)
{
return -1;
}
int middIndex = (start + end) / 2;
int middData = data[middIndex];
if (middData == k)
{
if ((middIndex < data.Length - 1 && data[middIndex + 1] != k) || middIndex == end)
{
return middIndex;
}
else
{
start = middIndex + 1;
}
}
else if (middData > k)
{
end = middIndex - 1;
}
else
{
start = middIndex + 1;
}
return GetLastK(data, k, start, end);
}
(3)GetNumberOfK:找到数组中第一个和最后一个k的下标进行减法运算得到最终结果
public static int GetNumberOfK(int[] data, int k)
{
int number = 0;
if (data != null && data.Length > 0)
{
int first = GetFirstK(data, k, 0, data.Length - 1);
int last = GetLastK(data, k, 0, data.Length - 1);
if (first > -1 && last > -1)
{
number = last - first + 1;
}
}
return number;
}
// 查找的数字出现在数组的中间
[TestMethod]
public void GetNumberTest1()
{
int[] data = { 1, 2, 3, 3, 3, 3, 4, 5 };
int actual = NumberOfKHelper.GetNumberOfK(data, 3);
Assert.AreEqual(actual, 4);
}
// 查找的数组出现在数组的开头
[TestMethod]
public void GetNumberTest2()
{
int[] data = { 3, 3, 3, 3, 4, 5 };
int actual = NumberOfKHelper.GetNumberOfK(data, 3);
Assert.AreEqual(actual, 4);
}
// 查找的数组出现在数组的结尾
[TestMethod]
public void GetNumberTest3()
{
int[] data = { 1, 2, 3, 3, 3, 3 };
int actual = NumberOfKHelper.GetNumberOfK(data, 3);
Assert.AreEqual(actual, 4);
}
// 查找的数字不存在
[TestMethod]
public void GetNumberTest4()
{
int[] data = { 1, 3, 3, 3, 3, 4, 5 };
int actual = NumberOfKHelper.GetNumberOfK(data, 2);
Assert.AreEqual(actual, 0);
}
// 查找的数字比第一个数字还小,不存在
[TestMethod]
public void GetNumberTest5()
{
int[] data = { 1, 3, 3, 3, 3, 4, 5 };
int actual = NumberOfKHelper.GetNumberOfK(data, 0);
Assert.AreEqual(actual, 0);
}
// 查找的数字比最后一个数字还大,不存在
[TestMethod]
public void GetNumberTest6()
{
int[] data = { 1, 3, 3, 3, 3, 4, 5 };
int actual = NumberOfKHelper.GetNumberOfK(data, 6);
Assert.AreEqual(actual, 0);
}
// 数组中的数字从头到尾都是查找的数字
[TestMethod]
public void GetNumberTest7()
{
int[] data = { 3, 3, 3, 3 };
int actual = NumberOfKHelper.GetNumberOfK(data, 3);
Assert.AreEqual(actual, 4);
}
// 数组中的数字从头到尾只有一个重复的数字,不是查找的数字
[TestMethod]
public void GetNumberTest8()
{
int[] data = { 3, 3, 3, 3 };
int actual = NumberOfKHelper.GetNumberOfK(data, 4);
Assert.AreEqual(actual, 0);
}
// 数组中只有一个数字,是查找的数字
[TestMethod]
public void GetNumberTest9()
{
int[] data = { 3 };
int actual = NumberOfKHelper.GetNumberOfK(data, 3);
Assert.AreEqual(actual, 1);
}
// 数组中只有一个数字,不是查找的数字
[TestMethod]
public void GetNumberTest10()
{
int[] data = { 3 };
int actual = NumberOfKHelper.GetNumberOfK(data, 2);
Assert.AreEqual(actual, 0);
}
// 鲁棒性测试,数组空指针
[TestMethod]
public void GetNumberTest11()
{
int actual = NumberOfKHelper.GetNumberOfK(null, 0);
Assert.AreEqual(actual, 0);
}
(1)测试通过情况
(2)代码覆盖率
作者:周旭龙
出处:http://edisonchou.cnblogs.com
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文链接。