我有一个清单:
List<Student> allStudents = new List<Student>(); 包含超过94,000个学生对象,其中学生被定义为:
public class Student
{
public Int32 ID { get; set; }
public String Surname { get; set; }
public String Other_Names { get; set; }
public String DOB { get; set; }
// remaining fields omitted
}并按姓氏排序。
在从另一个源抓取了一个学生对象之后,我想对列表allStudents进行二进制搜索,以仅基于姓氏属性来查找匹配项。例如,如果列表allStudents中的现有记录为:
Student(8139241, "Flintstone", "Fred", "12/1/1967")然后我搜索这个项目:
Student(7294311, "Flintstone", "Wilma", "14/6/1969")二进制搜索应该是成功的。
List.BinarySearch(T,IComparer)过载似乎是一种可能性,但它是一个可行的解决方案吗?还是有更好的策略?我将处理大量的记录和搜索,因此O(n)搜索功能将不可行。
提前感谢!
更新:我已经决定用Wintellect PowerCollections库中的MultiDictionary替换我的列表。此MultiDictionary可以接受重复的密钥。
发布于 2011-06-27 12:53:22
有了这么多条目,您可能会更好地使用Dictionary<string, Student>查找,它将被摊销为O(1)。虽然可能有多个学生使用相同的姓氏,因此应该是类似于Dictionary<string, List<Student>>
同样,正如Amit指出的那样,当存在重复项时使用二进制搜索可能会很棘手,因为您不知道在重复项序列中将获得哪个索引。您必须在返回的索引的左侧和右侧进行搜索,以查看是否存在其他匹配的姓氏。
https://stackoverflow.com/questions/6488201
复制相似问题