当许多生物体之基因序列被快速解析后(特别是人类基因定序计划已于2003 年完成发表),生物学研究已近入后基因时代。生物相关学家的下一个主流研究目标将是探究基因序列中各基因所携带之功能为何?如何表现其功能?又扮演何种角色?因此,以基因序列讯息数据库为研究基础的生物信息学随之开始蓬勃发展与应用,包括基因体学(Genomics)及蛋白质体学(Proteomics)。其中蛋白质因被认为是真正执行功能的物质,若以蛋白质层次即可讨论生命全体之现象,包括特定之细胞、组织、脏器等中的基因经转录及转译产生全部蛋白质,因此蛋白质体学被认为是探讨基因体学最终目标,透过蛋白质体学研究可以了解基因表现、疾病诊断、及新药开发等,而倍获重视。
蛋白质体学之研究可说是继基因体学后,生物医学研究必然要走的道路。在新药开发上,蛋白质体学技术无疑开拓了一条快速筛选药物之快捷方式。藉由蛋白质体技术于药物开发上之应用,研究人员可直接找出与疾病相关之蛋白质分子,针对其标的设计可能之药物结构,并透过仿真分析调整药物结构配合结构性蛋白质体学已决定该药物之空间结构,以H1N1药物开发为例,国网中心即是以模拟分析方式,建立出用于抑制H1N1药物与蛋白质受体之模型[2],将可有效缩短新药开发之时程。除以模拟方式去研究蛋白质外,也有研究单位以实验的角度对蛋白质特性进行研究,以国家卫生研究院为例,即是以实验方式对蛋白质表现量与状态进行高通量分析[3]。然而,高通量分析亦伴随着大数据量之产生,因此不论是以模拟方法或实验方法来进行蛋白质研究,巨量数据储存与高速计算分析需求都伴随而生。
虽然人类的基因体约有五万个基因,但这些基因能够制造出之蛋白质数量超过五十万,加上蛋白质体学研究不像基因定序般仅以单一技术可以完成,因此蛋白质体学研究是非常仰仗数据库大量数据存取与计算机分析计算能力,才可使质谱数据可快速且准确地鉴定蛋白质身分与结构。因此,在目前学术界及生技产业界最热门的研究发展方向上,国网中心因拥有高效能超级计算机而同时具备有储存与计算之优势。未来在此议题上,国网中心除可运用大量数据存取与计算机高速计算能力,提供必要之硬设备与软件技术等相关支持外,同时也可以药物于蛋白质受体之模拟分析经验,建立高效率与高准确性之分析平台,以期未来有机会在此新兴研究领域中扮演领头羊的角色。