人工智能席卷全球,大语言模型(LLM)因其多样的功能而广受欢迎。ChatGPT 就是一个典型的人工智能模型,此外还有来自中国的 DeepSeek 等具有创新性的新模型。但如今,印度似乎也想凭借自己的人工智能模型与之竞争,该模型最早可能在今年问世。
在近期的一场人工智能活动中,印度电子与信息技术部部长阿什维尼・瓦伊什瑙表示,印度正在研发本国的基础人工智能模型。这位部长进一步补充说,该模型的功能将与 DeepSeek 和 ChatGPT 类似,但开发成本更为亲民。这位政府官员称,这款新的人工智能模型可能在 8 到 10 个月内就能完成。
在印度人工智能使命组织举办的活动中,阿什维尼・瓦伊什瑙透露,印度的研究人员一直在开发一个人工智能生态系统框架,以支持本国的基础人工智能模型。开发该模型旨在为印度用户提供量身定制的体验。它还将理解印度用户的语言和语境需求,在消除偏见的同时实现包容性。
这位电子与信息技术部部长还谈到了印度的计算能力,因为这款国产人工智能模型是利用拥有 18693 块 GPU 的计算设备开发的。值得一提的是,ChatGPT 是使用约 25000 块 GPU 进行训练的,而 DeepSeek 则是用 2000 块 GPU 训练的。
像 ChatGPT 这样典型的热门人工智能模型,使用一小时的成本约为 3 美元,而由于政府补贴,印度的人工智能模型使用一小时可能只需 100 卢比(约合 1.15 美元)。这条消息发布之前,加州大学伯克利分校的研究人员仅用 30 美元就成功复现了 DeepSeek 人工智能。
领取专属 10元无门槛券
私享最新 技术干货