首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2023中关村论坛|基于大语言模型+向量数据库的文献知识库Science Navigator V1.0发布

北京商报讯(记者 魏蔚)5月30日,在2023中关村论坛的人工智能驱动的科学研究论坛上,北京科学智能研究院、中国科学院计算机网络信息中心、墨奇科技(北京)有限公司联合发布了款基于大模型+向量检索引擎的文献知识库Science Navigator V1.0。

根据美国国家科学基金会统计数据,科研人员花费在查找和消化科技资料上的时间,需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。科研检索方式经历了眼查手翻的查阅式检索、基于互联网的搜索式检索阶段,将进入对话式检索阶段。

“但通过对话式大语言模型检索是有局限性的,比如幻觉与偏见、数据滞后、缓存限制”,墨奇科技副总裁孟卓飞总结,基于这些痛点,墨奇科技等提出大语言模型+向量数据库=下一代文献知识库的概念,整个知识库包括,以科研人员为代表的用户层、以GPT4等为代表的模型层、由向量数据库+搜索引擎组成的中间层、由文献和教材等支撑的数据层。北京科学智能研究院、墨奇科技、中国科学院计算机网络信息中心分别负责模型层、中间层、数据层。

据孟卓飞介绍,Science Navigator V1.0支持文本、图片、表格、公式跨模态识别处理,科研人员可选用文心一言、LLM等各种大小模型,实现问题解析最佳效果,第一批已收录化学、材料、AI等领域近百万篇论文,未来将扩展至自然、人文学科亿级文献存储。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230530A06PL600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券