首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【五号雷达-数据快讯】ChemData - 大规模高质量化学语言微调数据集

ChemData是上海人工智能实验室等机构联合构建的大规模数据集,旨在为化学语言模型的微调提供支持,从而提高、释放其全部化学潜力。该数据集包含了7,000,000条用于指令微调的问答对,同时覆盖了广泛的化学领域专业知识,主要面向三种化学任务类型:分子(Molecules)、反应(Reactions)以及其它特定领域(Domain-specific)任务。研究团队从大量的知名在线数据库中收集了海量化学数据,这其中包括了PubChem、ChEMBL、ChEBI、ZINC、USPTO、ORDerly、ChemXiv、LibreTexts Chemistry、Wikipedia和Wikidata等等。ChemData为增强化学语言模型的能力、推动化学研究和创新带来突破性进展提供了丰富多样且高质量的数据。

详情请参见五号雷达:https://www.5radar.com/result?key=ChemData

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OFzrqKZUnUe-xSj5YK3PTdBw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券