首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

原创 | 利用BERT 训练推特上COVID-19数据

模型基于BERT-LARGE (英文,不区分大小写,全字屏蔽)模型。BERT-LARGE主要用于训练英文维基百科(3.5B字)和免费书籍语料库(0.8B字)等大型的原始文本数据集,虽然这些数据集中包含了海量的数据,但是它却没有包含特殊子领域的相关信息,在一些特定的专业领域,已经有了利用transformer模型训练特殊专业领域的预料库的相关案例,如BIOBERT和SCIBERT,这些模型均采用完全相同的无监督训练技术MLM / NSP / SOP,需要消耗巨大的硬件资源。更为常见和通用的方法是首先利用通用的模型训练出权重,在完成专业领域的预训练之后,再将专业领域的预训练结果代替通用领域的预训练结果,输入到下游任务中进行训练。

03

如何去伪存真地看懂一份图数据库的评测报告?

作者丨教授老边 图数据库作为新兴的技术,已经引起越来越多的人们关注。近来,笔者收到很多朋友的提问,诸如如何看懂评测报告内的门门道道?如何通过评测报告,知晓各个产品间的优势和劣势?一个完备的评测报告需要哪些性能测试内容?哪些内容是考验性能的硬核标准?哪些可以忽略不计,如何去伪存真…… 为了便于大家理解,本文第一部分先介绍关于图数据库、图计算与分析中的基础知识,第二、三部分进行图数据库评测报告的解读以及兼论图计算结果正确性验证。 1 基础知识 图数据库中的操作分为两类: 面向元数据的操作,即面向顶点、边或它们

03
领券