首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    奇点已过?聊聊BERT之后的NLP时代

    GPT的实验结论是,如果特定任务有监督训练的数据量比较大时,加入辅助语言模型能改善模型效果,但如果特定任务有监督训练的数据量比较小时,加入辅助语言模型反而会降低模型效果。...如果这个性能对你的应用没问题的话,建议直接用BERT。...如果标注数据量过大或者觉得训练时间太长,可以使用特征抽取方式。先用BERT抽取出句子向量表达,后续的分类器只要读入这些向量即可。...这样做的问题是,如果有100个候选结果,就要算100次,就算把它们打包一起算,CPU上的时间开销在线上场景也是扛不住的。...如果要精调效果,可以考虑ULMFiT中引入的gradual unfreezing和discriminative fine-tuning:机制。

    82030

    蚂蚁、字节、滴滴面试经历总结(都已过)

    在文章里我不仅会列出面试题,还会给到一些答题建议,个人能力有限,也不能保证我回答都正确,如果有错误,希望能纠正我。...怎么让数据库查询更快 索引 如果数据量太多了可以拆表,分多个数据库 数据库是用的什么? mysql 为什么用 mysql 希望滴滴能提供给你什么? 这个题其实还挺常考的,可以好好准备下,背一下答案。...如果让你设计项目自动设计组件升级,并且安全,你会怎么去设计 三面 全程聊项目,因为他不是前端的,所以没问前端任何知识,主要聊业务相关的,看看我对业务的理解,以及一些想法。...关于如何准备面试的问题,我的策略是把自己会的东西以及常用的东西,尽量让面试官问不倒你,不会的东西可以跟面试官说不会,不怎么了解,那一般面试官也不会问相关的问题了,如果连自己常用的东西都了解得不深,那么就不太有可能把平时不常用的了解得很深了...所以我在准备的时候,就尽量准备的这些知识,了解我的人都知道,我对 react 研究得比较多,原理、性能优化都写过文章,所以如果考 react 的东西,我基本不担心。

    1.3K61
    领券