首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#lm

首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

新智元

在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型(SpeechLMs)也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行...

8000

arXiv|LM-PROTAC:语言模型驱动的PROTAC生成流程

智药邦

2024年12月12日,南通大学Med-AI团队在arXiv发表了一项基于语言模型驱动的人工智能药物设计技术方案LM-PROTAC(Language Model...

8310

搭建本地大模型之LM Studio

IT小马哥

LM Studio 通常支持 Apple Silicon Macs、x64/ARM64 Windows PC 和 x64 Linux PC。

6.3K10

[1300]LM Studio 换源问题

周小董

首先进行LM的下载 (登录官网下载我没有用梯子应该可以直接下载,下载速度太慢可以尝试IDM)

1.7K10

多元回归:残差分析与异常值诊断

herain

基础分析数据为27位糖尿病者的 血清总胆固醇(X1)、甘油(X2)、空腹胰岛素(X3)、糖化血红蛋白(X4)、空腹血糖(Y)的测量值。我们可以使用R语言建立 空...

25610

Huggingface Transformers实现张量并行的小坑 set/get_output_embeddings

marsggbo

默认情况下,大模型的输入和输出的 vocab 是保持一致的,所以如果传入的 embedding 的大小变化了,默认也会让 lm_head 发生变化。

32210

大模型理论基础(so-large-lm)课程笔记!

Datawhale

在当前信息时代,大型语言模型(Large Language Models,LLMs)的发展速度和影响力日益显著。随着技术进步,我们见证了从基本的Transfor...

27510

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

新智元

见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊?

14110

AI Infra论文阅读之将流水线并行气泡几乎降到零(附基于Meagtron-LM的ZB-H1开源代码实现解读)

BBuf

这篇论文对应的链接为:https://openreview.net/pdf?id=tuzTN0eIO5 ,最近被ICLR 2024接收,但不少AI Infra的...

2.1K10

使用LM Studio在本地运行LLM完整教程

deephub

GPT-4被普遍认为是最好的生成式AI聊天机器人,但开源模型一直在变得越来越好,并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中,

7K10

像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略

机器之心

随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。

23310

切片器相互控制,从容应对同比环比任意月份对比

陈学谦

假设有10个计算字段都要进行同比、环比和任意月份的对比,那么常规做法就是将这10个度量值分别再写10×3=30个度量值。

49900

php安装make出现“collect2:error:ldreturned1exitstatus

network_dream

错误提示: collect2: error: ld returned 1 exit status

74030

【RLHF】想训练ChatGPT?先来看看强化学习(RL)+语言模型(LM)吧(附源码)

汀丶人工智能

随着最近 ChatGPT 的大火,越来越多人开始关注其中用到的 RLHF(Reinforcement Learning from Human Feedback)...

81040

LM-Infinite: 一种简单有效的大模型即时长度泛化,解决更长文本推理问题

zenRRan

近年来,LLM在各个领域的性能都有了显著的进展。随着这些LLM被用于越来越复杂的任务,它们经常需要更长的推理过程或理解更大的上下文。在这些情况下,LLM在长序列...

1.1K20

KDD23 | LM+GNN最新 SOTA

Houye

大规模文本语料库上的模型预训练已经被证明在NLP领域的各种下游应用中非常有效。在图挖掘领域,也可以类比预训练图模型在大规模图上,以期望从中获益于下游图应用,这也...

14620

R语言响应面(RSM)、线性模型lm分析生产过程影响因素可视化

拓端

响应面(Response Surface Methodology,RSM)分析是一种常用的统计方法,用于研究和优化生产过程中的影响因素。通过建立数学模型来描述因...

1.1K10

tidymodels工作流:workflow

医学和生信笔记

在阅读这篇文章前,我强烈建议你先读一下tidymodels入门篇:tidymodels用于机器学习的细节,首先对tidymodels有一个整体的认知。

24310

【BBuf的cuda学习笔记十】Megatron-LM的gradient_accumulation_fusion优化

BBuf

这篇文章来解析一下Megaton-LM涉及到的一个优化gradient_accumulation_fusion。这里fusion的意思是在gemm接口中会将当前...

1.8K30

Megatron-LM 分布式执行调研

BBuf

Created by: strint Created time: May 31, 2023 6:02 PM

2K40
领券