据《科创板日报》5 月 30 日报道,Meta 日前发布全新模型架构 Megabyte,这是一种多尺度解码器架构,可对超过一百万字节的序列进行端到端可微分建模,并可跨多种格式生成超过 100 万个 token。Meta 团队声称,Megabyte 能解决 Transformer 硬伤,速度还能提高 40%。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货