首页 > 芝麻开门 > 正文

微软亚洲研究院提出全新大模型基础架构：推理速度 8 倍提升，内存占用减少 70%

gate.io · 2年前 (2023-07-18)

GATE.IO芝麻开门

GATE.IO芝麻开门交易所(原比特儿交易所)是全球前10的交易所，新用户注册可免费领取空投，每月可得50-200U

点击注册更多入口

更多交易所入口

一站式注册各大交易所、点击进入加密世界、永不失联，币安Binance/欧易OKX/GATE.IO芝麻开门/Bitget/抹茶MEXC/火币Huobi

点击进入永不失联

据量子位报道，来自微软亚洲研究院（MSRA）的学者在“Retentive Network: A Successor to Transformer for Large Language Models”论文中提出新的大模型架构 Retentive Network（RetNet），这被视作大模型领域 Transformer 的继任者。实验数据显示，在语言建模任务上：RetNet 可以达到与 Transformer 相当的困惑度（perplexity），推理速度达 8.4 倍，内存占用减少 70%，具有良好的扩展性。并且当模型大小大于一定规模时，RetNet 表现会优于 Transformer。

Gate.io - 芝麻交易所，又称芝麻开门交易所，是原比特儿交易所国际版本，是全球第二大交易所支持人民币OTC交易让财富更自由一点
文章采集自互联网，本站不对其真实性负责，如需删除，请发送链接至oem1012@qq.com

光年之外首轮投资方源码资本内部组织调整，传言裁员 30%

数据：某巨鲸从币安提出约320万美元山寨币，包括LDO、AAVE和UNI

发表评论

电子邮件地址不会被公开。必填项已用*标注

微软亚洲研究院提出全新大模型基础架构：推理速度 8 倍提升，内存占用减少 70%

GATE.IO芝麻开门

更多交易所入口

上一篇

下一篇

发表评论

文章评论已关闭！

评论信息