Intel 研究人员提出新 AI 方法，更高效地在 CPU 上部署 LLM

gate.io · 2年前 (2023-11-11)

据站长之家报道，大型语言模型（LLM）因在文本生成、语言理解和文本摘要等任务中的卓越表现而备受欢迎，但其庞大的模型参数却需要大量内存和专用硬件。为了降低推断所需的计算功率，Intel 的研究人员提出了一种有效的方法，支持自动的 INT-4 权重量化流程，可以在 CPU 上高效部署 LLM。此外，他们设计了一个特定的 LLM 运行时，具有高度优化的内核，可以加速 CPU 上的推断过程。

Gate.io - 芝麻交易所，又称芝麻开门交易所，是原比特儿交易所国际版本，是全球第二大交易所支持人民币OTC交易让财富更自由一点

微软免费图片工具 Designer 升级整合 DALL-E 3

6000万 USDT从Kraken转至Bitfinex

发表评论

电子邮件地址不会被公开。必填项已用*标注

Intel 研究人员提出新 AI 方法，更高效地在 CPU 上部署 LLM

上一篇

下一篇

发表评论

文章评论已关闭！

评论信息