微软打造 13 亿参数小型 LLM AI 模型，并称实际效果胜于千亿参数 GPT-3.5

gate.io · 3年前 (2023-06-27)

IT 之家今日发文表示，AI 模型盲堆体积实际上效果并不见得更好，更多要看训练数据的质量，微软日前最近发布了一款 13 亿参数的语言模型 phi-1，采用“教科书等级”的高品质资料集训练而成，据称“实际效果胜于千亿参数的 GPT 3.5”。该模型以 Transformer 架构为基础，微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”，以及 8 个英伟达 A100 GPU，在短短 4 天内完成训练。

Gate.io - 芝麻交易所，又称芝麻开门交易所，是原比特儿交易所国际版本，是全球第二大交易所支持人民币OTC交易让财富更自由一点

跨链流动性聚合器Router Protocol已集成Scroll测试网

ZigZag：Discord已被黑客入侵，请勿点击网络钓鱼链接

发表评论

电子邮件地址不会被公开。必填项已用*标注

微软打造 13 亿参数小型 LLM AI 模型，并称实际效果胜于千亿参数 GPT-3.5

上一篇

下一篇

发表评论

文章评论已关闭！

评论信息