当前所在位置:首页 > 专业在线配资

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

4202

2024-10-21 【 字体:

站长之家8月24日消息: Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

英伟达

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」

这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。

阅读全文
相关推荐

ETF午评 A股三大指数低开高走,新经济ETF异动涨6%,港股创新药板块飘红,恒生医疗ETF、港股通医药ETF涨4%

ETF午评  A股三大指数低开高走,新经济ETF异动涨6%,港股创新药板块飘红,恒生医疗ETF、港股通医药ETF涨4%
格隆汇3月27日|A股三大指数早盘低开高走,截至午盘,沪指涨0.31%,深成指涨...

美债遭抛售!30年期收益率升破5%,机构解读

美债遭抛售!30年期收益率升破5%,机构解读
  中新经纬4月9日电 4月9日,美债收益率持续攀升,30年期收益率一度上行25...

造车新势力“神仙打架”,新能源汽车或成为二手车交易的主力

造车新势力“神仙打架”,新能源汽车或成为二手车交易的主力
蔚来ET9、问界M9、极氪007、小米SU7、小鹏X9、理想MEGA.........

亚太股市早盘大涨 日经225指数涨53% 韩国KOSPI指数涨5%

亚太股市早盘大涨 日经225指数涨53% 韩国KOSPI指数涨5%
  亚太股市早盘大涨,日经225指数涨5.3%,韩国KOSPI指数涨5%。 ...

226亿元!税务部门查处重大虚开发票偷税骗补案件

226亿元!税务部门查处重大虚开发票偷税骗补案件
国家税务总局今天(21日)公布一起网络主播管理机构伙同不法中介虚开、偷税、骗补重...

卓郎智能2024年营收403亿元 扎实推进纺纱机械领域智能化转型

卓郎智能2024年营收403亿元 扎实推进纺纱机械领域智能化转型
4月28日晚间,卓郎智能(600545)公布2024年年报,公司全年实现营业收入...

《大模型技术深度赋能保险行业白皮书》正式发布

《大模型技术深度赋能保险行业白皮书》正式发布
近日,阳光保险集团联合清华大学五道口金融学院、中国保险学会、北京百度网讯科技有限...

刷新世界纪录!阿里云登顶全球数据库性能及性价比排行榜

刷新世界纪录!阿里云登顶全球数据库性能及性价比排行榜
  据阿里云消息,阿里云PolarDB云原生数据库登顶全球数据库性能及性价比排行...

重磅!全球首个通用具身基座模型在珠海发布

重磅!全球首个通用具身基座模型在珠海发布
具身智能领域迎来里程碑式突破——3月14日,具身智能领军企业智元机器人在珠海发布...

科创板分拆上市有新进展,生益科技子公司IPO申请获受理

科创板分拆上市有新进展,生益科技子公司IPO申请获受理
继长春高新之后,科创板分拆上市又有新进展。生益科技(600183.SH)分拆子公...