当前所在位置:首页 > 专业在线配资

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

4202

2024-10-21 【 字体:

站长之家8月24日消息: Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

英伟达

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」

这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。

阅读全文
相关推荐

韩代总统李周浩今天开始履职

韩代总统李周浩今天开始履职
韩国新代总统、副总理兼教育部长官李周浩今天(5月2日)开始履职。他上午主持召开国...

财信研究评9月工业企业利润数据:原材料与消费品利润明显好转,企业继续补库存

财信研究评9月工业企业利润数据:原材料与消费品利润明显好转,企业继续补库存
原材料与消费品利润明显好转,企业继续补库存2023年9月工业企业利润点评全文共3...

国际金价突然跳水!金饰克价两天跌近50元!未来走势如何?机构解读

国际金价突然跳水!金饰克价两天跌近50元!未来走势如何?机构解读
  4月24日上午,国际金价一度反弹,COMEX黄金涨超2%;现货黄金日内涨超2...

统计局:1—3月份全国规模以上工业企业利润增长08%

统计局:1—3月份全国规模以上工业企业利润增长08%
1—3月份,全国规模以上工业企业实现利润总额15093.6亿元,同比增长0.8%...

全球市场销量下滑,特斯拉今年市值已蒸发35%

全球市场销量下滑,特斯拉今年市值已蒸发35%
特斯拉(TSLA)2月在全球各大主要市场的销量纷纷出炉,但情况并不乐观。近日,乘...

又有上市公司拉响退市警报,原因是这些……

又有上市公司拉响退市警报,原因是这些……
在全面注册制推行的大背景下,资本市场优胜劣汰的常态化退市机制正加速推进。近期,伴...

WPP(WPPUS)以775亿美元向KKR出售FGS Global股份 下调全年有机收入指引

WPP(WPPUS)以775亿美元向KKR出售FGS Global股份 下调全年有机收入指引
智通财经获悉,全球最大的传播集团、英国广告集团WPP(WPP.US)周三同意以7...

股票配资知识网:玩转杠杆,步步为营!

股票配资知识网:玩转杠杆,步步为营!
股票配资知识网:玩转杠杆,步步为营!元描述: 深入了解股票配资的风险与...

天臣配资:撬动财富杠杆,风险与机遇并存

天臣配资:撬动财富杠杆,风险与机遇并存
天臣配资:撬动财富杠杆,风险与机遇并存元描述: 天臣配资详解:深入探讨...

融资融券股票:最好别碰?深度解析高风险高收益的双刃剑

融资融券股票:最好别碰?深度解析高风险高收益的双刃剑
融资融券股票:最好别碰?深度解析高风险高收益的双刃剑元描述: 融资融券...