当前所在位置:首页 > 专业在线配资

Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC

4202

2024-10-21 【 字体:

站长之家8月24日消息: Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

英伟达

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」

这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。

配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。

Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。

剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。

阅读全文
相关推荐

226亿元!税务部门查处重大虚开发票偷税骗补案件

226亿元!税务部门查处重大虚开发票偷税骗补案件
国家税务总局今天(21日)公布一起网络主播管理机构伙同不法中介虚开、偷税、骗补重...

卓郎智能2024年营收403亿元 扎实推进纺纱机械领域智能化转型

卓郎智能2024年营收403亿元 扎实推进纺纱机械领域智能化转型
4月28日晚间,卓郎智能(600545)公布2024年年报,公司全年实现营业收入...

《大模型技术深度赋能保险行业白皮书》正式发布

《大模型技术深度赋能保险行业白皮书》正式发布
近日,阳光保险集团联合清华大学五道口金融学院、中国保险学会、北京百度网讯科技有限...

刷新世界纪录!阿里云登顶全球数据库性能及性价比排行榜

刷新世界纪录!阿里云登顶全球数据库性能及性价比排行榜
  据阿里云消息,阿里云PolarDB云原生数据库登顶全球数据库性能及性价比排行...

重磅!全球首个通用具身基座模型在珠海发布

重磅!全球首个通用具身基座模型在珠海发布
具身智能领域迎来里程碑式突破——3月14日,具身智能领军企业智元机器人在珠海发布...

科创板分拆上市有新进展,生益科技子公司IPO申请获受理

科创板分拆上市有新进展,生益科技子公司IPO申请获受理
继长春高新之后,科创板分拆上市又有新进展。生益科技(600183.SH)分拆子公...

星纪魅族 AR 眼镜引领支付革命,线下支付功能惊艳亮相香港!

星纪魅族 AR 眼镜引领支付革命,线下支付功能惊艳亮相香港!
随着用户说出确认支付的口令,商户第一时间收到了来自智能眼镜的付款。不用掏出手机,...

腾讯“小五” 两只手四条腿

腾讯“小五” 两只手四条腿
  能按摩、推轮椅,会健康检测、对话陪伴……今年以来,养老机器人正从概念走向现实...

AR眼镜龙头加速布局上海,打开一个万亿级产业生态

AR眼镜龙头加速布局上海,打开一个万亿级产业生态
“我们希望在浦东,通过这副AR眼镜打开一个万亿级的全新产业生态。”XREAL公司...

伯克希尔董事会投票:阿贝尔明年1月1日接任CEO 巴菲特继续担任董事长

伯克希尔董事会投票:阿贝尔明年1月1日接任CEO 巴菲特继续担任董事长
专题:巴菲特2025年股东大会重磅来袭 ...