又壕又实惠的 AI 训练来了,Hugging Face 第一的 LLM 大模型 Falcon 40B 纳入亚马逊云科技服务

news/2024/7/20 17:19:41 标签: 人工智能, 亚马逊云科技, 大模型, AIGC

出品 | CSDN 云计算

2023 年,几乎是 AI 爆炸式发展的一年。各类大模型接踵而至,全行业都将 AIGC 融入生产流程,以提升效率。最近,阿联酋首都阿布扎比的科研中心 TII(Technology Innovation Institute)拥有 400 亿参数的大语言模型(LLM)Falcon 40B 登上了 Hugging Face 开源大语言模型排行榜单第一名,而背后则是云厂商亚马逊云科技提供超壕的算力训练支持。

最新 Hugging Face 开源大语言模型排行榜单

Falcon 大语言模型提供两种不同规模的开源版本——Falcon 40B和Falcon 7B, 两者均是使用Amazon SageMaker的数据预处理和模型训练任务从零开始构建。开源的Falcon 40B让用户能够构建和定制满足独特用户需求的AI工具,便于无缝集成,并确保长期保存数据资产。模型权重可供下载,检查和部署在任何地方。

这里必须提到云上的 AI 服务,鼎鼎大名的亚马逊云科技旗下的 Amazon SageMaker。自大模型爆火之后,Amazon SageMaker 逐步将主流大模型都纳入了其所提供的服务矩阵中,例如 Stability AI, AI21 Labs 和 LG AI。现在,想使用 Falcon 40B 的用户也可以将 Falcon 40B 部署在 Amazon SageMaker JumpStart 机器学习中心,Amazon SageMaker JumpStart 提供预训练模型,用户无需从头构建自己的模型即可获得 Falcon 40B 最先进的准确性和行业领先的性能。

根据亚马逊云科技的最新消息,从 6 月 7 日起,两个开源 Falcon 大语言模型也将在 Amazon SageMaker JumpStart 中可用。这是 SageMaker 的机器学习中心,它提供了预训练模型、内置算法和预构建的解决方案模板,可以帮助用户快速上手机器学习。用户只需在 SageMaker Studio 中轻点鼠标就可以部署和使用 Falcon 模型,或者通过 SageMaker Python SDK 以编程方式使用。

我们都知道 AI 训练推理需要耗费大量的算力资源,亚马逊云科技 SageMaker 是一个托管 API 集合,用于开发、训练、调优和托管机器学习(ML)模型,包括大语言模型。SageMaker Training 提供了具有用户自定义硬件配置和代码的计算集群。计算作业按运行次数计费,按秒分配任务,这意味着用户在未使用服务时无需为 GPU 资源付费。云厂商对于 AI 大模型训练成本的优化,可以说是开发者非常实惠的选择。TII 使用 SageMaker Training API 提供的瞬态集群来训练 Falcon 大语言模型,最多支持 48 个 ml.p4d.24xlarge 实例(384 个英伟达 A100 GPU)。现在,TII 正在训练下一代 Falcon 大语言模型,将训练扩展到 3136 个 A100 GPU(392 个 ml.p4d 实例)。

除了大模型的服务,亚马逊云科技还有 AI 编程助手 Amazon CodeWhisperer 面向个人开发者免费开放。Amazon CodeWhisperer 从数十亿行公开代码中学习之外,还基于亚马逊的代码进行了训练,可以为 Amazon EC2、Amazon Lambda 和 Amazon S3 等云服务生成最准确、最快和最安全的代码。开发者使用 Amazon CodeWhisperer,完成任务的速度平均快 57%,成功率高 27%。

现在全行业都在拥抱 AI,以提高生产与服务效率,云厂商作为从算力到上层应用的提供者,在其中可以发挥的作用非常巨大。云的模式也让算力规模化的同时,也能最大化的提高 AI 应用开发的性价比,并降低开发者对 AI 从部署到上线的门槛,非常值得开发者关注和尝试。CSDN 也将持续报道 AIGC 最新消息。


http://www.niftyadmin.cn/n/412120.html

相关文章

国有行面试的8种误区回答(上)

从各地区面试情况来看,国有行面试依旧是自我介绍半结构化无领导群面,辅之辩论赛等形式。 从多数地区和岗位面试情况看,我们知道自我介绍几乎是必考面试题,甚至不少地区一面只让作一次自我介绍就结束,可见自我介绍对面试…

【新版】系统架构设计师 - 软件工程

个人总结,仅供参考,欢迎加好友一起讨论 文章目录 架构 - 软件工程考点摘要软件工程概述软件能力成熟度模型软件过程模型瀑布模型原型化模型增量模型螺旋模型喷泉模型V模型迭代与增量的概念CBSD基于构件的模型(构件组装模型/基于构件的软件开发…

程序员兼职接单的平台列表

最近有很多程序员朋友说想要找一份合适的兼职工作,却苦于找不到一个正规靠谱的平台。今天我特意整理了一份超详尽的程序员兼职接单平台list,各位可以按需选择,也希望大家都能找到心仪的工作~ 中高端开发者必备的兼职接单平台:程序…

如何从 OpenAI 迁移到 Azure OpenAI(保姆级教程,包含如何兼容 JS 语言版 LangChain)

Azure OpenAI 和 OpenAI 一样,本质都是调用 api,Azure OpenAI 的使用会稍微复杂一点,但好处就是方便付费。 创建 Azure OpenAI 资源 首先,先登录 Azure 账号:https://azure.microsoft.com/zh-cn/ 接着创建 OpenAI 资…

Vivado_除法器 IP核 使用详解

本文介绍使用Vivado中除法器Divider Generator(5.1)的使用方法。 参考资料:pg151 文章目录 Divider Generator仿真测试 Divider Generator Channel Settings选项卡 #Common Options: Algorithm Type: 一共有三种类型,…

如何用Python语言调取百度翻译的API

诸神缄默不语-个人CSDN博文目录 本文介绍如何用Python语言调用百度翻译的API服务。 理论上类似的写法也可以应用于其他语言。 http://api.fanyi.baidu.com/manage/developer可以注册开发者,或者APP ID和秘钥;然后还可以进行开发者认证,获得…

前端收藏夹

前端工具和网站分享 tools 变量命名工具中文文档75cdnai 导航影视资源腾讯开发工具箱 vscode Name: any-rule Id: russell.any-rule Description: 你要的"正则"都在这! Version: 0.3.18 Publisher: 铁皮饭盒 VS Marketplace Link: https://marketplace.visualstu…

计算给定日期是当年的第几周

今天,小伙伴问我,给定一个日期,能不能算出日期是本年的第几周。 这个问题瞬间让我来了兴趣,思考了一会儿,便着手编写代码了。 我的思路很简单, 以周一作为一周的起始点,计算元旦和周日的偏差…