书生·浦语大模型全链路开源体系介绍

news/2024/7/20 19:25:08 标签: 大模型, 云原生

背景介绍

随着人工智能技术的迅猛发展,大模型技术已成为当今人工智能领域的热门话题。2022 年 11 月 30 日,美国 OpenAI 公司发布了 ChatGPT 通用型对话系统 并引发了全球 的极大关注,上线仅 60 天月活用户数便超过 1 亿,成为历史上用户增长最快的互联网 应用产品。2023 年 3 月 14 日,OpenAI 公司再次发布了升级版模型 GPT-4 又展现 出了更高阶的能力,再一次实现了技术飞跃,并在全球范围掀起大模型发展浪潮。不仅国外科技巨头纷纷加码布局,推动大模型产业的快速落地,国内的头部企业也积极追赶步伐,竞相抢滩大模型的新赛道,抢抓认知智能大模型带来的历史机遇,下图为ChatGPT的发布时间线。
[图片]
在OpenAI发布GPT3.5后,各大模型厂商积极跟进,相继推出各类大模型。国内本土已经发布近80款参数量在十亿量级以上的大模型,主要有华为、阿里、百度、腾讯等,亦有清华大学等高校机构。
在这里插入图片描述
专用大模型 针对特定任务,一个模型解决一个问题,比如适用于围棋比赛的围棋大模型
在这里插入图片描述
通用大模型 一个模型应对多种任务、多种模态

大模型介绍

书生·浦语大模型开源历程:
在这里插入图片描述
书生·浦语大模型系列:
在这里插入图片描述
以20B开源大模型为例,其性能全面领先相近量级的开源模型(包括Llama-33B、Llama2-13B以及国内主流的7B、13B开源模型),以不足三分之一的参数量,达到Llama2-70B水平。
在这里插入图片描述

大模型开源开放体系

在这里插入图片描述
数据: 开放了书生万卷,具有2TB数据,涵盖多种模态与任务
预训练: 开源了InternLM-Train框架,支持并行训练,进行了极致优化,速度达到3600 tokens/sec/gpu
微调: 开源了XTuner框架,支持 全参数微调,支持LoRA等低成本微调
部署: 开源了LMDeploy框架,支持全链路部署,性能领先,每秒生成2000+ tokens
评测: 开源OpenCompass框架,支持全方位评测,性能可复现,80套评测集,40万道题目
应用: 开源了Lagent、AgentLego项目,支持多种智能体,支持代码解析器多种工具调用

数据-书生万卷

在这里插入图片描述
在这里插入图片描述

预训练

在这里插入图片描述

微调

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评测

在这里插入图片描述
OpenCompass提供的评测集
在这里插入图片描述
OpenCompass 开源评测平台架构
在这里插入图片描述
OpenCompass的亮点
在这里插入图片描述
OpenCompass支持的模型
在这里插入图片描述

部署

在这里插入图片描述

LMDeploy 提供大模型在GPU上部署的全流程解决方案,包括模型轻量化、推理和服务

在这里插入图片描述

智能体应用

在这里插入图片描述
轻量级智能体框架Lagent
在这里插入图片描述
多模态智能体工具箱 AgentLego
在这里插入图片描述

总结

总之书生浦语是一个大模型全链路开源体系,为开发者提供了从数据集准备到模型训练、部署和应用的全套解决方案。通过该体系,开发者可以自由定制和扩展模型,满足不同场景下的需求。

本文提到的相关框架工具地址:
OpenDataLab: https://opendatalab.com/home
书生万卷:https://opendatalab.com/OpenDataLab/WanJuan1_dot_0
预训练框架:https://github.com/InternLM/InternEvo
微调框架XTuner:https://github.com/InternLM/xtuner
部署框架LMDeploy:https://github.com/InternLM/lmdeploy
Lagent:https://github.com/InternLM/lagent
AgentLego:https://github.com/InternLM/agentlego
评估框架OpenCompass: https://github.com/open-compass/opencompass


作者其他不相干的专栏,也来看看:

  • Prometheus+Grafana 实践派

Prometheus来自CNCF的产品,云原生时代监控产品; Grafana是一款开源的指标可视化工具,拥有大量的插件和图表工具来查询,展示您的指标,本专栏从基础知识开始学习,逐渐进阶,最终实现企业级统一监控目标

  • Loki + Tempo

一步步学习Grafana家族的轻量型聚合日志框架-Loki,链路追踪框架-Tempo

  • Spring Boot 3.x

Spring Boot 具有 Spring 一切优秀特性,Spring 能做的事,Spring Boot 都可以做,本专栏将全面介绍Spring Boot特性,继而对其进行全面的源码分析,不再犀牛望月,Spring Boot 版本:3.x

  • Spring Security

使用Spring Security版本5.7.2

  • Spring Boot Admin2

SBA2 源码解析

  • 阿提小作

作者平时心血来潮开发的小系统,都在运行玩了一段时间后停了

等等,还有其他很多


http://www.niftyadmin.cn/n/5395758.html

相关文章

EasyExcel 隐藏列、动态列、单元格下拉框选择数据、单元格文本格式

前言 项目中用到EasyExcel读写Excel,用到了一下功能,这里做个笔记: 隐藏列:隐藏某些列动态列:固定列 动态的生成Excel列单元格下拉框选择数据:设计单元格下拉数据,并且加校验单元格文本格式&…

开源计算机视觉库OpenCV常用的API介绍

阅读本文之前请参阅-----开源计算机视觉库OpenCV详细介绍 OpenCV(开源计算机视觉库)是一个跨平台的计算机视觉和机器学习软件库,它提供了大量的API(应用程序编程接口),用于处理图像和视频分析、对象检测、面…

spark stream:从Kafka中读取数据

一、添加依赖 ThisBuild / version : "0.1.0-SNAPSHOT"ThisBuild / scalaVersion : "2.12.12" libraryDependencies Seq( "org.apache.spark" % "spark-core_2.12" % "3.0.0") libraryDependencies Seq( "org.apach…

JDK安装及环境变量配置(保姆级教程)

什么是JDK? JDK(Java Development Kit)是Java开发工具包的缩写 它是Java开发人员必备的软件包之一。JDK包含了用于编译、调试和运行Java程序的各种工具和库。通过安装JDK,开发人员可以开始编写、编译和运行Java应用程序、Applet和…

HTML5 CSS3 提高

一,HTML5的新特性 这些新特性都有兼容性问题,基本是IE9以上版本的浏览器才支持,如果不考虑兼容性问题,可以大量使用这些新特性。 1.1新增语义化标签 注意: 1这种语义化标签主要是针对搜索引擎的 2这些新标签在页面…

远程控制桌面,让电脑办公更简单

随着科技的不断发展,远程办公已经成为了越来得越多企业和个人的选择。远程控制电脑办公,仅需1款软件即可轻松get! 1.绿虫电脑管理软件 是一款功能强大的办公电脑管理软件,仅需安装在被控端电脑,主控端通过网页登录后…

git submodule 模块化管理

Git Submodule 是 Git 版本控制系统中的一项功能,它允许你将一个 Git 仓库嵌套在另一个仓库中。通过使用 Submodule,你可以在一个仓库中引入其他仓库的特定版本,同时保留这些子模块的独立性。 1、添加并初始化 Submodule a、添加 Submodule…

全量知识系统问题及SmartChat给出的答复 之5

Q15. 支持前端(知识表征)的自然语言能力 需要一个 元语言注释工具 以及两个库(叙词库和语料库)和主题词表。请 1)设计 两个库和主题词表的结构 ,2)分别设计它们的接口,3)通过调用它们…