时间:2024/3/25 19:20:56来源:www.pc6.com作者:路西蓝我要评论(0)
大模型和 AIGC的发展呈现出了快速推进的态势,不仅在技术层面有所突破,而且在产业应用和市场前景方面也展现出积极的趋势。通过 青云科技(qingcloud.com) 容器引擎 QKE 快速部署 ChatGLM-6B 大模型,开启属于你自己的 AI 时代。
什么是 QKE
QingCloud 容器引擎 QKE 是基于 Kubernetes 的容器引擎,能够轻松地管理和部署容器化应用。它具备自动化扩容、高可用性、安全性等多项优势,让应用更加稳定、高效。近日,发布 QKE v3.1,支持 Kubernetes v1.25 ,不仅提高了容器集群的性能、可靠性、安全性和可维护性,还为大模型应用场景提供了更好的支持。
5 分钟部署大模型
接下来,我们来看看如何使用 QKE 容器引擎部署 ChatGLM-6B 大模型。
创建 QKE GPU 集群
第一步:创建一个带有 GPU 工作节点池的 QKE 集群
QKE 集群创建成功后,如需以 HTTP 访问带授权的镜像仓库,可在集群信息,镜像参数中配置镜像拉取的 insecure-registries、docker-auths。
第二步:检查 GPU 工作节点上 GPU Device Plugin 的就绪情况。
第三步: 将 GPU 工作节点打上标签:accelerator: nvidia-gpu
部署 ChatGLM-6B
第一步: 编辑创建 K8s deployment 和 service 的 chatglm-6b.yaml。
其中 nodeSelector.accelerator: nvidia-gpu 让 Pod 调度到的 GPU 工作节点。
第二步: 部署 ChatGLM-6B
暴露服务给外部访问
第一步:通过如下命令找到 NorthPort 号
root@master1:~# kubectl get service -n chatglm
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
chatglm-web NodePort 10.96.204.196 7860:30313 /TCP 3h
这里显示 NorthPort 号为 30313 。
第二步:在 QKE 集群对应的 VPC 上,添加一条端口转发规则,转发到节点的 30313 端口。
测试访问
打开浏览器, 输入地址 http://<vpc的eip地址:vpc源端口> 即可访问 ChatGLM 推理服务。
整个部署过程非常简单,只需几步,就可以快速完成大模型应用的部署。而且,QKE 还提供了丰富的监控和日志功能,能够实时了解应用的运行状态和性能。
如果您正在寻找一个高效、稳定、易用的容器引擎,不妨试试 QingCloud QKE 吧!
结语
随着 AI 技术的不断进步和在各行各业中的深入应用,大模型的发展将会更加迅速,其在处理大规模数据和复杂任务方面的能力将得到进一步的提升。同时,大模型在自然语言处理、计算机视觉、推荐系统等领域的应用也将不断拓展,为各行各业带来创新的解决方案。
QingCloud QKE 作为一款强大的容器引擎,为大模型和 AI 提供了健壮、易用、轻简的云原生基础设施。通过 QKE,可以更好地实现 AI 与业务的结合,推动 AI 技术在不同领域的广泛应用。
相关视频
相关阅读 从设备到材料,黑格科技提供3D技术全方位解决方案AIoT爆发在即,聆思科技“芯片+算法”深度耦合路线有何价值?“人工智能+” 时代来临,眼神科技如何助力产业“智慧变身”科技与艺术的融合:华为Pocket-2折叠手机开始预售2024年DT币在数字货币和金融科技中的应用是什么?2024年DT币在数字货币和金融科技中的应用是什么?2024年BGB币在数字货币和金融科技中的应用是什么?2024年BGB币在数字货币和金融科技中的应用是什么?
热门文章 2016淘宝造物节怎么玩人生日历新增小插件—2014年双11淘宝销售额
最新文章
枢纽云董事长许远东:从设备到材料,黑格科技
青云科技云端QKE 容器引擎助你快速部署AI大守护袁昆:企业互联网营销必须重视蝴蝶号?华为WATCH Ultimate非凡大师发布一周年,惊2024TikTok Shop跨境招商大会启幕在即,Ping
人气排行 2014年双11淘宝销售额及排行榜扫描文件怎么转换成word 扫描文件转换成wor如何将pdf转换成jpg pdf转jpg图文教程360粉碎文件如何恢复win7回收站清空了怎么恢复 win7回收站清空恢pdf怎么转换成excel pdf文件转Excel格式方法设备管理器有叉号、问号、感叹号?驱动人生迅捷pdf转换成word转换器怎么用
查看所有0条评论>>