当前位置: 首页 > news >正文

与设计行业相关的网站小制作 简单 步骤

与设计行业相关的网站,小制作 简单 步骤,自己做的网站收录怎么提升,广告创意设计大赛一、vLLM 部署 DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill 系列模型是 DeepSeek-R1 的蒸馏模型#xff0c;官方提供了从 1.5B - 70B 不同尺寸大小的模型。特别适合在计算资源有限的环境中部署。 DeepSeek-R1 各个版本的蒸馏模型评估结果如下#xff1a; 其中 DeepS…一、vLLM 部署 DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill 系列模型是 DeepSeek-R1 的蒸馏模型官方提供了从 1.5B - 70B 不同尺寸大小的模型。特别适合在计算资源有限的环境中部署。 DeepSeek-R1 各个版本的蒸馏模型评估结果如下 其中 DeepSeek-R1-Distill-Qwen-32B 是通过对 Qwen2.5-32B 模型进行蒸馏得到的版本。该模型在评估结果中整体表现优异在多项测试中均超过 GPT-4o-0513、o1-mini 、Claude-3.5-Sonnet-1022且在 DeepSeek-R1-Distill 系列中效果和 DeepSeek-R1-Distill-Llama-70B 相差不大但参数量近乎是 DeepSeek-R1-Distill-Llama-70B 的一半只有 32B大小因此可谓是本地部署的绝佳选择。 本次实验就基于 DeepSeek-R1-Distill-Qwen-32B 模型本地私有化部署其中推理优化框架采用 vLLM。 vLLM是一个快速且易于使用的大模型库专为大模型的推理和部署而设计。可以无缝集成 HuggingFace、Modelscope 上的模型。 关于 vLLM 的安装可参考下面这篇文章 利用 vLLM 优化部署私有化大模型让推理速度飞起 vLLM 环境部署好后首先使用 modelscope 下载 DeepSeek-R1-Distill-Qwen-32B 模型到指定目录下 modelscope download --modeldeepseek-ai/DeepSeek-R1-Distill-Qwen-32B --local_dir DeepSeek-R1-Distill-Qwen-32B然后使用 vLLM 读取模型启动API服务。 注意下面参数需要依据自己的算力环境适当修改 export CUDA_VISIBLE_DEVICES0,1vllm serve DeepSeek-R1-Distill-Qwen-32B \--host 0.0.0.0 \--port 8060 \--dtype bfloat16 \--tensor-parallel-size 2 \--cpu-offload-gb 0 \--gpu-memory-utilization 0.8 \--max-model-len 8126 \--api-key token-abc123 \--enable-prefix-caching--trust-remote-code关键参数说明 export CUDA_VISIBLE_DEVICES0,1 指定所使用的GPU由于我本地有两块这里指定了 0,1 , 如果只有一块的情况下可指定 0dtype: 数据类型其中 bfloat1616位浮点数适合 NVIDIA A100 等设备。tensor-parallel-sizeTensor 并行的数量当多 GPU 分布式推理时使用建议和GPU的数量一致。cpu-offload-gb允许将部分模型权重或中间结果卸载到 CPU 的内存中单位为 GB。模拟 GPU 内存扩展如果部署的模型大于了显存大小可以设置该参数但是推理速度会大大下降。gpu-memory-utilization设置 GPU 内存利用率的上限。max-model-len允许模型最大处理的Token数该参数越大占用显存越大。enable-prefix-caching启用前缀缓存减少重复计算。 显存占用情况 基于以上配置启动后整体大概占用了 79.2G 显存。如果启动显存不足可适当调整 gpu-memory-utilization 和 max-model-len 参数或通过 cpu-offload-gb 将部分模型权重卸载到内存中。 启动成功后通过 /v1/models 接口可查看模型列表 curl http://localhost:8060/v1/models -H Authorization: Bearer token-abc123测试API交互 curl http://localhost:8060/v1/chat/completions \-H Content-Type: application/json \-H Authorization: Bearer token-abc123 \-d {model: DeepSeek-R1-Distill-Qwen-B,messages: [{role: system, content: You are a helpful assistant.},{role: user, content: 你好介绍一下你自己}]}二、Open-WebUI 部署 Open WebUI是一个开源的、可扩展的、功能丰富的自托管AI平台旨在完全离线运行。它主要设计用于与大型语言模型LLMs进行交互支持多种模型和API提供了直观的图形用户界面使得用户可以更方便地管理和运行模型。 Github 地址 https://github.com/open-webui/open-webui 1. 部署 下载 open-webui 依赖 pip install open-webui启动 open-webui open-webui serve --port4096启动成功后浏览器访问http://ip:4096/ 即可打开 Open-WebUI 页面。 首次进入需要设置管理员账号密码设置完毕后进入到如下所示主页 2. 连接 DeepSeek-R1-Distill-Qwen-32B 模型。 点击左下角进入管理员面板 将 OpenAI API 和 Ollama API 关闭前提如果你有这两个连接的话可以开启。然后保留 直接连接 的开启 然后再次点击左下角进入设置 在外部链接中添加上面 vLLM 的服务 模型ID 可以留空会自动从 /v1/models 接口中获取。 保存后点击左上角 新对话 即可看到默认选择了 DeepSeek-R1-Distill-Qwen-32B 模型 三、对话测试
http://www.hkea.cn/news/14280415/

相关文章:

  • 网站建设php有哪些网站建设市场调研框架
  • 贵安新区网站建设推广公需道德与能力建设培训网站
  • 广州网站优化招聘商城网页设计
  • 网站规划包括哪些方面php网站开发实践
  • 什么样的企业要做网站大连线上教学
  • 网站建设代理加盟个人备案的网站 做企业站
  • 手机网站比例尺寸北京建网站
  • 网站建设需要的流程网站内的地图导航怎么做
  • 怎么在word上做超链接网站网页设计尺寸pt是什么意思
  • 网站初始开发的步骤云主机如何建网站
  • 嘉定网站设计制作价格ppt模板免费下载 素材第一ppt
  • 网站快速收录提交网络营销的营销方式
  • 申请注册网站域名.商城国际新闻今天最新
  • 目前做网站框架微信小程序服务器
  • cms代码做网站商标注册查询是否有人注册了怎么查
  • 安徽鲲鹏建设集团有限公司网站风云榜
  • 网站开发个人所得税企业为什么要建站台呢
  • 网站字体深圳燃气公司有哪几家
  • 潍坊网站建设培训我想建设一个算命网站
  • 锡盟网站建设9951026企业邮箱
  • 有哪些可以在线做app的网站百联网上购物商城
  • 公益网站的设计与建设新乡做新网站
  • 建站记录查询做资源网站怎么不封
  • 药店网站建设相关费用网络平台搭建
  • dw不会写代码能建立网站吗帝国cms 网站名称
  • 七牛云动静分离wordpress天津海外seo
  • 南阳网站怎么推广个性化企业网站制作公司
  • 网站为什么要seo如何搭建一个公司网站
  • 杭州手机建站模板做起点说网站的服务器多少钱
  • 网站建设 全包 模板京东app下载安装官网免费下载