当前位置: 首页 > news >正文

怎么让别人找你做网站广州网站平台怎么做

怎么让别人找你做网站,广州网站平台怎么做,做网站需要交维护费么,做一网站要什么软件有哪些目录 前言 本机环境 GLM4代码库下载 模型文件下载#xff1a;文件很大 修改为从本地模型文件启动 启动模型cli对话demo 慢#xff0c;巨慢#xff0c;一个字一个字的蹦 GPU资源使用情况 GLM3资源使用情况对比 前言 GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 …目录 前言 本机环境 GLM4代码库下载 模型文件下载文件很大 修改为从本地模型文件启动 启动模型cli对话demo 慢巨慢一个字一个字的蹦 GPU资源使用情况  GLM3资源使用情况对比 前言 GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。 在语义、数学、推理、代码和知识等多方面的数据集测评中 GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。 除了能进行多轮对话GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用Function Call和长文本推理支持最大 128K 上下文等高级功能。 本代模型增加了多语言支持支持包括日语韩语德语在内的 26 种语言。 我们还推出了支持 1M 上下文长度约 200 万中文字符的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B。GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。 本机环境 OSWindows CPUAMD Ryzen 5 3600X 6-Core Processor Mem32GB GPURTX 4060Ti 16G GLM4代码库下载 参考LLM大语言模型一ChatGLM3-6B本地部署_llm3 部署-CSDN博客 # 下载代码库 https://github.com/THUDM/GLM-4.git 模型文件下载文件很大 建议从modelscope下载模型这样就不用担心网络问题了。 模型链接如下  glm-4-9b-chat汇聚各领域最先进的机器学习模型提供模型探索体验、推理、训练、部署和应用的一站式服务。https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat/files git lfs install # 以安装则忽略 git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat.git 做好心理准备接近20G我的带宽只有300Mbps~~ 修改为从本地模型文件启动 修改此文件basic_demo/trans_cli_demo.py 修改这一行 MODEL_PATH os.environ.get(MODEL_PATH, D:\github\glm-4-9b-chat) 该为你下载的模型文件夹 This script creates a CLI demo with transformers backend for the glm-4-9b model, allowing users to interact with the model through a command-line interface.Usage: - Run the script to start the CLI demo. - Interact with the model by typing questions and receiving responses.Note: The script includes a modification to handle markdown to plain text conversion, ensuring that the CLI interface displays formatted text correctly. import os import torch from threading import Thread from typing import Union from pathlib import Path from peft import AutoPeftModelForCausalLM, PeftModelForCausalLM from transformers import (AutoModelForCausalLM,AutoTokenizer,PreTrainedModel,PreTrainedTokenizer,PreTrainedTokenizerFast,StoppingCriteria,StoppingCriteriaList,TextIteratorStreamer )ModelType Union[PreTrainedModel, PeftModelForCausalLM] TokenizerType Union[PreTrainedTokenizer, PreTrainedTokenizerFast]# 改为你下载的模型文件夹 MODEL_PATH os.environ.get(MODEL_PATH, D:\github\glm-4-9b-chat)def load_model_and_tokenizer(model_dir: Union[str, Path], trust_remote_code: bool True ) - tuple[ModelType, TokenizerType]:model_dir Path(model_dir).expanduser().resolve()if (model_dir / adapter_config.json).exists():model AutoPeftModelForCausalLM.from_pretrained(model_dir, trust_remote_codetrust_remote_code, device_mapauto)tokenizer_dir model.peft_config[default].base_model_name_or_pathelse:model AutoModelForCausalLM.from_pretrained(model_dir, trust_remote_codetrust_remote_code, device_mapauto)tokenizer_dir model_dirtokenizer AutoTokenizer.from_pretrained(tokenizer_dir, trust_remote_codetrust_remote_code, encode_special_tokensTrue, use_fastFalse)return model, tokenizermodel, tokenizer load_model_and_tokenizer(MODEL_PATH, trust_remote_codeTrue)class StopOnTokens(StoppingCriteria):def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs) - bool:stop_ids model.config.eos_token_idfor stop_id in stop_ids:if input_ids[0][-1] stop_id:return Truereturn Falseif __name__ __main__:history []max_length 8192top_p 0.8temperature 0.6stop StopOnTokens()print(Welcome to the GLM-4-9B CLI chat. Type your messages below.)while True:user_input input(\nYou: )if user_input.lower() in [exit, quit]:breakhistory.append([user_input, ])messages []for idx, (user_msg, model_msg) in enumerate(history):if idx len(history) - 1 and not model_msg:messages.append({role: user, content: user_msg})breakif user_msg:messages.append({role: user, content: user_msg})if model_msg:messages.append({role: assistant, content: model_msg})model_inputs tokenizer.apply_chat_template(messages,add_generation_promptTrue,tokenizeTrue,return_tensorspt).to(model.device)streamer TextIteratorStreamer(tokenizertokenizer,timeout60,skip_promptTrue,skip_special_tokensTrue)generate_kwargs {input_ids: model_inputs,streamer: streamer,max_new_tokens: max_length,do_sample: True,top_p: top_p,temperature: temperature,stopping_criteria: StoppingCriteriaList([stop]),repetition_penalty: 1.2,eos_token_id: model.config.eos_token_id,}t Thread(targetmodel.generate, kwargsgenerate_kwargs)t.start()print(GLM-4:, end, flushTrue)for new_token in streamer:if new_token:print(new_token, end, flushTrue)history[-1][1] new_tokenhistory[-1][1] history[-1][1].strip()启动模型cli对话demo 运行该py文件即可效果如下 模型运行时会报个warning C:\Users\Administrator\.cache\huggingface\modules\transformers_modules\glm-4-9b-chat\modeling_chatglm.pm.py:189: UserWarning: 1Torch was not compiled with flash attention. (Triggered internally at C:\cb\pytorc000h_1000000000000\work\aten\src\ATen\native\transformers\cuda\sdp_utils.cpp:263.)   context_layer torch.nn.functional.scaled_dot_product_attention(query_layer, key_layer, value_layer,  不过也没影响运行。 慢巨慢一个字一个字的蹦 GPU资源使用情况  16G显存使用率90%内存使用16G50% GLM3资源使用情况对比
http://www.hkea.cn/news/14477857/

相关文章:

  • 个人网站建设平台创建网站的目的
  • 网站建设优化方案网站文章编辑
  • 做网站代理能赚钱吗企业官网建设哪家好
  • 西安建站价格表在互联网上如何赚钱
  • iis网站属性没有asp.net太原网站推广教程
  • php建站模板专业做w7系统的网站
  • 佛山网站建设与推广wordpress 文章页面模板下载
  • 网站的建设目标是什么php 英文网站模板
  • 介绍做ppt高大上图表的网站网站建设选哪家好
  • 免费访问国外网站的应用wordpress 选择插件
  • 云梦县建设安全网站中国建设网官网登录入口
  • 南昌网站建设哪家最好哪个网站的织梦源码好
  • 做网站难么娱乐类网站开发
  • 如何设计网站建设引导页网站建设的一般过程包括哪些方面
  • 宝洁公司网站建设现状清远市清城区发布
  • 网站建设属于软件开发吗荆州网站推广怎么做
  • 建网站 域名 空间瑞安公司做网站
  • 网站开发 打标签小程序免费制作平台小程序
  • 网站建设申请费用建筑设计学什么的
  • 如何选择个人网站主题广州市民网页官网
  • 苏州建设企业网站北京牛鼻子网站建设公司
  • 郑州租赁房网站建设网站建设招商
  • 已备案个人网站做淘宝客网页升级未成年人自行离开
  • 北京旅游网站建设广东建设工程交易中心网站
  • 百度搜不到的网站商城网站建设制作
  • 制作论坛做网站360软件商店
  • 网做 网站有哪些如何做更改网站的图片
  • 哪个网站代做ppt便宜电脑公司网站模板
  • asp网站源代码下载胶州网站优化价格
  • 泉州学校网站开发网站设计公司营销crm系统