当前位置: 首页 > news >正文

做网站需不需要营业执照阿里云个人备案可以做企业网站吗

做网站需不需要营业执照,阿里云个人备案可以做企业网站吗,工作总结及2023年工作计划,保险做的好的网站有哪些内容训练生成效果评测 Fastchat Chatbot Arena推出了模型在线对战平台#xff0c;可浏览和评测模型回复质量。对战平台提供了胜率、Elo评分等评测指标#xff0c;并且可以查看两两模型的对战胜率等结果。生成回复具有随机性#xff0c;受解码超参、随机种子等因素影响#xff…训练生成效果评测 Fastchat Chatbot Arena推出了模型在线对战平台可浏览和评测模型回复质量。对战平台提供了胜率、Elo评分等评测指标并且可以查看两两模型的对战胜率等结果。生成回复具有随机性受解码超参、随机种子等因素影响因此相关评测并非绝对严谨结果仅供晾晒参考。 ⚔️ 模型竞技场http://llm-arena.ymcui.com 系统对战胜率无平局 ↓Elo评分Chinese-Alpaca-2-13B-16K86.84%1580Chinese-Alpaca-2-13B72.01%1579Chinese-Alpaca-Pro-33B64.87%1548Chinese-Alpaca-2-7B64.11%1572Chinese-Alpaca-Pro-7B62.05%1500Chinese-Alpaca-2-7B-16K61.67%1540Chinese-Alpaca-Pro-13B61.26%1567Chinese-Alpaca-Plus-33B31.29%1401Chinese-Alpaca-Plus-13B23.43%1329Chinese-Alpaca-Plus-7B20.92%1379 以上结果截至2023年9月1日。最新结果请进入⚔️竞技场进行查看。 客观效果评测C-Eval C-Eval是一个全面的中文基础模型评估套件其中验证集和测试集分别包含1.3K和12.3K个选择题涵盖52个学科。实验结果以“zero-shot / 5-shot”进行呈现。C-Eval推理代码请参考本项目GitHub Wiki LLaMA ModelsValidTestAlpaca ModelsValidTestChinese-LLaMA-2-13B40.6 / 42.738.0 / 41.6Chinese-Alpaca-2-13B44.3 / 45.942.6 / 44.0Chinese-LLaMA-2-7B28.2 / 36.030.3 / 34.2Chinese-Alpaca-2-7B41.3 / 42.940.3 / 39.5Chinese-LLaMA-Plus-33B37.4 / 40.035.7 / 38.3Chinese-Alpaca-Plus-33B46.5 / 46.344.9 / 43.5Chinese-LLaMA-Plus-13B27.3 / 34.027.8 / 33.3Chinese-Alpaca-Plus-13B43.3 / 42.441.5 / 39.9Chinese-LLaMA-Plus-7B27.3 / 28.326.9 / 28.4Chinese-Alpaca-Plus-7B36.7 / 32.936.4 / 32.3 客观效果评测CMMLU CMMLU是另一个综合性中文评测数据集专门用于评估语言模型在中文语境下的知识和推理能力涵盖了从基础学科到高级专业水平的67个主题共计11.5K个选择题。CMMLU推理代码请参考本项目GitHub Wiki LLaMA ModelsTest (0/few-shot)Alpaca ModelsTest (0/few-shot)Chinese-LLaMA-2-13B38.9 / 42.5Chinese-Alpaca-2-13B43.2 / 45.5Chinese-LLaMA-2-7B27.9 / 34.1Chinese-Alpaca-2-7B40.0 / 41.8Chinese-LLaMA-Plus-33B35.2 / 38.8Chinese-Alpaca-Plus-33B46.6 / 45.3Chinese-LLaMA-Plus-13B29.6 / 34.0Chinese-Alpaca-Plus-13B40.6 / 39.9Chinese-LLaMA-Plus-7B25.4 / 26.3Chinese-Alpaca-Plus-7B36.8 / 32.6 长上下文版模型16K评测 LongBench是一个大模型长文本理解能力的评测基准由6大类、20个不同的任务组成多数任务的平均长度在5K-15K之间共包含约4.75K条测试数据。LongBench推理代码请参考本项目GitHub Wiki Models单文档QA多文档QA摘要Few-shot学习代码补全合成任务AvgChinese-Alpaca-2-13B-16K48.126.012.823.345.521.529.5Chinese-Alpaca-2-13B38.420.012.218.046.29.024.0Chinese-Alpaca-2-7B-16K46.623.614.529.047.19.028.3Chinese-Alpaca-2-7B32.017.211.521.548.85.022.7Chinese-LLaMA-2-13B-16K37.318.13.430.813.03.017.6Chinese-LLaMA-2-13B26.714.04.416.39.85.512.8Chinese-LLaMA-2-7B-16K33.716.55.324.39.94.215.6Chinese-LLaMA-2-7B20.714.56.512.811.55.311.9 量化效果评测 以Chinese-LLaMA-2-7B为例对比不同精度下的模型大小、PPL困惑度、C-Eval效果方便用户了解量化精度损失。PPL以4K上下文大小计算C-Eval汇报的是valid集合上zero-shot和5-shot结果。 精度模型大小PPLC-EvalFP1612.9 GB9.37328.2 / 36.08-bit量化6.8 GB9.47626.8 / 35.44-bit量化3.7 GB10.13225.5 / 32.8 特别地以下是在llama.cpp下不同量化方法的评测数据供用户参考速度以ms/tok计测试设备为M1 Max。具体细节见GitHub Wiki llama.cppF16Q2_KQ3_KQ4_0Q4_1Q4_KQ5_0Q5_1Q5_KQ6_KQ8_0PPL9.12811.1079.5769.4769.5769.2409.1569.2139.1689.1339.129Size12.91G2.41G3.18G3.69G4.08G3.92G4.47G4.86G4.59G5.30G6.81GCPU Speed11742513944434851505465GPU Speed531921171820xx2526x
http://www.hkea.cn/news/14579928/

相关文章:

  • 无锡网站程序烟台seo外包
  • 广州哪些做网站的公司做网页的软件叫什么dw
  • 排版设计网站江门网站推广多少钱
  • 淘宝客网站根目录闽侯县网站建设
  • 惠来建设局网站德清淘宝网站建设
  • 做个网站多少钱一年苏州seo公司排名
  • 做网站换服务器怎么整普宁市建设局网站
  • 宁波网站建设制作方法各种浏览器的网址
  • 江苏华建建设股份有限公司网站自己的网站做弹出广告
  • 网站怎么做是满屏中信建设有限责任公司总经理
  • 如何设计网站站点淘客个人网站怎么建设
  • 网站开发环境实验报告最优的手机网站建设
  • 惠民县建设局网站重庆全网推广
  • 快速做网站流量数据统计分析千万不要报电子商务
  • 自学免费网站建设做网站技术路线
  • wordpress手机站模板衡水提供网站制作公司哪家好
  • 襄阳营销网站建设德州有做网站的
  • 图门市建设局网站做一下网站需要什么时候开始
  • 济源市建设网站镇江网站建设
  • 网站模板 使用左侧 导航 网站
  • 苏州做网站优化的公司基于大数据的精准营销
  • 湖南网站备案html网站建设心得体会
  • 服装企业网站模板网站营销外包哪家专业
  • 网站建设和微站建设的区别旅游电商网站排名
  • 衡水大型网站建设wordpress 缩略图
  • 郑州小型网站制作公司响应式网站样式图怎么做
  • 惠州做棋牌网站建设哪家便宜财务软件哪个好
  • 免费发帖网站大全网站建设公司简介范文
  • 网站建设培训哪里好网站换ip影响 百度
  • 找建网站模板网页设计师证书考试内容