当前位置: 首页 > news >正文

关于网站开发的论文自助建站凡科网

关于网站开发的论文,自助建站凡科网,织梦网站模板使用教程,百度推广在哪里判断选择什么模型#xff0c;什么量化方案#xff0c;什么推理框架#xff0c;最基础的知识就是如何评估自己的模型以及推理平台。 模型衡量标准 衡量一个模型的最直接标准就是运算速度#xff0c;但是运算速度是无法计算的#xff0c;所以定义了一些间接标准来推测模型的… 判断选择什么模型什么量化方案什么推理框架最基础的知识就是如何评估自己的模型以及推理平台。 模型衡量标准 衡量一个模型的最直接标准就是运算速度但是运算速度是无法计算的所以定义了一些间接标准来推测模型的运算速度。这些标准不仅仅可以用来选择模型的量化方案在设计模型时也应该有所参考。 模型计算量FLOPs Floating point operations浮点运算数量代表一次推理需要的浮点运算次数 注意不要与FLOPS混淆FLOPS是floating point operations per second指芯片每秒浮点运算数量用于衡量芯片的运算能力。 例如对于一个普通CNN卷积层输入尺寸为 C o u t × H × W C_{out}\times H\times W Cout​×H×W输出尺寸相同卷积核尺寸 K 3 K3 K3添加偏置 b i a s bias bias 一次卷积的运算量 乘法: C i n K 2 C_{in} K^2 Cin​K2加法: C i n ( K 2 − 1 ) ( C i n − 1 ) 1 C i n K 2 C_{in}(K^2-1)(C_{in}-1)1C_{in}K^2 Cin​(K2−1)(Cin​−1)1Cin​K2 输出尺寸 C o u t × H × W C_{out}\times H\times W Cout​×H×W中的每个像素点都是一次卷积运算量共计 2 C i n C o u t H W × K 2 2C_{in}C_{out}HW\times K^2 2Cin​Cout​HW×K2 计算方法的不同以及是否添加bias导致算出来的结果可能不完全一样无所谓FLOPs这种就跟算法中的复杂度O(n)差不多常数不会对结果产生数量级的影响。 FLOPs只是一个衡量标准还有其他的衡量标准例如MACCsmultiply-accumulate operations乘-加操作次数一次乘法一次加法为一个MACCsMACCs 大约是 FLOPs 的一半。 模型参数量parameters 顾名思义模型的参数总量 例如对于普通CNN卷积层一共有 C i n C o u t C_{in}C_{out} Cin​Cout​个卷积核参数量 C i n C o u t × K 2 C_{in}C_{out}\times K^2 Cin​Cout​×K2 模型内存访问代价MAC 一次前向推理的过程中模型内存交换的总量体现了模型的空间复杂度。 模型计算强度 I F L O P s M A C I\frac{FLOPs}{MAC} IMACFLOPs​表示每次内存交换对应多少次浮点运算计算强度越大模型内存利用率越高 模型量化就约等于是运算量不变但是每次运算本来要读取fp324个字节现在换成了读取int81个字节MAC降低了模型计算强度提高了。 推理平台衡量标准 算力FLOPS 每秒浮点数运算次数(用 π \pi π来表示) 带宽 每秒的内存交换量(用 β \beta β表示) 计算强度上限 I m a x π β I_{max}\frac{\pi}{\beta} Imax​βπ​ 理论上模型的计算强度刚好达到推理平台的计算强度上限时性能最佳这个理论最佳性能称为roof-line。计算强度低于 I m a x I_{max} Imax​时被称为带宽瓶颈区这时推理平台的性能没有完全发挥出来性能的上限取决于模型的计算强度计算强度高于 I m a x I_{max} Imax​时称为计算瓶颈区平台的算力得到了充分利用。 不过想要达到roof-line不是光考虑模型的计算量和内存访问代价就够的。因为实际计算过程中还有除算力和带宽之外的其他重要因素它们也会影响模型的实际性能这是 Roofline Model 未考虑到的。例如矩阵乘法会因为 cache 大小的限制、GEMM 实现的优劣等其他限制导致你几乎无法达到 Roofline 模型所定义的边界屋顶。 GEMM指通用矩阵乘法这个在后面的blog中我们也要讲到多年来数学家和计算机科学家都在努力优化矩阵乘法但是进展不大最近清华姚班大佬发了一篇paper被称为十年来矩阵乘法的最大优化有空可以读一下 论文地址https://epubs.siam.org/doi/10.1137/1.9781611977912.134 多年来矩阵乘法优化算法的发展历程 pytorch社区中的一篇讲解矩阵乘法的bloghttps://pytorch.org/blog/inside-the-matrix/ 解放双手 这么复杂的运算自然不会是考我们人手工计算然后评估模型实际上有很多用于评估模型的库实践如下 pytorch自行计算 如果只是评估模型参数量不需要进行借助工具直接两行代码就搞定 from torchvision.models import resnet50model resnet50() total sum([param.nelement() for param in model.parameters()]) print(parameter:%fM % (total/1e6))Torchstat 统计模型的参数量、计算量、访存量等指标且会针对模型的每层指标进行打印部分指标与常见含义不同具体会结合yolov5的指标进行介绍只对常见网络层进行统计安装方法如下 pip install torchstat使用方法如下 import torch import torchvision.models as models from torchstat import statmodel models.resnet50(pretrainedTrue)# 使用torchstat的stat函数来分析模型 stat(model, (3, 224, 224))Thop top这个词在计算机领域很常见很多关系到性能的都会有top这个词例如Linux平台下的性能管理工具topJetson中的性能检测工具jtop。这是为啥呢不懂。 统计模型的参数量和计算量部分指标与常见含义不同具体会结合yolov5的指标进行介绍只对常见网络层进行统计安装方法如下 pip install thop使用方法如下 from torchvision.models import resnet50 from thop import profile model resnet50() input torch.randn(1, 3, 224, 224) flops, params profile(model, inputs(input, )) print(FLOPs, str(flops/1e9) {}.format(G)) print(params, str(params/1e6) {}.format(M))更复杂的使用建议用到了再去翻文档学习工具类的提前学习没有意义。 如果感觉有帮助点赞收藏关注thanks
http://www.hkea.cn/news/14496075/

相关文章:

  • 太原cms建站南宁企业网站制作模板
  • 新津网站建设政务服务网站建设整改报告
  • wordpress多站点在上海做网站
  • 河南郑州广告公司网站建设wordpress如何设置注册用户名大于4个字符
  • 营销网站首页设计网络seo关键词优化技术
  • 百度建一个网站多少钱天津建设工程信息网渤海油田
  • 一流的聊城做网站费用2018建设网站
  • app软件下载网站免费进入最全做暖暖网站
  • 纪检网站建设计划保定市住房和城乡建设厅网站
  • ipv6改造 网站怎么做6大连德泰建设
  • 西安+美院+网站建设中山网站seo优化
  • 南宁公司网站建设dw旅游网站模板
  • 庆阳建设局网站WordPress搜索词记录
  • 图列说明网站开发的流程网站建设需要什么专业
  • 网站数字化建设怎么寻找做有意做网站的客户
  • 建设银行网站修改手机号建设网站需要哪些东西
  • 网站黑链xxx网站策划书
  • 咸阳 网站建设鲜花网网站开发的意义
  • 世界总人口实时数据黑锋网seo
  • asp网站伪静态西安网站制作中心
  • 自己如何建设网站首页开发帮官方网站
  • 网站建设的种类黑龙江最新通知今天
  • 五家渠网站建设eclipse tomcat 网站开发
  • 建设网站那家好什么是网络推广
  • 哪个软件可以做网站平面设计与广告设计
  • 重庆官方推广网站手机网站静态模板下载
  • 公司网站制作投标有哪些做微博长图网站
  • 贷款织梦网站模版小说网站快速做排名
  • 济南网站制作哪家最好一个网站的建设需要什么时候开始
  • 做刷赞网站能赚钱吗什么网站帮人做网页