当前位置：首页 > news >正文

湖北可以做网站的公司做网站开发想转行做医药销售

news 2026/4/14 17:37:13

湖北可以做网站的公司,做网站开发想转行做医药销售,做网站当站长,网络营销与管理专业是干什么的联邦学习论文复现#x1f680; 在精度的联邦学习的论文之后打算进一步开展写一个联邦学习的基础代码#xff0c;用于开展之后的相关研究#xff0c;首先就是复现一下论文中最基础也是最经典的MNIST IID(独立同分布划分) 数据集。然后由于这个联邦学习的论文是谷歌发的#…联邦学习论文复现在精度的联邦学习的论文之后打算进一步开展写一个联邦学习的基础代码用于开展之后的相关研究首先就是复现一下论文中最基础也是最经典的MNIST IID(独立同分布划分) 数据集。然后由于这个联邦学习的论文是谷歌发的所以官方的代码好像是Tensorflow的然后为了方便后续的研究我就又自己写了一个pytroch版本的。记得把代码中的路径都换成自己的前置文章联邦学习论文逐句精度https://blog.csdn.net/chrnhao/article/details/1427517006 文章目录联邦学习论文复现0.预处理流程项目文件结构1.获取MNIST数据集2.处理测试集 Create_test_datasets.py3.划分客户端样本(训练集数据) Create_client_datasets.py4.构建多客户端Dataloader init_clients.py5.模型代码 CNN.py6.训练代码 train.py6.1 导入库部分6.2 联邦学习超参数初始化6.3 Dataloader 类6.4 固定随机种子6.5 初始化获取所有客户端的dataloader6.6 加载并处理测试集6.7 初始化中心服务器模型和损失函数并迁移到GPU上6.8 client_update 客户端更新函数✨6.9 train 中心服务器训练函数✨6.10 测试代码部分6.11 开始训练绘图保存训练结果 7.训练结果8.结果对比 plot_compare_curve.py9.结束 0.预处理流程项目文件结构 Client_datasets:保存所有客户端的处理好的非图像训练集数据mnisit_test:存储测试集图片数据mnisit_test:存储训练集图片数据Test_dataset:保存测试集的处理好的非图像测试集数据Train_result:保存每种超参数组合训练后得到的准确率曲线的结果CNN.py:CNN模型文件Create_client_datasets.py:将训练集划分为多个客户端的样本Create_test_datasets.py:处理测试集图片构建测试集数据init_clients:工具代码将所有客户端的数据都处理成dataloaderplot_compare_cureve.py:绘制结果比较曲线train.py:训练代码 1.获取MNIST数据集 https://www.kaggle.com/datasets/hojjatk/mnist-dataset train-images-idx3-ubyte.gz: training set images (9912422 bytes)train-labels-idx1-ubyte.gz: training set labels (28881 bytes)t10k-images-idx3-ubyte.gz: test set images (1648877 bytes)t10k-labels-idx1-ubyte.gz: test set labels (4542 bytes) MNIST数据集原始的数据是二级制格式的文件需要通过代码将其转换成图片格式之后才能进行后一步的处理然后具体转换的代码参考了这个Github代码感谢博主。 https://www.kaggle.com/datasets/hojjatk/mnist-dataset 训练集和测试集都需要使用代码进行转换训练集和测试集分别得到10类手写数字的10个文件夹下面的图是GitHub博主的图。我自己将转换出的代码分别存在了mnist_train和mnist_test中。 2.处理测试集 Create_test_datasets.py 将测试集的中的图片用opencv读取归一化并打包成npy文件。 import os import cv2 import numpy as npMNIST_dir_test rC:\Users\Administrator\Desktop\Federated\mnist_test MNIST_test_list os.listdir(MNIST_dir_test)data_list [] label_list []for label in MNIST_test_list:label_path os.path.join(MNIST_dir_test, label)print(label, len(os.listdir(label_path)))for image in os.listdir(label_path):image_path os.path.join(label_path, image)image cv2.imread(image_path, 0)/255data_list.append([image])label_list.append(int(label))np.save(Test_dataset\MNIST_test_data.npy, data_list) np.save(Test_dataset\MNIST_test_label.npy, label_list)3.划分客户端样本(训练集数据) Create_client_datasets.py 首先在联邦学习中原论文是将mnist的训练集一共60000张图片划分到了100个客户端中每个600张图片这里有一个问题就是0-9在数据集中虽然总数是6000但是每个类别的个数不是正好6000但是划分IID数据集又需要将每个客户端上的数据的分布是相同的也就是类别数量是均匀的为了应对这种情况我采用了以下方案。第一步首先读取每个客户端的数组图片并归一化保存到一个列表中第二步用每个类别的列表的长度除以100得到每个类别数量除以100得到的商(这里回去我翻了一下小学知识)(假设一类样本数量是5978则除以100后商为59则表明他可以均匀的给100个客户端每个客户端100个样本会有一点剩余)第三步获得每个类别列表长度的数量除以100得到的余数这个余数就是每一个类别剩余的样本数量第四步首先把每个类别的的剩余样本拿出来留着之后补空第五步先将每个类别能均匀分配的样本分配到各个客户端中然后将剩余样本再顺序填补到每个客户端的数据集中。这里略微有一点点复杂想进一步理解的话需要单步运行一下。 import os import numpy as np import cv2# 创建100个客户端的文件夹 # for i in range(1, 101): # os.makedirs(os.path.join(Client_datasets, fclient_{i}), exist_okTrue)# 获取每个类别数据的图像数据 number_0 [[cv2.imread(os.path.join(mnist_train/0, i), 0) / 255] for i in os.listdir(mnist_train/0)] number_1 [[cv2.imread(os.path.join(mnist_train/1, i), 0) / 255] for i in os.listdir(mnist_train/1)] number_2 [[cv2.imread(os.path.join(mnist_train/2, i), 0) / 255] for i in os.listdir(mnist_train/2)] number_3 [[cv2.imread(os.path.join(mnist_train/3, i), 0) / 255] for i in os.listdir(mnist_train/3)] number_4 [[cv2.imread(os.path.join(mnist_train/4, i), 0) / 255] for i in os.listdir(mnist_train/4)] number_5 [[cv2.imread(os.path.join(mnist_train/5, i), 0) / 255] for i in os.listdir(mnist_train/5)] number_6 [[cv2.imread(os.path.join(mnist_train/6, i), 0) / 255] for i in os.listdir(mnist_train/6)] number_7 [[cv2.imread(os.path.join(mnist_train/7, i), 0) / 255] for i in os.listdir(mnist_train/7)] number_8 [[cv2.imread(os.path.join(mnist_train/8, i), 0) / 255] for i in os.listdir(mnist_train/8)] number_9 [[cv2.imread(os.path.join(mnist_train/9, i), 0) / 255] for i in os.listdir(mnist_train/9)]# 每个类别的样本总数除以100个客户端 first_round_number [len(number_0) // 100, len(number_1) // 100, len(number_2) // 100, len(number_3) // 100,len(number_4) // 100, len(number_5) // 100, len(number_6) // 100, len(number_7) // 100,len(number_8) // 100, len(number_9) // 100]# 每个类别剩余的样本数量 remain_number [len(number_0) % 100, len(number_1) % 100,len(number_2) % 100, len(number_3) % 100,len(number_4) % 100, len(number_5) % 100,len(number_6) % 100, len(number_7) % 100,len(number_8) % 100, len(number_9) % 100]# 获得所有客户端数据集构成的列表 number_list [number_0, number_1, number_2, number_3, number_4, number_5, number_6, number_7, number_8, number_9]# 处理剩余数据 remain_data (number_0[-remain_number[0]:] number_1[-remain_number[1]:] number_2[-remain_number[2]:] number_3[-remain_number[3]:] number_4[-remain_number[4]:] number_5[-remain_number[5]:] number_6[-remain_number[6]:] number_7[-remain_number[7]:] number_8[-remain_number[8]:] number_9[-remain_number[9]:])# 剩余数据的标签 remain_label ([0] * remain_number[0] [1] * remain_number[1] [2] * remain_number[2] [3] * remain_number[3] [4] * remain_number[4] [5] * remain_number[5] [6] * remain_number[6] [7] * remain_number[7] [8] * remain_number[8] [9] * remain_number[9])# 开始构建100个客户端的数据 for i in range(100):data []label []for index, j in enumerate(number_list):data j[i*first_round_number[index]:(i1)*first_round_number[index]]label [index] * first_round_number[index]# 将剩余的数据再补充分配到每个数据集当中data remain_data[i*len(remain_data)//100:(i1)*len(remain_data)//100]label remain_label[i*len(remain_label)//100:(i1)*len(remain_label)//100]# 缓存每个数据集print(i1,np.shape(data),np.shape(label))# 记得换成自己的路径np.save(rfC:\Users\Administrator\Desktop\Federated\Client_datasets\client_{i1}\data.npy, data, allow_pickleTrue)np.save(rfC:\Users\Administrator\Desktop\Federated\Client_datasets\client_{i1}\label.npy, label, allow_pickleTrue)4.构建多客户端Dataloader init_clients.py 在完成数据集的划分之后想要在一个电脑上模拟使用多个客户端的数据进行训练对于使用pytorch框架而言我能想到的就生成n个dataloadern就是客户端样本的数量然后将生成的n个dataloader都存到一个列表里传给客户端然后客户端如果选择到了用哪个客户端的数据就用哪个客户端的数据来训练。所以就有了一下的pytorch的Dataloader的代码版本基本逻辑呢就是读取所有的客户端文件夹中的数据然后都封装成pytorch的dataloder这里正好就可以把联邦学习中的每个客户端本地训练的参数量B传进去联邦学习里论文的B就是clients_dataloader中的batch_size参数。这个代码作为一个脚本在项目文件夹的目录中我命名为了init_clients.py import os import numpy as np import torch from torch.utils.data import DataLoader, Datasetclass CustomDataset(Dataset):def __init__(self, data):self.len len(data)self.x_data torch.from_numpy(np.array(list(map(lambda x: x[0], data)), dtypenp.float32))self.y_data torch.from_numpy(np.array(list(map(lambda x: x[-1], data)))).squeeze().long()def __getitem__(self, index):return self.x_data[index], self.y_data[index]def __len__(self):return self.lendef clients_dataloader(batch_size60):dataloader_list []dir_path os.listdir(Client_datasets)for dir in dir_path:data_path os.path.join(Client_datasets, dir, data.npy)label_path os.path.join(Client_datasets, dir, label.npy)data np.load(data_path)label np.load(label_path)dataset [[i, j] for i, j in zip(data, label)]dataloader DataLoader(CustomDataset(dataset), shuffleTrue, batch_sizebatch_size)dataloader_list.append(dataloader)return dataloader_listif __name__ __main__:dataloaders clients_dataloader()if dataloaders:print(fLoaded {len(dataloaders)} client dataloaders.)else:print(No dataloaders loaded.) 5.模型代码 CNN.py 根据联邦学习论文我选了MNISIT数据集中的CNN模型进行复现也是非常简单两个卷积层然后跟着两个最大池化层最后接一个线性层然后再加个ReLU。 import torchclass CNN(torch.nn.Module):def __init__(self, in_channels1, classes10):super(CNN, self).__init__()self.conv1 torch.nn.Conv2d(in_channels, 32, kernel_size5)self.max_pool1 torch.nn.MaxPool2d(2, 2)self.conv2 torch.nn.Conv2d(32, 64, kernel_size5)self.max_pool2 torch.nn.MaxPool2d(2, 2)self.linear torch.nn.Linear(64 * 4 * 4, classes)self.relu torch.nn.ReLU()def forward(self, x):x self.conv1(x)x self.max_pool1(x)x self.conv2(x)x self.max_pool2(x)x x.view(x.size(0), -1)x self.linear(x)x self.relu(x)return xif __name__ __main__:model CNN(3, 10)print(model)x torch.randn((1, 3, 28, 28))y model(x)print(y.shape)print(y)6.训练代码 train.py 训练代码的内容确实是先对来说难一些我这里先给完整代码然后我再逐个部分进行解释。 import os import matplotlib.pyplot as plt import numpy as np import torch from torch.utils.data import DataLoader, Dataset from init_clients import clients_dataloader import random from CNN import CNN # 解决出现libiomp5md.dll缺导致无法绘图的错误 os.environ[KMP_DUPLICATE_LIB_OK] True C 0.1 #参与训练的客户端的比例 E 5 #每个客户端本地训练的轮数 B 600 #每个客户的BatchSize大小 B600 等效于论文中B∞client_num 100# Test_dataset class class Dataset(Dataset):def __init__(self, data):self.len len(data)self.x_data torch.from_numpy(np.array(list(map(lambda x: x[0], data)), dtypenp.float32))self.y_data torch.from_numpy(np.array(list(map(lambda x: x[-1], data)))).squeeze().long()def __getitem__(self, index):return self.x_data[index], self.y_data[index]def __len__(self):return self.len# 设置随机种子 def set_random_seed(seed_value100):random.seed(seed_value) # Fixed Python built-in random generatornp.random.seed(seed_value) # Fixed NumPy random generatortorch.manual_seed(seed_value) # Fixed PyTorch random generatorif torch.cuda.is_available():torch.cuda.manual_seed(seed_value)torch.cuda.manual_seed_all(seed_value) # If multiple GPUs are usedtorch.backends.cudnn.deterministic Truetorch.backends.cudnn.benchmark Falseset_random_seed(100)# 初始化客户端dataloader 用100个客户端的数据生成Dataloader client_dataloader_list clients_dataloader(B)# 加载测试数据集 data_test np.load(Test_dataset/MNIST_test_data.npy) label_test np.load(Test_dataset/MNIST_test_label.npy) test_dataset [[i, j] for i, j in zip(data_test, label_test)]# 将测试集数据处理成Dataloder Test_dataset Dataset(test_dataset) testloader DataLoader(Test_dataset, shuffleTrue, batch_size256)device torch.device(cuda:0 if torch.cuda.is_available() else cpu)# 初始化模型和损失函数并将模型和损失函数移到GPU上 model CNN(in_channels1, classes10) model.to(device) criterion torch.nn.CrossEntropyLoss() criterion.to(device)def client_update(client_num, E, model_parameter):客户端更新参数:param client_num: 选择到的客户端的编号:param E: 本地训练的epoch轮数:param model_parameter: 中心服务器发给客户端的模型参数:return: 在该客户端上训练好的模型参数dataloader client_dataloader_list[client_num] # 获取选择到客户端的dataloderclient_model CNN().to(device) # 加载一个空模型client_model.load_state_dict(model_parameter) # 加载中心服务器发的模型参数client_model.train() # 将模型变为训练模式# optimizer torch.optim.SGD(client_model.parameters(), lr0.01, momentum0.9)optimizer torch.optim.SGD(client_model.parameters(), lr0.01)for i in range(E):correct 0total 0for data, label in dataloader:train_data_value, train_data_label data.to(device), label.to(device)train_data_label_pred client_model(train_data_value)loss criterion(train_data_label_pred, train_data_label)optimizer.zero_grad()loss.backward()optimizer.step()_, predicted torch.max(train_data_label_pred, 1)total train_data_label.size(0)correct (predicted train_data_label).sum().item()accuracy 100 * correct / totalprint(fClient:{client_num},Epoch {i1}/{E}, Accuracy: {accuracy:.2f}%, Loss: {loss.item()})# 返回客户端训练模型的模型参数return client_model.state_dict()def train(client_num, C, E):model.train() # 将客户端模型变为训练模型send_model_parameter model.state_dict() # 然后获取即将分发给各个客户端的模型的权重random_numbers random.sample(range(client_num), int(client_num*C)) # 按照比例随机选择出用于本轮训练的模型的索引编号client_return_parameter_list [] # 初始化一个列表用与保存每个客户端本地训练好之后返回的模型参数for client in random_numbers: # 遍历所有的选择到的客户端的编号(索引号)model_parameter client_update(client, EE, model_parametersend_model_parameter) # 返回每个客户端训练好的模型权重client_return_parameter_list.append(model_parameter) # 将每一个客户端的模型权重加载到列表中# 先生成一个参数都为0的模型参数的参数字典用于之后将客户端返回的模型参数都加到改字典上aggregated_model_parameter {key: torch.zeros_like(value, dtypetorch.float32) for key, value in send_model_parameter.items()}# 将所有客户端模型的权重都加权求和for client_param in client_return_parameter_list:for key in aggregated_model_parameter:aggregated_model_parameter[key] client_param[key] * (1 / int(client_num*C))# 将求和好的权重加载给中心服务器模型用于下一轮的发送model.load_state_dict(aggregated_model_parameter)return modeldef test():model.eval()test_correct 0test_total 0with torch.no_grad():for testdata in testloader:test_data_value, test_data_label testdatatest_data_value, test_data_label test_data_value.to(device), test_data_label.to(device)test_data_label_pred model(test_data_value)_, test_predicted torch.max(test_data_label_pred.data, dim1)test_total test_data_label.size(0)test_correct (test_predicted test_data_label).sum().item()test_acc round(100 * test_correct / test_total, 3)print(fTest Accuracy: {test_acc:.2f}%)return test_accif __name__ __main__:test_accuracies []epochs 1000for i in range(epochs):print(fEpoch:{i}——,end)train(client_num, C, E)test_acc test()test_accuracies.append(test_acc)# Plotting the test accuracy curveplt.plot(range(1, epochs 1), test_accuracies, markero, linestyle-, colorb)plt.xlabel(Epoch)plt.ylabel(Test Accuracy (%))plt.title(fTest Accuracy vs. Epoch (C{C}, E{E}, B{B}))plt.grid(True)plt.show()np.save(rfTrain_result/C{C}B{B}E{E}.npy, test_accuracies) 6.1 导入库部分除了其他常规部分这里值得提的是from init_clients import clients_dataloader这句是需要导入我们自己写的代码from CNN import CNN这部分是导入自己的模型。 import os import matplotlib.pyplot as plt import numpy as np import torch from torch.utils.data import DataLoader, Dataset from init_clients import clients_dataloader import random from CNN import CNN # 解决出现libiomp5md.dll缺导致无法绘图的错误 os.environ[KMP_DUPLICATE_LIB_OK] True 6.2 联邦学习超参数初始化这BCE三个参数对应的就是联邦学习里最重要的三个超参数。然后这里需要多说的是这里为什么要初始化客户端数量因为联邦学习在整个客户端的模型权重部分每个客户端提供的模型参数需要乘以该客户端的数据数量除以全部客户端所持有的数据数量的比例的一个权重而在该任务中由于每个客户端的所持有的数据量都一致所以乘以的权重数量为(1 / int(client_num*C))也就是选了少个客户端权重就是多少个客户端分之1。 C 0.1 #参与训练的客户端的比例 E 5 #每个客户端本地训练的轮数 B 600 #每个客户的BatchSize大小 B600 等效于论文中B∞ client_num 1006.3 Dataloader 类这个是给测试集数据生成dataloader的一个Dataset类和之前划分客户端的时候用的类一样这个属于pytorch基础部分。 # Test_dataset class class Dataset(Dataset):def __init__(self, data):self.len len(data)self.x_data torch.from_numpy(np.array(list(map(lambda x: x[0], data)), dtypenp.float32))self.y_data torch.from_numpy(np.array(list(map(lambda x: x[-1], data)))).squeeze().long()def __getitem__(self, index):return self.x_data[index], self.y_data[index]def __len__(self):return self.len6.4 固定随机种子在联邦学习论文中有专门的论述使用相同的随机种子初始化的模型使用不同的客户端数据集进行训练然后加和得到的新模型会比单独两个模型对与测试集的效果更好。 # 设置随机种子 def set_random_seed(seed_value100):random.seed(seed_value) # Fixed Python built-in random generatornp.random.seed(seed_value) # Fixed NumPy random generatortorch.manual_seed(seed_value) # Fixed PyTorch random generatorif torch.cuda.is_available():torch.cuda.manual_seed(seed_value)torch.cuda.manual_seed_all(seed_value) # If multiple GPUs are usedtorch.backends.cudnn.deterministic Truetorch.backends.cudnn.benchmark Falseset_random_seed(100) 6.5 初始化获取所有客户端的dataloader 这个就是我们之前写的代码B就是联邦学习论文中的每个客户端的使用的本地的mini_batch的大小这个代码返回的client_dataloader_list是包含所有客户端的数据处理成的dataloader的列表。 # 初始化客户端dataloader 用100个客户端的数据生成Dataloader client_dataloader_list clients_dataloader(B)6.6 加载并处理测试集这步就是将测试集的数据和标签打包到一起然后输入Dataset然后实例化出一个Test_dataset然后再生成一个dataloader这里dataloader的shuffle和batch_size都不是很重要都不会影响最终的结果正常填一差不多合适的值就行。 # 加载测试数据集 data_test np.load(Test_dataset/MNIST_test_data.npy) label_test np.load(Test_dataset/MNIST_test_label.npy) test_dataset [[i, j] for i, j in zip(data_test, label_test)]# 将测试集数据处理成Dataloder Test_dataset Dataset(test_dataset) testloader DataLoader(Test_dataset, shuffleTrue, batch_size256)6.7 初始化中心服务器模型和损失函数并迁移到GPU上 device torch.device(cuda:0 if torch.cuda.is_available() else cpu) model CNN(in_channels1, classes10) model.to(device) criterion torch.nn.CrossEntropyLoss() criterion.to(device)6.8 client_update 客户端更新函数✨ 这个逻辑说起来比较复杂我用GPT帮我解释下然后我再微调一下具体的解释在代码的下面。 def client_update(client_num, E, model_parameter):客户端更新参数:param client_num: 选择到的客户端的编号:param E: 本地训练的epoch轮数:param model_parameter: 中心服务器发给客户端的模型参数:return: 在该客户端上训练好的模型参数dataloader client_dataloader_list[client_num] # 获取选择到客户端的dataloderclient_model CNN().to(device) # 加载一个空模型client_model.load_state_dict(model_parameter) # 加载中心服务器发的模型参数client_model.train() # 将模型变为训练模式# optimizer torch.optim.SGD(client_model.parameters(), lr0.01, momentum0.9)optimizer torch.optim.SGD(client_model.parameters(), lr0.01)for i in range(E):correct 0total 0for data, label in dataloader:train_data_value, train_data_label data.to(device), label.to(device)train_data_label_pred client_model(train_data_value)loss criterion(train_data_label_pred, train_data_label)optimizer.zero_grad()loss.backward()optimizer.step()_, predicted torch.max(train_data_label_pred, 1)total train_data_label.size(0)correct (predicted train_data_label).sum().item()accuracy 100 * correct / totalprint(fClient:{client_num},Epoch {i1}/{E}, Accuracy: {accuracy:.2f}%, Loss: {loss.item()})# 返回客户端训练模型的模型参数return client_model.state_dict() 这段代码是一个客户端在联邦学习过程中更新模型参数的逻辑实现。联邦学习是一种分布式的机器学习方法其中多个客户端独立地在本地数据上训练模型然后将更新后的模型参数发送到中心服务器进行聚合从而保护数据隐私。让我们逐行详细解释这段代码。 # 客户端更新参数函数 def client_update(client_num, E, model_parameter):客户端更新参数:param client_num: 选择到的客户端的编号:param E: 本地训练的epoch轮数:param model_parameter: 中心服务器发给客户端的模型参数:return: 在该客户端上训练好的模型参数这段代码定义了一个函数 client_update它用于更新客户端模型的参数。函数的参数说明如下 client_num: 选择到的客户端的编号即具体是哪一个客户端。E: 本地训练的 epoch 轮数即在每个客户端上训练多少次。model_parameter: 中心服务器发送给客户端的初始模型参数。函数的目的是在该客户端上使用本地数据训练模型然后返回训练后的模型参数。 dataloader client_dataloader_list[client_num] # 获取选择到客户端的dataloder从 client_dataloader_list 中获取特定客户端的 dataloader。client_dataloader_list 是一个列表其中存储了每个客户端的数据加载器。dataloader 用于提供该客户端的训练数据。 client_model CNN().to(device) # 加载一个空模型创建一个新的空模型使用名为 CNN 的神经网络结构这里假设 CNN 是一个定义好的卷积神经网络。然后将模型转移到指定的计算设备device可能是 GPU 或 CPU 上。 client_model.load_state_dict(model_parameter) # 加载中心服务器发的模型参数将中心服务器发送过来的 model_parameter 加载到模型中。这样客户端的模型从中心服务器的初始模型参数开始训练。 client_model.train() # 将模型变为训练模式将模型设置为训练模式。这在 PyTorch 中是必要的因为模型在训练和评估模式下的行为有所不同例如批归一化和 dropout 层的行为。 # optimizer torch.optim.SGD(client_model.parameters(), lr0.01, momentum0.9)optimizer torch.optim.SGD(client_model.parameters(), lr0.01)这里定义了一个优化器用于更新模型参数。使用的是随机梯度下降SGD优化器学习率 lr 为 0.01。代码注释掉了包含 momentum 参数的版本momentum 可以加速收敛但在此处没有使用。 for i in range(E):correct 0total 0开始一个循环循环次数为 E即 epoch 的数量。每次 epoch 代表对整个训练数据集进行一次完整的训练。初始化变量 correct 和 total用于统计模型的预测准确率。 for data, label in dataloader:train_data_value, train_data_label data.to(device), label.to(device)train_data_label_pred client_model(train_data_value)遍历该客户端的 dataloader逐批次地获取数据和标签。将数据和标签移到指定设备GPU 或 CPU上然后用模型对输入数据 train_data_value 进行预测得到 train_data_label_pred。 loss criterion(train_data_label_pred, train_data_label)计算损失criterion 是损失函数用于评估模型预测与真实标签之间的差异。 optimizer.zero_grad()loss.backward()optimizer.step()这是标准的反向传播与梯度更新步骤 optimizer.zero_grad()在每次反向传播之前将所有参数的梯度置为零避免梯度累积。loss.backward()计算损失相对于模型参数的梯度。optimizer.step()根据计算出的梯度更新模型参数。 _, predicted torch.max(train_data_label_pred, 1)total train_data_label.size(0)correct (predicted train_data_label).sum().item()这里进行预测的评估 torch.max(train_data_label_pred, 1)找出每个样本的最大值的索引即模型预测的类别。total 用于累计总的样本数量。correct 用于累计正确预测的数量即预测值与真实标签相同的样本数量。 accuracy 100 * correct / totalprint(fClient:{client_num},Epoch {i1}/{E}, Accuracy: {accuracy:.2f}%, Loss: {loss.item()})计算本地训练的准确率并输出每个 epoch 的信息包括客户端编号、当前 epoch、准确率和损失值。 # 返回客户端训练模型的模型参数return client_model.state_dict()函数返回更新后的模型参数即客户端在本地数据上训练完成后的模型参数以 state_dict 的形式返回。该函数用于实现联邦学习中客户端的本地模型训练过程。中心服务器发送模型参数到客户端客户端用这些参数作为初始模型进行本地数据训练。客户端训练完成后将更新后的模型参数返回给服务器以便进一步聚合 6.9 train 中心服务器训练函数✨ 中心服务器的代码是整个联邦学习代码核心的核心也是我自己调试了最长时间的部分整体也是让GPT给解释下。 def train(client_num, C, E):model.train() # 将客户端模型变为训练模型send_model_parameter model.state_dict() # 然后获取即将分发给各个客户端的模型的权重random_numbers random.sample(range(client_num), int(client_num*C)) # 按照比例随机选择出用于本轮训练的模型的索引编号client_return_parameter_list [] # 初始化一个列表用与保存每个客户端本地训练好之后返回的模型参数for client in random_numbers: # 遍历所有的选择到的客户端的编号(索引号)model_parameter client_update(client, EE, model_parametersend_model_parameter) # 返回每个客户端训练好的模型权重client_return_parameter_list.append(model_parameter) # 将每一个客户端的模型权重加载到列表中# 先生成一个参数都为0的模型参数的参数字典用于之后将客户端返回的模型参数都加到改字典上aggregated_model_parameter {key: torch.zeros_like(value, dtypetorch.float32) for key, value in send_model_parameter.items()}# 将所有客户端模型的权重都加权求和for client_param in client_return_parameter_list:for key in aggregated_model_parameter:aggregated_model_parameter[key] client_param[key] * (1 / int(client_num*C))# 将求和好的权重加载给中心服务器模型用于下一轮的发送model.load_state_dict(aggregated_model_parameter)return model这段代码是中心服务器在联邦学习过程中分发模型参数并聚合客户端返回的模型参数的实现。联邦学习的目标是让多个客户端使用本地数据独立训练模型然后服务器聚合客户端的更新从而提升整体模型性能并保持数据隐私。下面我们逐行详细解释这段代码。 # 中心服务器训练模型的函数 def train(client_num, C, E):model.train() # 将客户端模型变为训练模型send_model_parameter model.state_dict() # 然后获取即将分发给各个客户端的模型的权重该函数名为 train用于执行联邦学习中的模型聚合过程。 client_num: 表示总客户端数量。C: 表示客户端参与比例决定每轮训练中选择的客户端数。E: 本地训练的 epoch 轮数。首先将中心服务器模型设为训练模式 (model.train())然后通过 model.state_dict() 获取中心服务器模型的当前参数这些参数将被分发给客户端。 random_numbers random.sample(range(client_num), int(client_num*C)) # 按照比例随机选择出用于本轮训练的模型的索引编号client_return_parameter_list [] # 初始化一个列表用于保存每个客户端本地训练好之后返回的模型参数random_numbers 使用 random.sample() 随机选择一定数量的客户端client_num * C来参与本轮的训练。client_num * C 是根据参与比例选择的客户端数量。client_return_parameter_list 初始化为空列表用于保存每个客户端本地训练后返回的模型参数。 for client in random_numbers: # 遍历所有的选择到的客户端的编号(索引号)model_parameter client_update(client, EE, model_parametersend_model_parameter) # 返回每个客户端训练好的模型权重client_return_parameter_list.append(model_parameter) # 将每一个客户端的模型权重加载到列表中对于每个被选择的客户端调用 client_update 函数来进行本地训练传入客户端编号、epoch 数量以及要发送的模型参数。client_update 返回训练后的模型参数将这些参数添加到 client_return_parameter_list 中。 # 先生成一个参数都为0的模型参数的参数字典用于之后将客户端返回的模型参数都加到该字典上aggregated_model_parameter {key: torch.zeros_like(value, dtypetorch.float32) for key, value in send_model_parameter.items()}初始化一个 aggregated_model_parameter 字典包含所有模型参数的键且每个键的值都初始化为与对应原始模型参数相同形状的零张量。这个字典将用于累加各客户端返回的模型参数。 # 将所有客户端模型的权重都加权求和for client_param in client_return_parameter_list:for key in aggregated_model_parameter:aggregated_model_parameter[key] client_param[key] * (1 / int(client_num*C))遍历 client_return_parameter_list对每个客户端返回的模型参数进行聚合。对于每个参数键将所有客户端的相应参数值按比例累加比例为每个客户端权重的平均值1 / (client_num * C)。 # 将求和好的权重加载给中心服务器模型用于下一轮的发送model.load_state_dict(aggregated_model_parameter)return model将聚合后的模型参数加载到中心服务器的模型中为下一轮联邦学习做准备。最后返回更新后的中心服务器模型。该函数用于联邦学习中的中心服务器模型训练通过分发初始模型参数、收集客户端的更新并聚合这些更新来提升全局模型的性能。在每一轮中随机选择一部分客户端对其本地数据进行训练然后聚合各客户端返回的模型参数。聚合后更新中心服务器的模型参数以用于下一轮联邦学习。 6.10 测试代码部分这个就是基础的计算测试集准确率的代码部分也是让GPT解释一下。 def test():model.eval()test_correct 0test_total 0with torch.no_grad():for testdata in testloader:test_data_value, test_data_label testdatatest_data_value, test_data_label test_data_value.to(device), test_data_label.to(device)test_data_label_pred model(test_data_value)_, test_predicted torch.max(test_data_label_pred.data, dim1)test_total test_data_label.size(0)test_correct (test_predicted test_data_label).sum().item()test_acc round(100 * test_correct / test_total, 3)print(fTest Accuracy: {test_acc:.2f}%)return test_acc模型设为评估模式 model.eval() # 将模型设为评估模式model.eval() 用于将模型设置为评估模式。这在 PyTorch 中很重要因为评估模式会影响像 dropout 和 batch normalization 这样的层使其在推理阶段使用训练时的参数而不是随机性。 test_correct 0 # 初始化正确预测数量test_total 0 # 初始化总测试样本数量初始化两个变量 test_correct 和 test_total分别用于记录正确预测的样本数量和测试样本的总数量。 with torch.no_grad(): # 在测试时不需要计算梯度提升效率with torch.no_grad() 用于禁用梯度计算以减少内存消耗和加快推理速度因为在测试和推理阶段不需要反向传播。 for testdata in testloader: # 遍历所有测试数据test_data_value, test_data_label testdatatest_data_value, test_data_label test_data_value.to(device), test_data_label.to(device)遍历测试数据集 testloader获取每个批次的测试数据和对应标签。然后将这些数据和标签移到计算设备如 GPU上。 test_data_label_pred model(test_data_value) # 使用模型对测试数据进行预测_, test_predicted torch.max(test_data_label_pred.data, dim1) # 获取预测值的最大概率索引使用模型对测试数据进行预测得到每个样本的预测结果 test_data_label_pred。使用 torch.max() 找到预测结果中每个样本的最大概率的索引即模型预测的类别。 test_total test_data_label.size(0) # 累加测试样本的数量test_correct (test_predicted test_data_label).sum().item() # 统计正确预测的数量test_total 累加当前批次的测试样本数量。test_correct 通过比较预测值和真实标签统计正确预测的样本数量。 test_acc round(100 * test_correct / test_total, 3) # 计算测试集的准确率print(fTest Accuracy: {test_acc:.2f}%) # 打印测试集的准确率return test_acc # 返回测试集的准确率计算测试集的准确率并将其四舍五入到小数点后三位。最后打印并返回测试准确率。该函数用于联邦学习中的中心服务器对聚合后的模型进行测试以评估其性能。测试过程中模型被设置为评估模式禁用梯度计算以提高效率。函数通过遍历整个测试数据集来统计预测的正确性并计算最终的准确率。 6.11 开始训练绘图保存训练结果这里由于我们的随机种子的固定的所以我们是按照不同的超参数配置来命名保存训练文件的。 if __name__ __main__:test_accuracies []epochs 1000for i in range(epochs):train(client_num, C, E)test_acc test()print(fEpoch:{i}——, end)test_accuracies.append(test_acc)# Plotting the test accuracy curveplt.plot(range(1, epochs 1), test_accuracies, markero, linestyle-, colorb)plt.xlabel(Epoch)plt.ylabel(Test Accuracy (%))plt.title(fTest Accuracy vs. Epoch (C{C}, E{E}, B{B}))plt.grid(True)plt.show()np.save(rfTrain_result/C{C}B{B}E{E}.npy, test_accuracies)7.训练结果训练之后的结果如下可以把client_updat 中的打印每个客户端每轮训练准确率这块注释掉不然一致刷刷打印看不清还占用不少时间。 8.结果对比 plot_compare_curve.py import matplotlib.pyplot as plt import numpy as npline1 np.load(Train_result/C0.1B10E5.npy) line2 np.load(Train_result/C0.1B50E5.npy) line3 np.load(Train_result/C0.1B100E5.npy) line4 np.load(Train_result/C0.1B600E1.npy) line5 np.load(Train_result/C0.1B600E5.npy) line6 np.load(Train_result/C0.2B600E5.npy) line7 np.load(Train_result/C1B600E5.npy)plt.plot(line1, linewidth3.0,labelC0.1,B10,E5) plt.plot(line2, linewidth3.0,labelC0.1,B50,E5) plt.plot(line3, linewidth3.0,labelC0.1,B100,E5) plt.plot(line4, linewidth3.0,labelC0.1,B∞,E1) plt.plot(line5, linewidth3.0,labelC0.1,B∞,E5) plt.plot(line6, linewidth3.0,labelC0.2,B∞,E5) plt.plot(line7, linewidth3.0,labelC1,B∞,E5)plt.grid() plt.legend()plt.xlabel(Tran epoch) plt.ylabel(Accuracy) plt.title(Federated Learning)plt.show() 9.结束这个代码从精度联邦学习论文到复现也是花了不少时间然后如果不想复制粘贴了手懒了的话可以到CSDN推广的公众号浩浩的科研笔记中buy如果是学弟学妹的话给我私信我也会发你一份。

查看全文

http://www.hkea.cn/news/14263903/