2023-05-01 21:51 ABC Barber College (Hot Springs) Java 发布于江西

关注

迁移学习-预训练模型的保存与加载

1，模型保存和读取：

# 如果要保存最好的参数，使用: best_model_state = deepcopy(model.state_dict())
model_save_path = os.path.join('', 'model.pt')
torch.save(model.state_dict(), model_save_path)

# 模型参数读取
model = LeNet5()
model_save_path = os.path.join(model_save_dir, 'model.pt')
if os.path.exists(model_save_path):
    loaded_paras = torch.load(model_save_path)
    model.load_state_dict(loaded_paras)
    
# 也可以保存优化器等：
# model_save_path = os.path.join(model_save_dir, 'model.pt')
# torch.save({
# 'epoch': epoch,
# 'model_state_dict': model.state_dict(),
# 'optimizer_state_dict': optimizer.state_dict(),
# 'loss': loss,
# }, model_save_path)

# 读取：
checkpoint = torch.load(model_save_path) 
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict']) 
epoch = checkpoint['epoch'] 5 loss = checkpoint['loss']

2，迁移学习

按照上面的方法对模型进行保存和读取，当迁移的模型部分不同时，可以根据参数名称和大小，选择性的保留读取进来的参数：

def para_state_dict(model, model_save_dir): 
state_dict = deepcopy(model.state_dict()) 
model_save_path = os.path.join(model_save_dir, 'model.pt') 
if os.path.exists(model_save_path): 
    loaded_paras = torch.load(model_save_path) 
    for key in state_dict: # 在新的网络模型中遍历对应参数 
        if key in loaded_paras and state_dict[key].size() == loaded_paras[key].size(): 
        print("成功初始化参数:", key) 
        state_dict[key] = loaded_paras[key] 
return state_dict

全部评论

推荐最新楼层

07-16 11:51

北京邮电大学硬件开发

快手实习一周体会

首先是通勤，从学校走到公司大概 1 小时，感觉能接受。工作内容我比较喜欢，能学到东西，部门同事和 leader 都很友善，有什么不会的他们都耐心解答。食堂我常吃的一荤一素大概 15 左右，也是正常价格，后续希望能在这学到东西。总结：比上家强多了，我爱铁厂

投递快手等公司7个岗位

点赞评论收藏

分享

07-16 18:39

上海大学模拟IC设计

只能说别太离谱，考察的都是人情世故

26届校招投递进展

点赞评论收藏

分享

05-27 16:58

西安电子科技大学 Java

孩子要找不到后端实习了，恳请各位帮忙看看简历

方向 Java 后端 😭 

每晚夜里独自颤抖：西电✌🏻收割只是时间问题

点赞评论收藏

分享

07-14 15:00

深圳大学 C++

华为OD-C++开发岗

华为 od 面经 1.本人情况：目标非科班，无相关实习经历； 2.找到德科hr姐姐后，会跟你确认简历和一些相关信息，然后会发机考链接； 3.机考通过后有个性格测试，hr姐姐会给一些大致方向性的叮嘱； 4.大约一周后资格面，主要了解一下候选人背景，地域稳定性之类的，聊聊天 不涉及技术问题，正常回答即可，面之前hr姐姐会叮嘱一些注意事项； 5.技术面试有两次，一般都是项目开头，中间八股，手撕结尾，保持谦虚冷静，认真面即可； 6.主管面比较轻松，也是聊聊天； 全部通过后坐等offer，全部流程不超过一个月，hr姐姐非常给力，全程跟进，有问必答，最后还会帮忙跟公司拉扯薪资，非常负强烈推荐!

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 第一份工作应该选高薪还是热爱？ #

66873次浏览 593人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

92122次浏览 679人参与

# 秋招签约后的心态变化 #

82578次浏览 814人参与

# 听劝，这个公司值得去吗 #

486256次浏览 1700人参与

# 你觉得早上几点上班合适？ #

72419次浏览 303人参与

# 学历贬值真的很严重吗？ #

24554次浏览 174人参与

# 机械人与华为的爱恨情仇 #

120192次浏览 957人参与

# 一人推荐一个值得去的通信/硬件公司 #

186521次浏览 1859人参与

# 打工人的工作餐日常 #

53297次浏览 415人参与

# 哪些公司真双非友好？ #

15858次浏览 82人参与

# 26届的你们有几段实习？ #

44257次浏览 488人参与

# 月薪多少能在一线城市生存 #

28347次浏览 307人参与

# 双非能在秋招上岸吗？ #

221765次浏览 1172人参与

# 你以为的实习VS真实的实习 #

29972次浏览 274人参与

# 今年秋招哪家公司给的薪资最良心？ #

253000次浏览 1418人参与

# 你后悔自己读研吗？ #

20725次浏览 240人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

117967次浏览 812人参与

# 追觅科技求职进展汇总 #

18291次浏览 120人参与

# 实习想申请秋招offer，能不能argue薪资 #

149983次浏览 932人参与

# 如何KTV领导 #

62838次浏览 472人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务