[意涵团]ballball给我实习offer

2020-07-01 16:42 已编辑北京邮电大学 golang

关注

有人用过transformer框架么，请教一个问题

代码如下：

from transformers import *
import torch 
import logging
logging.basicConfig(level=logging.INFO)
bert_model_path = "../pretrain_model/bert_base_cased"
tokenizer = BertTokenizer.from_pretrained(bert_model_path)
model = BertForSequenceClassification.from_pretrained(bert_model_path)
classes = ["not paraphrase", "is paraphrase"]
sequence_0 = "The company HuggingFace is based in New York City"
sequence_1 = "Apples are especially bad for your health"
sequence_2 = "HuggingFace's headquarters are situated in Manhattan"
paraphrase = tokenizer.encode_plus(sequence_0, sequence_2, return_tensors="pt")
not_paraphrase = tokenizer.encode_plus(sequence_0, sequence_1, return_tensors="pt")
paraphrase_classification_logits = model(**paraphrase)[0]
not_paraphrase_classification_logits = model(**not_paraphrase)[0]
paraphrase_results = torch.softmax(paraphrase_classification_logits, dim=1).tolist()[0]
not_paraphrase_results = torch.softmax(not_paraphrase_classification_logits, dim=1).tolist()[0]
print("Should be paraphrase")
for i in range(len(classes)):
    print(f"{classes[i]}: {round(paraphrase_results[i] * 100)}%")
print("\nShould not be paraphrase")
for i in range(len(classes)):
    print(f"{classes[i]}: {round(not_paraphrase_results[i] * 100)}%")

预期输出格式：

Should be paraphrase not paraphrase: 10% is paraphrase: 90% Should not be paraphrase not paraphrase: 94% is paraphrase: 6%

在服务器上输出：

weight.t() size:  torch.Size([768, 3072])
input size:  torch.Size([1, 21, 3072])
weight.t() size:  torch.Size([3072, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 3072])
input size:  torch.Size([1, 21, 3072])
weight.t() size:  torch.Size([3072, 768])
#还有很多行像上面一样格式数据输出 Should be paraphrase not paraphrase: 10%  is paraphrase: 90%  Should not be paraphrase  not paraphrase: 94%  is paraphrase: 6%

求问中间输出是怎么回事，我并没有主动打印上面的信息啊，我换了好几个模型都是这样子，请问有人碰到过这样的情况么。

我去看transformer的loging信息，但是并没有发现有weight.t()这样的信息打印。去github上看issue也没发现有人碰到这样的问题。

google直接搜不到

###救救孩子吧，开学不出成果会被延毕啊啊啊啊啊。

#算法题目求助#

全部评论

推荐最新楼层

[意涵团]ballball给我实习offer

楼主

北京邮电大学 golang

是**的cuda版本的锅 更新到 cuda10就好了

点赞回复分享

发布于 2020-07-06 14:28

电子科技大学 Java

进到model = BertForSequenceClassification.from_pretrained(bert_model_path) 这里看看有没有什么打印的信息

点赞回复分享

发布于 2020-07-02 20:08

风尽起长歌

西安电子科技大学 Java

我以为我发了个帖子。。。

点赞回复分享

发布于 2020-07-02 20:02

在Five这一块颇有心得

华中科技大学算法工程师

不是框架的问题，一点点debug吧，要有耐心

点赞回复分享

发布于 2020-07-01 19:51

07-08 08:18

北京化工大学嵌入式软件开发

怎么老感觉嵌入式会步入java的后尘

我现在已经感觉嵌入式要走JAVA的老路 或者成为下一个java任务一个事物都有一个发展周期，这是规律不可避免。看懂历史的同学都应该知道，历史总是惊人的相似。理性分析java 目前就业不太好的现象：超过10年时间高速发展的互联网市场，新的市场需求、开发需求增量在急剧减少，创新业务增加乏力。所以对新人需求量不大。目前大量的市场应用已成熟，比如PC 端web开发，移动端 APP 开发，产品相当成熟。大量开源框架、技术积累、开发难度在降低，生产效率提高 ，已无需采用人海战术。作为工程师，大多数人才能力在研发（写代码），能力同质化严重。至于 大家都在讨论java 开发已无希望，主要原因还是行业转变速度太...

点赞评论收藏

分享

07-08 10:28

门头沟学院运营

望周知双休是违法的喔

我不在意啊 我怎么会在意呢 我如此热爱工作 我可以全年无休 甚至愿意自费上班的 我会把公司当家的 球球了快把我招进去吧

点赞评论收藏

分享

05-16 01:13

武汉大学系统工程师

byd给我看笑了

点赞评论收藏

分享

06-08 22:25

门头沟学院 Java

有谁遇到这情况？

跟人机一样的hr

从零开始的转码生活：这hr不会打开手机不分青红皂白给所有人群发这句话，过一会再给所有人再发一遍，这肯定会有重复的，不管，再过一会再发一遍

点赞评论收藏

分享

07-09 12:12

门头沟学院 Java

26届普联提前批开奖

5月底投简历7月初开奖收获秋招第一个offer，虽然白菜价，但至少能保底了

TP-LINK开奖132人在聊

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

滴滴

2026届秋季校招提前批

米哈游2026校园招聘

技术提前批

小红书

REDstar提前批招聘

Touch CIB

数字兴业科技挑战赛

现代汽车前瞻技术研发挑战赛

26届投递链接合集

快手

快Star-X特别技术人才计划启动

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

45646次浏览 355人参与

# 夸夸我的求职搭子 #

199760次浏览 1917人参与

# 你认为小厂实习有用吗？ #

16648次浏览 208人参与

# 说说你知道的学历厂 #

31833次浏览 188人参与

# 应届生，你找到工作了吗 #

19260次浏览 144人参与

# 三一重工求职进展汇总 #

12987次浏览 60人参与

# 计算机有哪些岗位值得去？ #

14759次浏览 142人参与

# 下班后的时间你怎么安排 #

8744次浏览 129人参与

# 你找工作的时候用AI吗？ #

16176次浏览 204人参与

# 面试尴尬现场 #

27416次浏览 181人参与

# 材料人，你们签了哪个公司 #

7134次浏览 17人参与

# 哪一瞬间觉得自己长大了 #

8048次浏览 182人参与

# 在职场上，你最讨厌什么样的同事 #

14877次浏览 151人参与

# 社会教会你的第一课 #

31881次浏览 419人参与

# 中核求职进展汇总 #

20477次浏览 152人参与

# 电网笔面经互助 #

36459次浏览 354人参与

# 简历当中有水分算不算造假？ #

25701次浏览 378人参与

# 神州信息工作体验 #

16389次浏览 75人参与

# 硬件应届生薪资是否普遍偏低？ #

75025次浏览 518人参与

# 学历贬值真的很严重吗？ #

22196次浏览 162人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务