[意涵团]ballball给我实习offer

2020-07-01 16:42 已编辑北京邮电大学 golang

关注

有人用过transformer框架么，请教一个问题

代码如下：

from transformers import *
import torch 
import logging
logging.basicConfig(level=logging.INFO)
bert_model_path = "../pretrain_model/bert_base_cased"
tokenizer = BertTokenizer.from_pretrained(bert_model_path)
model = BertForSequenceClassification.from_pretrained(bert_model_path)
classes = ["not paraphrase", "is paraphrase"]
sequence_0 = "The company HuggingFace is based in New York City"
sequence_1 = "Apples are especially bad for your health"
sequence_2 = "HuggingFace's headquarters are situated in Manhattan"
paraphrase = tokenizer.encode_plus(sequence_0, sequence_2, return_tensors="pt")
not_paraphrase = tokenizer.encode_plus(sequence_0, sequence_1, return_tensors="pt")
paraphrase_classification_logits = model(**paraphrase)[0]
not_paraphrase_classification_logits = model(**not_paraphrase)[0]
paraphrase_results = torch.softmax(paraphrase_classification_logits, dim=1).tolist()[0]
not_paraphrase_results = torch.softmax(not_paraphrase_classification_logits, dim=1).tolist()[0]
print("Should be paraphrase")
for i in range(len(classes)):
    print(f"{classes[i]}: {round(paraphrase_results[i] * 100)}%")
print("\nShould not be paraphrase")
for i in range(len(classes)):
    print(f"{classes[i]}: {round(not_paraphrase_results[i] * 100)}%")

预期输出格式：

Should be paraphrase not paraphrase: 10% is paraphrase: 90% Should not be paraphrase not paraphrase: 94% is paraphrase: 6%

在服务器上输出：

weight.t() size:  torch.Size([768, 3072])
input size:  torch.Size([1, 21, 3072])
weight.t() size:  torch.Size([3072, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 768])
input size:  torch.Size([1, 21, 768])
weight.t() size:  torch.Size([768, 3072])
input size:  torch.Size([1, 21, 3072])
weight.t() size:  torch.Size([3072, 768])
#还有很多行像上面一样格式数据输出 Should be paraphrase not paraphrase: 10%  is paraphrase: 90%  Should not be paraphrase  not paraphrase: 94%  is paraphrase: 6%

求问中间输出是怎么回事，我并没有主动打印上面的信息啊，我换了好几个模型都是这样子，请问有人碰到过这样的情况么。

我去看transformer的loging信息，但是并没有发现有weight.t()这样的信息打印。去github上看issue也没发现有人碰到这样的问题。

google直接搜不到

###救救孩子吧，开学不出成果会被延毕啊啊啊啊啊。

#算法题目求助#

全部评论

推荐最新楼层

[意涵团]ballball给我实习offer

楼主

北京邮电大学 golang

是**的cuda版本的锅 更新到 cuda10就好了

点赞回复分享

发布于 2020-07-06 14:28

电子科技大学 Java

进到model = BertForSequenceClassification.from_pretrained(bert_model_path) 这里看看有没有什么打印的信息

点赞回复分享

发布于 2020-07-02 20:08

风尽起长歌

西安电子科技大学 Java

我以为我发了个帖子。。。

点赞回复分享

发布于 2020-07-02 20:02

在Five这一块颇有心得

华中科技大学算法工程师

不是框架的问题，一点点debug吧，要有耐心

点赞回复分享

发布于 2020-07-01 19:51

06-25 19:50

游卡_HR(准入职员工)

后端面试经验：‌HTTP 与 HTTPS：简述 HTTP 与 HTTPS 的区别。MTU 设置：MTU 如何设置？过大过小会有什么后果？TCP 和 UDP：说明 TCP 和 UDP 的区别以及应用场景。TCP 可靠传输：TCP 为什么可以保证可靠传输？TCP 粘包问题：TCP 传输数据时，如何区分边界，也就是如何解决粘包问题？C++ 智能指针：C++ 智能指针有哪些种类？智能指针升级是怎么回事？C++ 模板：请解释一下 C++ 模板的概念和作用。C++ 动态内存分配：C++ 中动态内存分配有哪些方式？Java 垃圾回收：讲一下 Java 垃圾回收的原理和机制。Java 运行过程：描述 Java...

点赞评论收藏

分享

06-23 11:43

门头沟学院 Java

这 hr 要干嘛

发完简历隔了快一个星期又来问我问题

allin校招的烤冷...：我靠，今天中午我也是这个hr隔一个星期发消息给我。问的问题还是一模一样的😅

点赞评论收藏

分享

05-07 05:49

北京航空航天大学研发工程师

已经5月了... 这个简历还能找到实习吗

985本海硕，无实习，暑期实习还没开始投准备得太晚了，感觉 hc 不多了求牛友指点简历

zcjjj：北航随便面

投递实习岗位前的准备

点赞评论收藏

分享

不愿透露姓名的神秘牛友

06-27 15:22

26届实习为什么要背调？

字节实习为什么会背调？校招还会背调吗？因为之前有段实习去了两个星期跑路了，简历上写了两个月，会不会有事啊？字节公司会背调吗？

点赞评论收藏

分享

评论

点赞

收藏

招聘动态

现代汽车前瞻技术研发中心

快手

京东TET

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得现在还能进互联网吗？ #

1257次浏览 46人参与

# 如何准备秋招 #

4091次浏览 64人参与

# 现代汽车前瞻技术研发急速编程挑战赛 #

17756次浏览 155人参与

# 实习，不懂就问 #

12917次浏览 189人参与

# 如果中了500万，你会离职吗？ #

86017次浏览 673人参与

# 你觉得实习能学到东西吗 #

6120次浏览 148人参与

# 哪个瞬间让你对大厂祛魅了？ #

379215次浏览 2775人参与

# 秋招什么时候开投比较合适？ #

2509次浏览 47人参与

# 每个月的工资都是怎么分配的？ #

6024次浏览 121人参与

# 腾讯工作体验 #

473415次浏览 3489人参与

# 来聊聊你认为的薪资天花板是哪家？ #

30214次浏览 173人参与

# 打工人的精神状态 #

51512次浏览 930人参与

# 预测一下26届秋招形势 #

9360次浏览 106人参与

# 软开人，秋招你打算投哪些公司呢 #

99345次浏览 930人参与

# 职场情商大赛 #

131141次浏览 655人参与

# 非技术2024笔面经 #

384486次浏览 4732人参与

# 一觉醒来，秋招难度下降一万倍…… #

83461次浏览 642人参与

# 京东美团大战，你怎么看？ #

92325次浏览 569人参与

# 高考出分的那一天，我__ #

8607次浏览 132人参与

# 聊聊你的职场新体验 #

160645次浏览 1384人参与

# 你们公司几号发工资 #

18300次浏览 114人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务