淘天 NLP 一面

1.自我介绍
2.项目拷打
你们的训练数据怎么构造的?
对话的风格是怎么做的?
遇到 OOC 问题你们一般怎么解决?
还有一些比如说动漫角色这种,可能更难解决,你们怎么做。
模型输出内容太假大空你们怎么做?
记忆怎么做的?

然后问了一个八股
为什么现在大模型输入和输出价格不一样(说的有点结结巴巴,大意就是说输出需要对每个输入都要计算 注意力,输入只需要计算前面的部分。反正就是平均下来输入的成本比输出低。)

代码题
无序序列中位数,用 topk 改了一下。
反问
全部评论
八股这个 应该是gpu资源利用率方面 通信瓶颈+多次forward导致成本gpu利用率低
2 回复 分享
发布于 09-10 18:33 北京
学长太强了
点赞 回复 分享
发布于 09-10 18:44 山西
问问大佬,推进了吗还是在泡
点赞 回复 分享
发布于 09-14 14:02 江苏
想问下佬投的是算法技术还是业务技术,谢谢
点赞 回复 分享
发布于 09-15 16:43 北京

相关推荐

评论
4
17
分享
牛客网
牛客企业服务