淘天 NLP 一面
1.自我介绍
2.项目拷打
你们的训练数据怎么构造的?
对话的风格是怎么做的?
遇到 OOC 问题你们一般怎么解决?
还有一些比如说动漫角色这种,可能更难解决,你们怎么做。
模型输出内容太假大空你们怎么做?
记忆怎么做的?
然后问了一个八股
为什么现在大模型输入和输出价格不一样(说的有点结结巴巴,大意就是说输出需要对每个输入都要计算 注意力,输入只需要计算前面的部分。反正就是平均下来输入的成本比输出低。)
代码题
无序序列中位数,用 topk 改了一下。
反问
2.项目拷打
你们的训练数据怎么构造的?
对话的风格是怎么做的?
遇到 OOC 问题你们一般怎么解决?
还有一些比如说动漫角色这种,可能更难解决,你们怎么做。
模型输出内容太假大空你们怎么做?
记忆怎么做的?
然后问了一个八股
为什么现在大模型输入和输出价格不一样(说的有点结结巴巴,大意就是说输出需要对每个输入都要计算 注意力,输入只需要计算前面的部分。反正就是平均下来输入的成本比输出低。)
代码题
无序序列中位数,用 topk 改了一下。
反问
全部评论
八股这个 应该是gpu资源利用率方面 通信瓶颈+多次forward导致成本gpu利用率低
学长太强了
问问大佬,推进了吗还是在泡
想问下佬投的是算法技术还是业务技术,谢谢
相关推荐
10-31 20:05
南开大学 研发工程师 点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享