喜马拉雅搜广推算法春招二面面经

GBDT为什么叫做梯度提升决策树,梯度用在什么地方
gpt的input的encoding是怎么做的
Inmediate model的输出是什么?四个任务分别是什么?四个指标分别是什么?怎么构建的负样本?为什么是基于摘要场景训练的,但是用在对话场景呢?
svm的核函数,升维到高维空间,理论上一定可分吗
fm了不了解
unieval项目的后续应用
gpt的decoder是怎么构成的
dropout在预测时候是怎么预测的
为什么使用layernorm而不使用bn
全部评论
怎么问好多大模型的,是你的研究方向吗
点赞 回复 分享
发布于 2024-06-26 18:24 湖南

相关推荐

牛客604067584号:我9月初投递10月入池,泡到现在。hr全部离职,当然没离职的时候也联系不上。我发邮件给campus也不回我
点赞 评论 收藏
分享
评论
点赞
12
分享

创作者周榜

更多
牛客网
牛客企业服务