星环科技nlp算法岗实习-凉经

  1. 自我介绍

  2. 问项目和论文

    1. 怎么得到病人信息的embedding

    2. 病人就诊信息输入是怎么构造的

    3. 病人的就诊信息时序信息怎么体现的

    4. 得到的病人的embedding用在什么下游任务

    5. 合并症是同时对多个疾病预测吗

    6. 二分类的时候采用的评价指标(AUC、F1值)

    7. 为什么用AUC呢?

    8. ROC曲线的横纵坐标是什么,对于假正率过高会导致AUC会偏高(负例样本太多),怎么看?

    9. 随机森林、GBDT的区别。

    10. XGBoost相对于GBDT的优化有哪些

  3. 数据结构

    1. python里的gil锁

    2. python里的多线程、多进程

  4. 算法相关

    1. dropout在训练和预测的时候有什么区别?在训练的时候和预测的时候需要做什么处理。

    2. 类别不平衡问题有哪些解决方法,在不同的场景里。(除了上、下采样,改loss权重,还有别的方法吗)

    3. 正则表达式的底层实现的数据结构是什么

    4. 从海量数据集中匹配一段字符串,除了正则还有什么别的办法,从数据结构和算法方面思考。

    5. word2vec模型输出层参数优化方面做了哪些工作,loss_function优化。

    6. 了解transE或者DistMult吗

    7. transformer的提出是为了解决了问题,transformer里的时序性是怎么体现的

    8. 了解spark吗

  5. 算法题:给定数组list,返回任意一个出现次数最多的数。

#星环##算法工程师##实习##面经#
全部评论
感觉好难呀!楼主是面完就没消息了吗,还是会收到拒信😂
点赞 回复 分享
发布于 2020-12-02 13:03
楼主有笔试,求问题型
点赞 回复 分享
发布于 2022-07-13 22:05

相关推荐

11-15 18:39
已编辑
西安交通大学 Java
全村最靓的仔仔:卧槽,佬啥bg呢,本也是西交么
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
3
39
分享
牛客网
牛客企业服务