星环科技nlp算法岗实习-凉经

  1. 自我介绍

  2. 问项目和论文

    1. 怎么得到病人信息的embedding

    2. 病人就诊信息输入是怎么构造的

    3. 病人的就诊信息时序信息怎么体现的

    4. 得到的病人的embedding用在什么下游任务

    5. 合并症是同时对多个疾病预测吗

    6. 二分类的时候采用的评价指标(AUC、F1值)

    7. 为什么用AUC呢?

    8. ROC曲线的横纵坐标是什么,对于假正率过高会导致AUC会偏高(负例样本太多),怎么看?

    9. 随机森林、GBDT的区别。

    10. XGBoost相对于GBDT的优化有哪些

  3. 数据结构

    1. python里的gil锁

    2. python里的多线程、多进程

  4. 算法相关

    1. dropout在训练和预测的时候有什么区别?在训练的时候和预测的时候需要做什么处理。

    2. 类别不平衡问题有哪些解决方法,在不同的场景里。(除了上、下采样,改loss权重,还有别的方法吗)

    3. 正则表达式的底层实现的数据结构是什么

    4. 从海量数据集中匹配一段字符串,除了正则还有什么别的办法,从数据结构和算法方面思考。

    5. word2vec模型输出层参数优化方面做了哪些工作,loss_function优化。

    6. 了解transE或者DistMult吗

    7. transformer的提出是为了解决了问题,transformer里的时序性是怎么体现的

    8. 了解spark吗

  5. 算法题:给定数组list,返回任意一个出现次数最多的数。

#星环##算法工程师##实习##面经#
全部评论
感觉好难呀!楼主是面完就没消息了吗,还是会收到拒信😂
点赞 回复 分享
发布于 2020-12-02 13:03
楼主有笔试,求问题型
点赞 回复 分享
发布于 2022-07-13 22:05

相关推荐

Yushuu:你的确很厉害,但是有一个小问题:谁问你了?我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了😆
点赞 评论 收藏
分享
11-03 14:38
重庆大学 Java
AAA求offer教程:我手都抬起来了又揣裤兜了
点赞 评论 收藏
分享
评论
3
39
分享
牛客网
牛客企业服务