阿里巴巴-飞猪-一面

#算法#情况: 一面过

1、都是简历面

2、了不了解rope,知道qwen的rope和deepseek的rope有什么不同吗

3、PPO和DPO有什么区别,简单介绍一下

4、介绍DPO的原理

5、多轮对话与单轮对话计算loss区别

6、rope的原理,mla里面的rope是什么原理

反问:

1、干嘛的

具体是30%业务70%研究,主要做智能客服对话和强化学习,业务+科研导向

2、多少张卡

200-300张
代码题:
给定一个数组x=[x_1, x_2,x_3 , ..., x_n],
要求,实现一个采样器,采样[0, n-1]之间的数据,要求采样0的概率为x_1,采样1的概率为x_2,采样i的概率为x_{i+1},函数输出是X列表中的其中一个
例如:给定p=[0.1, 0.3, 0.4 ...],sum(p) = 1,要求采样到0的概率为0.1,采样1的概率为0.3,采样2的概率为0.4
需要考虑计算复杂度
#输入 x p
#输出 xi i=1 ~n
import random
import bisect
def roule_whe(p):
    cumu_arrays = [0.0] * (len(p) + 1)
    for i in range(len(p)):
        cumu_arrays[i+1] = cumu_arrays[i] + p[i]
    r = random.random()
    return bisect.bisect_left(cumu_arrays,r)-1
p = [0.1,0.3,0.4,0.2]
index = roule_whe(p)
print(index)#阿里#
全部评论
算法也看看我们这里呀
点赞 回复 分享
发布于 03-27 17:17 天津

相关推荐

-自我介绍-两个算法题 40min1. * 有一个字符串它的构成是词+空格的组合,如“北京 杭州 杭州 北京 上海”,     *  要求输入一个匹配模式(简单的以字符来写), 比如 aabb, 来判断该字符串是否符合该模式, 举个例子:     * 1.pattern = “abbac”, str="北京 杭州 杭州 北京 上海" 返回 true     * 2.pattern = “aacbb”, str="北京 北京 上海 杭州 北京" 返回 false     * 3.pattern = “baabcc”, str="北京 杭州 杭州 北京 上海 上海" 返回 true     * 4.pattern = "aabb", str="北京 北京 北京 北京" 返回 false2.和其他面经一样,三个进程a、b、c猜数字     * 题目二:猜大小     * 有3个线程,线程名分别为A、B、C。 A线程随机生成一个 0 - 100 之间的整数,     * 仅生成一次,例如20。 线程名B、C进行猜数,并通知线程A,     * 线程A会根据猜测的结果来通知B、C线程是猜大了、猜小了、还是猜正确了。     * 猜数的线程B、C依据线程A给的提示继续猜数,     * 如此循环。猜中以后,由A线程输出猜中的线程,并且三个线程都中止运行。     * 请注意:     * 1. 线程B和C需要等线程A生成猜数结果后,才开始参数     * 2. 线程B和C任意哪个线程都可以先猜数,但两个线程需要轮流猜数     * 3.线程A通知的结果,线程B、C都知道。基于这个结果,大家一起猜。     */-拷打项目 15min-住宿部门,已经凉了,很难怀疑不是kpi
查看4道真题和解析
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务