meituan 2
- 线程detach和join的区别?
- 不阻塞/阻塞
- 什么叫非聚簇索引?
- 非聚簇索引不决定数据的物理存储顺序。
- 它由索引键和指向数据存储位置的指针组成。
- 索引键:用于在索引中进行查找的值
- 指针:指向实际存储数据的磁盘位置或数据页。
- 协程和线程的区别?
- paas和faas效率上的区别?
- kafka消息积压怎么解决?
- kafka防止数据丢失的策略?
acks
参数决定了生产者在发送消息后需要等待多少个副本的确认。可以将其设置为all
或-1
,这意味着生产者需要等待所有同步副本都确认收到消息后才认为发送成功。这样可以确保消息在发送过程中不会丢失,即使某个 broker 出现故障,只要还有其他同步副本存在,消息就不会丢失。- Kafka 将消息持久化到磁盘上,以保证数据的可靠性。可以通过调整
log.flush.interval.messages
和log.flush.interval.ms
参数来控制消息刷新到磁盘的频率。较小的值可以提高数据的持久性,但可能会影响性能。 - 落向量数据库的算法?
- 原始数据生成emb是升维还是降维?
- 当原始数据具有非常高的维度,且存在大量冗余信息或噪声时,Embedding 可以起到降维的作用。通过将高维数据映射到低维空间,可以去除冗余信息,降低计算复杂度,同时保留数据的关键特征。
- 例如,在自然语言处理中,词向量(Word Embedding)通常将高维的词汇表映射到低维的连续向量空间。原始的词汇表可能非常大,每个词可以看作是一个高维的独热编码向量。而通过 Word Embedding 技术,可以将每个词表示为一个低维的实数向量,大大降低了维度,同时保留了词的语义信息。
- 在某些情况下,Embedding 也可以实现升维。例如,当原始数据的维度较低,无法充分表示复杂的特征或关系时,可以通过 Embedding 将其映射到更高维的空间,以便更好地捕捉数据的内在结构和模式。
- 比如在图像领域,原始的图像像素数据可能维度相对较低,但通过深度学习中的卷积神经网络等模型进行特征提取时,可以将图像数据映射到更高维的特征空间,从而更好地表示图像的复杂特征,如纹理、形状、颜色等。
- sql按照某列求sum?
- group by和join顺序?
- 先执行
JOIN
操作,然后再执行GROUP BY
操作。 - 查找某列最大值?
- cpp java差别?
- cpp中的锁?
- java中的锁?
- 分布式锁的实现方式?
- redis string底层数据结构?
- 缓存穿透及解决方案?
- mysql事务默认隔离级别 为什么是这个?
- 分页查询mysql 分页比较深查询比较慢 为什么?
- limit 查十页 分页查询 查一百页 sql怎么写?
- sql题。。不会
- java题。。
- string 转 int 实现不用api(注意考虑int溢出问题:最小值:-2147483648(-2^31)。最大值:2147483647(2^31 - 1)。)