06-09 09:29 浙江大学算法工程师

关注

如何进行多源数据融合？

# 1. 多源数据说明：

- 数据是一张表格，字段如下： User_id, S_model1, S_model2, S_model3, feature1, feature2, feature3, Y, dt

- 其中User_id是用户编号，dt是时间分区，Y是目标，feature是特征，S_model表示其它的模型分

- 不同的S_model来自不同数据源，feature1、feature2和feature3来同一个数据源

- 不同分区内，数据源有不同程度的缺失和断流

数据示例如图：

# 2. 目前的融合方案是：

将所有字段均视为特征，输入xgb进行训练。

该方案存在如下问题：

- 训练集上，xgb模型的性能较低。

- 模型上线后，用户的Y标的预测很不稳定（用户某个特征的缺失导致其Y标大幅变动，这是很不合理的）。

# 3. 请问有好的多源数据融合方法吗？能克服各数据源的缺失/断流问题，有效利用各个数据源的带来的增益，最终：

- 提高训练集上xgb模型的性能

- 提高模型对用户Y标预测的稳定性

全部评论

推荐最新楼层

09-14 10:03

同济大学量化分析

量化私募急召cpp开发工程师，高薪

百亿量化私募高薪急招C++！ 春招/校招/社招，21/22/23/24届都可 base北上杭深 现招岗位:C++量化系统开发工程师 年base40-80万+bonus 通过这里找到我 slam_pan 工作职责 1. 参与交易平台的设计、开发与测试，实现交易策略、风控等需求； 2. 开发交易接口与行情接口，完成与关联机构的对接； 3、底层架构以及基础模块设计与开发。 任职要求 1、本硕985或优秀本科985应届，计算机相关专业 ...

投递宁波灵均投资北京朝阳分部等公司10个岗位 >

点赞评论收藏

分享

08-28 14:42

已编辑

哈尔滨工业大学附属中学嵌入式软件开发

SLAM岗位到底招人吗？

投了好几个公司的SLAM岗都是简历挂了（蔚来、速腾聚创简历挂，文远笔试挂，其他的SLAM也都还没有面试）反而投的感知方向（自动驾驶或机器人）好几个约面了SLAM岗到底招不招人啊，要是不招我以后就不投了bg本9硕C9

点赞评论收藏

分享

09-13 11:32

万得信息_数据算法工程师(准入职员工)

一面：redis是单线程还是多线程redis 多路复用(没说出来)spring的设计模式(只说了工厂和单例)concurrenthashmap的底层数据结构concurrenthashmap为什么线程安全(没说出来)redis为什么快，我说是因为内存读取，然后一直问我还有呢jvm如何判断对象是否要回收(jvm看的不熟)反问，我答的怎么样，直接给我来了句你心里有数。(md，有点受不了)等了20多min二面：自我介绍实习经历成绩怎么样怎么学习javajava的面向对象map集合下面有哪些多态线程的生命周期线程的阻塞mysql的索引mybits和orm框架如何评价算法目前还欠缺什么作为软件行业从业者...

点赞评论收藏

分享

09-04 00:05

已编辑

东南大学算法工程师

美的slam算法笔试纯nt公司

#美的求职进展汇总# 纯nt公司 纯nt公司高翔来了都进不了笔试我一上来先做coding笔试题不用eigen库实现高斯牛顿描述跟给的框架参数都对不上定义的eigen计算方法函数不能复制  自己手敲上去的 整了四十分钟看到让刷新网页估计是发现了问题 心态崩不想做了看看选择题都是不定项各种数学运算符号读都读不懂暑期测评完笔试ac了 面都不给面现在秋招5个hc整地狱难度只能说纯浪费时间大家如果时间不值钱就投吧 #美的#

投递美的集团等公司10个岗位美的求职进展汇总

点赞评论收藏

分享

09-07 13:30

已编辑

哈尔滨工业大学算法工程师

文远SLAM二面

美国面试官，早上八点开始，一个多小时的拷打，主要是项目和实习将近50分钟。问了Scancontext如何在描述子上检测可能的退化，激光视觉，激光惯性的标定过程，怎么判断各个自由度是否约束充足，H矩阵的一些特性等等。之后无八股直接开始做题，开五次根号，二分做完，面试官问还有没有其他解法，答牛顿法也可以做，确实是菜了脑子懵住了，迭代公式写错了，也到时间了，面试官就没让再继续希望能给个三面更新:一小时后hr约了三面，效率非常高

查看5道真题和解析

点赞评论收藏

分享

1 收藏评论

全站热榜

正在热议

# 机械人，你投提前批了吗？ #

11148次浏览 129人参与

# 互联网公司评价 #

234735次浏览 2977人参与

# 广发卡校招来了 #

1237次浏览 6人参与

# 国央企求职进展汇总 #

23485次浏览 102人参与

# 寒假躺平还是提前实习 #

18311次浏览 61人参与

# 比亚迪求职进展汇总 #

376597次浏览 2099人参与

# 正浩创新校招 #

8846次浏览 119人参与

# 在国企工作的人，躺平了吗？ #

223031次浏览 3145人参与

# 你怎么评价今年的春招？ #

61775次浏览 1003人参与

# 比亚迪秋招开啦，你打算投递吗？ #

6209次浏览 95人参与

# 你觉得实习只能是打杂吗？ #

11930次浏览 108人参与

# 职场新人生存指南 #

161784次浏览 4953人参与

# 你的简历改到第几版了 #

600305次浏览 8926人参与

# 国企还是互联网，你怎么选？ #

59236次浏览 497人参与

# 如果实习可以转正，你会不会放弃秋招 #

128881次浏览 1838人参与

# 通信硬件薪资爆料 #

409681次浏览 3352人参与

# 你的实习什么时候入职 #

42577次浏览 420人参与

# 写简历别走弯路 #

560053次浏览 6985人参与

# 如何写一份好简历 #

534582次浏览 7828人参与

# 影石Insta360求职进展汇总 #

77745次浏览 764人参与

# 硬件人的简历怎么写 #

191831次浏览 2521人参与

# 实习想申请秋招offer，能不能argue薪资 #

12293次浏览 121人参与

牛客网
牛客企业服务