大数据工程师问题请教!

Matlab可以处理几亿条的数据的(每条数据有32自变量)的多元线性回归运算吗?根据提取的共同因子,得出相应的多元线性回归模型吗?
全部评论
就算10亿条数据,每个有32特征,每个特征用double存,10^9*2^5*8=10^9*2^8  大概需要238G的内存,而你需要用这么多数据训练一个33维的向量,是不是有点数据量过多了呢。 我建议从两个方面走: 1)如果真的要用这么多数据,那么肯定没法读入内存的,那么就麻烦点,把每次训练的batch size搞大点,每次从硬盘读数据,然后训练 2)训练一个33维的向量真的不需要那么多数据,随机抽出一部分数据来训练就足够了
点赞 回复 分享
发布于 2017-12-01 22:15
几亿的数据 就算高配置的电脑本地也会跑崩溃的
点赞 回复 分享
发布于 2017-12-01 19:34

相关推荐

点赞 评论 收藏
分享
海螺很能干:每次看到这种简历都没工作我就觉得离谱
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客企业服务