【机器学习特训营】学员专用课程答疑帖—作业3参考代码已出

作业三参考代码已放出,欢迎大家积极讨论:http://www.nowcoder.com/live/1/4/2   (题目下方可点击下载)。有问题跟贴。
~~~~~~~~~~~~~~~~
亲爱的牛牛学员们,
欢迎大家来到机器学习特训营。为了方便大家更好的学习,本帖专用于已报名学员的课程及作业答疑
大家在上课的课程中对学习的内容或者课后作业有任何问题,可以以回帖的方式提出来,助教会以回复的方式帮大家解答。
为了更好的方便大家提问和回答,请大家提问时注意以下问题:

1、只提和学习内容或者作业有关的问题。无关的问题可以私信管理员或者另外开帖问哦。如果问题无关我们会私信回复你,然后删去问题。
2、尽量不要提重复的问题。我们会对问题进行管理,让你快速找到某一期的问题,如果是重复问题,我们会私信回复你,然后删去重复的问题。
3、其余无关问题我们都会删除,请见谅哦。

主页里面包括了下一期课程预告、直播录像、课后作业(集群平台)、课件下载、QQ群群号。
还没有加群的小伙伴尽快哦。另外为了不错过每一期课程通知,大家在个人主页绑定下手机号和常用邮箱吧~~

希望大家有所收获哦~
全部评论
一开始完全没有思路,求助于google,参考的这篇论文的实现方法。论文中包含代码,分享给大家参考。 http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.168.5695&rep=rep1&type=pdf 另外自己卡在了split中很久,java中split使用的正则表达式,自己使用了一个保留符号"|",没有进行转义,一直indexout错误。 所有输出都利用了Text,然后自己用符号去定义分隔符的方法太笨了,还是要多看书,知道一些有用的类型就好了。
点赞 回复 分享
发布于 2015-12-11 09:52
用     OWLQN 做LR的时候,1)训练数据里面  最后一列   的值必须是 0或者1么,这个是为了效率高么 2) model 处理以后,owlqn里面有predict函数可以输出测试样本的标签么,需要自己写predict么 3)训练数据里面L1的系数怎么选择呢,说明文件里面没有说L1的系数如何选择呢,这个上课的时候Eason老师写的是5,这个有什么根据么? 4)model里面有大部分的是负值,下部需要怎么处理呢 谢谢
点赞 回复 分享
发布于 2015-12-28 15:12
提交了代码怎么运行结果是找不到文件,输出有什么格式要求吗? Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 2 at com.nowcoder.course.Lesson1.main(Lesson1.java:97) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:606) at org.apache.hadoop.util.RunJar.run(RunJar.java:221) at org.apache.hadoop.util.RunJar.main(RunJar.java:136) get: `output/*': No such file or directory
点赞 回复 分享
发布于 2015-12-10 19:20
我看到参考代码里面是通过3个job任务串联来实现的。可不可以通过map->map...->reduce-reduce->...来实现这个功能呢!如果可以,应该用什么方法将多个map穿起来,多个reduce穿起来? 我自己原来的思路及时通过串联多个map的方式来时实现,但是找了半天,都没有发现能够成功串联map的方法.
点赞 回复 分享
发布于 2015-12-10 22:07
Hadoop中有一个叫做计算器的东西,想问下hadoop中的这个计算器是不是只能够调试使用,可以把计算器的值作为map中的一个key吗?
点赞 回复 分享
发布于 2015-12-10 22:09
用了跟参考代码一样的结构,为什么输出了三个文件前两个是空的,第三个的结果是我第一个reducer的输出?如果后两个reducer有问题的话第一个reducer的输出也应该是在第一个文件啊
点赞 回复 分享
发布于 2015-12-11 08:44
请问求用户相似度Jaccard参考代码中的,parts是输入样本数据中的每行数据吗?还是表示电影ID?parts[0]和parts[1]分别表示什么呢?有大神可以解释下下面代码分别是执行什么操作吗? public class Mapper21 extends Mapper<Object, Text, IntWritable, Text> { public void map(Object key, Text line, Context context) throws IOException, InterruptedException { String[] parts = line.toString().split("\t"); if (parts.length < 2) { return; } String[] userIds = parts[0].split(","); if (userIds.length < 2) { return; } context.write(new IntWritable(Integer.parseInt(userIds[0])), new Text(userIds[1] + "," + parts[1])); } }
点赞 回复 分享
发布于 2015-12-13 15:43
从来没有接触过java,感觉有点吃力。 另外,老师会不会在视频中讲一讲答案的具体原理,感觉自己看的不是很清晰。 还有,可以线下调试嘛?
点赞 回复 分享
发布于 2015-12-13 17:57
在做回归的作业的时候,怎么知道自己的答案是否正确啊?
点赞 回复 分享
发布于 2015-12-25 14:20
Jaccard怎么下载的输出结果 都是空白的 <>.<>
点赞 回复 分享
发布于 2015-12-31 16:03
                                                   关于  随机梯度下降法  的疑问          随机梯度下降法 是在训练数据里随机选取一个数据进行计算,然后反复迭代,直到误差符合要求为止。那么,如果训练数据是时间序列数据,比如工业生产现场,那么这样随机选择一个数据计算建模也是可以的吗?
点赞 回复 分享
发布于 2016-01-05 15:50
OWLQN 这个库,运行大样本的时候,进程直接被killed ,不适合大样本么?
点赞 回复 分享
发布于 2016-01-09 13:44
关于libfm: 1. libfm的训练数据需要usr的特征在一起 ,item的特征在一起么? 2.libfm可以输出训练model的w,w0,v么? 3.libfm可以输出组合了哪些原始特征么?
点赞 回复 分享
发布于 2016-01-14 22:32
对于训练数据的时候正负样本差别太大的如何处理呢,例如 正样本100万  负样本 100个 ?
点赞 回复 分享
发布于 2016-01-29 13:51

相关推荐

Pandaileee:校友加油我现在也只有一个保底太难了
点赞 评论 收藏
分享
拒绝无效加班的小师弟很中意你:求职意向没有,年龄、课程冗余信息可以删掉,需要提升项目经历。排版需要修改。
点赞 评论 收藏
分享
10-25 02:13
门头沟学院 C++
牛客7351937293号:8.27笔试10.22评估
投递小米集团等公司10个岗位
点赞 评论 收藏
分享
点赞 4 评论
分享
牛客网
牛客企业服务