网站用户访问行为预测-LSTM

数据集:多个用户一个月内访问的URL
特征:用户id 访问时间 文本URL
以单个用户每日访问的url为入手点 进行分类

扁平分类

PAGE_CATEGORIES = 
    [
    商业经济,新闻时事,体育健身,教育培训,生活服务,
    卫生健康,政法军务,科学技术,社会文化,旅游交通,
    休闲娱乐,文学小说,艺术爱好,电脑网络
    ]
用途分类 PAGE_CATEGORIES2 = 
    [门户网站[新闻,经济,科技,旅游,游戏..],视频网站,交易网站,科研网站,游戏网站,。。。]
持有者分类 PAGE_CATEGORIES3 = 
    [个人网站(博客)、商业网站(淘宝官网)、政府网站(水利局官网)、教育网站(上大官网)]

树状分类:

//com
com ---> baidu.com ---> baidu.com             label:  baidu
                     ---> news.baidu.com        label: baidu news
                     ---> zhidao.baidu.com      label: baidu knowledge
                     ---> tieba.baidu.com       label: baidu social
                     ---> top.baidu.com         label: baidu news
    ---> bilibili.com ---> bilibili.com       label: bili
                      ---> live.bilibili.com  label: bili live
                      ---> manga.bilibili.com label:  bili manga
                      ---> game.bilibili.com  label: bili game
    ---> 163.com ---> game.163.com            label: 163 game
                 ---> v.163.com               label: 163 live
                 ---> news.163.com            label: 163 news
//net
net --->csdn.net --->csdn.net                 label: csdn
                   --->blog.csdn.net            label: csdn blog
                   --->download.csdn.net        label: csdn down
                   --->edu.csdn.net             label: csdn edu

Q1:单个网站可能有多个label

Q2:考虑用户本身之间可能有相似性
Q3:考虑同一域名下(或同一功能)网站之间可能有相似性

门控 RNN-lstm
cnn找高影响力的文本特征
lstm做预测分类
预测分类

交叉熵 损失函数

多个用户 可做推荐

全部评论

相关推荐

沉淀一会:**圣经 1.同学你面试评价不错,概率很大,请耐心等待;2.你的排名比较靠前,不要担心,耐心等待;3.问题不大,正在审批,不要着急签其他公司,等等我们!4.预计9月中下旬,安心过节;5.下周会有结果,请耐心等待下;6.可能国庆节前后,一有结果我马上通知你;7.预计10月中旬,再坚持一下;8.正在走流程,就这两天了;9.同学,结果我也不知道,你如果查到了也告诉我一声;10.同学你出线不明朗,建议签其他公司保底!11.同学你找了哪些公司,我也在找工作。
点赞 评论 收藏
分享
10-25 12:05
已编辑
湖南科技大学 Java
若梦难了:我有你这简历,已经大厂乱杀了
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务