基本情况:7.15入职,职位为数据分析,职能为数据挖掘,大致九月开始正式接触工作,到目前主要做了离线数仓与建模两个方面的东西,日常工作以数据挖掘,构建维护离线数仓标签体系为主,兼任为业务部门提供数据分析,开发特定标签(特征),做机器学习建模等多种工作内容,下列所谈不代表所有,因职能不同所使用能力必然也不尽相同。:工具使用:hiveSQL:主力使用,日常大数据代码工作绝大多数依靠它在hive on mr完成 。python :主要为爬虫库,科学计算库,机器学习库,获取网上的数据构建离线数仓的维表需要用到爬虫,对维表数据进行本地分析,对用户数据在服务器环境建模需要用到numpy pandas s...