(转)关于成为linux运维工程师需要掌握的技能
曾经在一年多前写了一篇关于要成为linux运维需要掌握哪些技能和工具的贴子,然后不小心被好几个网友抄袭转发到其它网站上,当然有些是认识的,最后还很幸运地被某些热心的学习者把那段内容剪下来当作圣经般的参考,为此我很感动,为了报答一些热心学习linux的朋友,下面本人将推出第二版介绍linux运维需要掌握的技能文章。
首先,咱们先讨论什么是运维,很多人完全不懂运维是干什么的,只知道学linux,但总有个目的吧。这样吧,咱们区分一下学linux能干什么工作为主,一般分为维护类和开发类,开发类就是底层开发偏多,还有嵌入式,底层开发就是C了,一般是linux
C开发,这个需求量不大,虽然工资比较高,但难度实在高,反正不是每间公司都有这些岗位,而嵌入式这个简直是高端技术活,懂这个直接无视我这个文章啦。所以我们既然不是做开发的,那么就做维护方面,就是linux运维这岗位了。
具体运维是做什么呢,从字面意思:运行维护,就是公司服务器的运行与维护,但如果只是这么想,其实是不太对的,保障服务器的运行与维护,有些人会理解成硬件方面,那就是网络运维,咱们学的内容是应用方面的,简称是应用运维,而应用就在平台上,什么叫平台呢,这个大家从工作中就会明白,这些就不多解说了。
下面开始说说要掌握什么技术,先给个第一版的传送门:http://tieba.baidu.com/p/2754014874?pid=42874803996&;cid=0#42874803996&qq-pf-to=pcqq.group
这个传送门贴子基本包含了运维需要掌握的技术,其实我也没需要再补充什么,因为学得越多,能掌握的其实就越少,你总不可能天天学一大堆东西都能完全掌握吧,而每间公司可能才那么需要几个技术点就够了,其它你学过的技术点没一会就忘记了,这是人之常情,你的大脑不是硬盘,用一会就容易忘记的,不可能长期都会记得住的。
下面介绍一下怎么才算掌握到这个技术点?
有些人会以为,我懂部署这个软件,设置这个功能,我就学会了,例如我会部署LAMP,LNMP,我就很牛了,特别有很多种部署方法我都掌握,或者我能写个脚本一键去安装部署,以为很厉害,其实我只能说句,这只是入门级别,在一些面试官眼中,这简直是不值一提的技术,部署什么服务什么的,难听点说句,找个网管上网随便搜索篇文章对着弄就行了,有何难度,而且你去到公司里,很多平台架构都弄好了,还需要你去装什么LAMP吗,一定要明白这个道理,懂安装懂配置什么的,只是基本功,并不是说你对LAMP很熟很了解,其实你是不了解,从大学或培训机构里学的都是部署环境之类的技术,其实根本就不懂怎么去应用这个环境架构,例如公司要求对某个功能进行安全加固,在apache里有这个模块,添加后还需要配置,然后日常的维护又需要去操作,还有apache的日志格式需要输出带有session
id的格式,这些需求你真的懂吗,不是单单会部署会安装就以为学会,其实LAMP是很难的,不是你想象中那么简单。
不要把每件事看得很简单,在学习过程中,大家会以为使用这个软件基本功能就以为学会了,其实当工作后,需要对这个软件学得比较精通,才叫真正掌握到,例如监控软件zabbix或nagios,你在学习时可能只是懂安装和简单的配置,但里面有些复杂的功能,你还需要去慢慢了解,如像trigger这些比较难又不好理解的功能等。
每当面试时,需要说出你的优点是什么,其实简单点说,拿出你的亮点,不是说我懂这个软件的安装和配置,这些都是零分,例如我懂得怎么优化这软件,怎么深入操作这软件等。
大家其实把linux理解成windows就行了,只是换成命令行操作罢了,运维都是要掌握各式各样的软件,就像你用windows办公,是不是要装office,输入法,浏览器,杀毒软件等,其实道理和概念是一样的,不要把linux当作很高端的样子。
最后,我说说运维的真正核心技能,那些什么安装部署环境等,全部都可以下个文档去对照操作,这些操作别说网管,连开发都可以代替你去做,所以运维一定要掌握有价值的技术,才能体现出价值,要让开发和网管是无法代替到的,下面我说说入门级的:
监控软件,这个就算是网管和开发都难以掌握,主要是配置复杂,他们没心去弄,而且监控是运维的重要职责,当然还得看公司资源问题,监控常见的有很多,但最常用还是nagios,zabbix,cacti这三款,其实把这三款学熟是件不容易的事,别以为部署出来能配置一些简单的监控项就代表会监控了,绝对不是那么简单的,你看看zabbix就知道了,我曾经做过一个zabbix二次开发的项目维护,那个难度不是一般的高,而且功能又多又难搞,绝不是什么培训机构1-2天就教会的,这是不可能的。
其次就是shell脚本,这是运维的核心技能,也是必需要掌握的,如果不掌握脚本能力,你就别做了,甚至你根本就做不了,面试官一见你连简单的脚本都写不了,直接不要。
那有些人就怕了,我的编程能力很差,真的写不出啊。其实谁的编程能力会强,除非是天生头脑特灵活的人,否则其实大家的水平都不会相差太远,脚本比开发语言简单得多了,只是大家没遇到一些案例和需求,所以是写不出来,这个是需要慢慢去练习的。
核心技能是这2个为主,然后有加分的,例如掌握python和perl和php,当然,对于一个刚入行的人来说,这基本不太可能了,一来是精力没太多,二来是时间没有,这个只能入行后再去学习。
下面说说运维在工作中需要掌握的技术,注意,这是在工作中掌握的,在学习过程中是比较难掌握的
一共四大方面:1、排错;2、优化;3、数据库;4、开发语言,第5必须的,就是运维意识,相当重要
第1点和第2点都需要经验去支持,这个没经验你根本不知道排错和优化是怎么搞,在学校和培训机构各种吹虚里,根本就不可能掌握到,这不是说你安装什么软件时遇到错误能解决那些,那种虽然也叫排错,但只是基础级别,真正的排错是指平台出故障,让你去分析与处理,而出现的错误会各式各样,而且涉及的范围也很广,所以这个是需要经验去支持的。
第2点优化更是个大问题,基本没经验是弄不了,别以为培训机构会教1-2天优化课程就掌握了这技术,这是不可能的,优化可以说是运维最吃香的技能,但也是最高难度的,因为涉及的知识面很广而且还需要很深入了解,优化是有风险,不是随便在网上搜个文章对着改一下配置文件参数或系统参数就优化了,这是乱来有风险的,甚至怎么样才算有效优化,我也不想说,因为对于没入行的人来说是很难去理解。
第3点数据库,也是运维加工资的重要核心技能,有些公司的运维可能接触不到数据库,其实运维的加工资技能要么就是开发,要么就是数据库,如果这2点都不会,那么就是个比网管高级点的打杂罢了,相对于数据库来说,运维的操作还是会有的,而且还昔昔相关,一但操作失误又无法回滚,你就真的要滚回家了。
第4点开发语言,就是上面所说的,要懂PYTHON或PHP,至于学这个干麻,这个我也不好说,要解释又一大段话,只能说现在都存在这个需求,特别是python,你会发现公司招聘时有这个需求,但真正工作时又不需要用,其实不是这个意思,python是自己想用就用,而不是公司要求你用,例如你去完成一个很麻烦的操作,而shell可能无法满足你或者效率很低,那么你就需要用python去满足,这是自己需求使用的,跟公司无关,但就能体现出你的价值了。
而第5点是每个运维都必须的,意识是很重要,并不是你技术很牛,学的技术很多很熟,就不代表你不需要运维意识,其实领导很看重运维意识的,例如有没有做好备份,权限分配问题,平台测试情况,故障响应时间等,这些都是意识,而不是你学了很多技术自认大牛了,平台发现故障你又没什么大不子,以为很简单的问题喜欢处理就处理,不需要向其它部门反馈等,领导不是看你的技术如何,而是看你的运维意识如何,你没运维意识,技术再牛也没用,只会让其它部门的人跟你不协调。
大概就说到这吧,今年我的目标是把数据库学熟,然后转DBA,然后再加个PY,要知道做IT这行是苦B的,需要无尽的学习,不学习只会被淘汰,不想被年轻的淘汰,就只能不断增值自己,不然不是你工资无法提升,而是你无法再从事这行,希望这篇文章能帮到大家
(转自51CTO技术论坛)