【51CTO独家特稿】正如同我们之前在《SA,神仙与装机男:运维的工作到底啥样儿?》这个专题中提到的一样,运维是一个所含范围很广泛的职业,在不同的企业、不同的工作环境下,运维的职责可能是完全不同的。即使单就系统运维而言,有些运维可能专注于内网服务器的维护,工作偏向网管和帮助台的职责;有些运维可能从开发环境、数据库到线上应用部分都负责;有些可能仅仅负责特定应用的运维,或偏向架构方面。所以,即使是在职的系统运维,也可能对这个行业的同行们的工作内容了解有限。
为此,51CTO系统频道计划展开一项长期活动,请各个岗位上的、有数年运维经验的在职系统运维们分享他们自己的成长经验。本次我们邀请饭统网运维主管葛海龙(龙哥)来分享一下他的运维经验。
姓名 | |
职位 | 饭统网运维主管 曾任职于北京铜牛机房,瑞盛IDC运维主管 |
技术特长 | 网络监控 Linux系统管理 高并发网站运维 负载均衡 Cisco/H3C设备 |
目前关注 | Oracle数据库 |
个人博客 | http://gehailong.blog.51cto.com/ |
活动预告:葛海龙将在7月9日下午的51CTO技术沙龙中带来一场有关iptables和DDoS的讲座,地点在北京海淀区北三环西路66号理工国际教育交流大厦三层第二会议室,欢迎报名!
51CTO:首先,简单的介绍一下您自己吧。您是什么时候开始从事运维的工作的?
葛海龙:我在山东师范大学的计算机系毕业,之后在北京ITET学了一段时间的网络和Linux,这才开始从事运维的工作。
一开始是在IDC工作,期间帮朋友做过一些高并发网站的搭建和运维。到今天差不多已经有5年的时间了。
51CTO:那您在IDC和网站都做过,也都做到了运维主管这个级别。您做到运维主管用了几年时间?
葛海龙:今年算是正式的运维主管吧,因为原来虽然称为运维主管,但没做什么事情。
51CTO:可以理解为在网站的运维工作比IDC复杂么?可不可以简单说一下您在瑞盛IDC,相比现在在饭统网的工作,都分别关注哪些方面呢?
葛海龙:可以这样认为。
网站运维有很多东西需要考虑,比如网站的负载,缓存的处理,日志的分析,数据的备份/恢复等等。
在IDC主要是保证网络的畅通,监控是非常重要的一部分。因为现在的机房一般都是双线,甚至多线机房。要保证每条链路都不能出现问题。
再就是流量的监控,如果某条链路带宽突然增大,要迅速找出原因,否则会影响其他客户。
再就是链路的冗余备份。
总之,IDC主要关注网络和硬件,而网站需要关注的东西就更多一些。
51CTO:那就聊聊网站的事吧。您搭建维护过这些高并发网站,包括现在的饭统网,日均pv应该也是百万量级的。能否介绍下饭统网当前大概的架构,以及用到了哪些技术?
葛海龙:饭统网现在访问量在每天500万左右的pv。
大体架构可以分为三层:第一层,也就是前端是缓存服务器,用squid做的;第二层是web,第三层是存储。
用的技术也比较丰富,比如web主要是nginx,只有一个服务器还在使用apache;缓存的技术有squid做静态缓存,memcached做数据库内容的缓存;负载均衡用的是lvs的DR方式;数据库mysql,oracle都有,它们也都做的负载均衡;dns也是用的我们自己搭建的dns,也做了master和slave;监控是用的cacti和nagios,用飞信来报警。
51CTO:dns是自己写的?还是用bind修改的?
葛海龙:bind做的,没有实力自己写dns软件,呵呵。因为我们域名比较多,要是让公网上专门做dns厂商做的话,解析的时间是个问题。用自己的dns,只要本地没有该记录的缓存,几分钟内就可以在全球生效。
51CTO:原来如此。多域名是指地方分站多吗?
葛海龙:对。有几百个城市的分站。服务器都在北京,然后有cdn加速。再就是前端有缓存服务器。
51CTO:大致了解了,十分感谢。最后,再谈谈您自己的成长经历吧。我看您的博客,主要有两个方面,一个是Linux系统和应用服务,一个就是网络设备。您自己制定过什么学习/进阶计划么?
葛海龙:首先,系统和网络是肯定要学的,而且必须要学好。最近这段时间我在学习oracle。
我觉得要在运维方面做的比较出色的话,网络,系统,数据库必须都要会。否则的话,想做一个管理人员是比较有难度的。
51CTO:对其他Linux运维有什么建议吗?比如您现在招聘Linux运维的时候,最关注他们的哪些素质?
葛海龙:我在招聘linux的时候主要关心以下几个方面:1.基本功必须好,2.不浮躁,遇事必须沉着,不慌张,3.最好能有2年左右的运维经验。
51CTO:感谢海龙的分享!本次内容到此结束。如果您有什么问题想要沟通,或者希望听到某位运维进行分享,欢迎留言交流。