本文共 2877 字,大约阅读时间需要 9 分钟。
大家好,我是陶辉,之前在华为、阿里、腾讯、思科等公司工作过,现在是杭州智链达公司的联合创始人兼CTO。我从09年开始接触Nginx,至今已经有10年了,对Nginx有一些自己独特的见解,分享自己学习Nginx的经历与经验,及梳理重难点等等。
以下是“Nginx到底该怎么学?”的主题纲要。
2007年,我从华为来到了腾讯的QQ空间,在数据开发组工作。当时QQ空间小组也就是十来个人,大概有一亿多用户,同时在线大约在三百万用户,承载在Apache和C++开发的服务器上。因为当时腾讯有蛮低的ARPO值(每用户平均收入),每个用户贡献的收入是很少的,所以我们需要每台服务器尽量能够带来更多的价值,能服务更多的用户,就需要在Apache上做大量的优化。比如说把它的多进程改成多线程,很多初始化能一次解决的就不要初始化多次、调用多次等等。
但是不管你怎么样做,总有点隔靴搔痒的感觉,你根本没办法做大幅度的优化,因为它的结构已经决定了这些问题的出现。
2009年我到了思科之后,也遇到了同样问题,但我开始接触Nginx,发现用Nginx改造服务器之后,它大概有10倍这样数量级的性能提升。但对于Apache,你对架构本身没有办法做很大的变动了。这就是我通过实际经历想表达的第一点。
什么叫不能重复造轮子?
大概2014年,我在阿里VBC网络的时候,用因特尔的DBDT技术解决方案,做了一个叫SDN软件自定义网络。当时我突然发现,你做一些比如网络设备相关东西的时候,它的技术迭代非常慢,而且技术相对保守一些。
这个到底是为什么呐?我现在想明白了,就是我们在互联网背景下,技术是模块依赖的,比如我用Nginx来开发,Nginx的模块都是开放的,我可以基于别人的模块做进一步的开发。别人在 不断迭代模块的之后,我可以享受到优化的好处,这就是所谓的“站在巨人的肩膀上”。
这也就是我想讲的:千万不要重复造轮子。如果Nginx能解决,或者说任何一个成熟的框架能解决问题的时候,不要再花时间自己做了。
什么叫好的架构?
我是2012年10月份去的阿里云,做了架构师。ECS当时是两个月迭代一次版本,我们团队全年通宵了23次,花了两年时间,把线上的五万台服务器重构成一个新的架构,大概是一个月就可以做迭代。
好的架构真的很重要。Nginx就是个好的架构。
好架构,就是你要有预见性。比如TCP协议,它在1995年的时候就创立出来了,到现在都没有大改,依旧服务了各种各样的场景。Nginx也是一样,从2014年推出来后基本没多大变化。但它的模块化,是纵向的划分的架构,最底层是事件驱动,基于EP的事件驱动,再上面是HTTP框架,再上面是HTTP模块,再上面是OpenResty的lua。再看横向的划分,比如说我们要做一些 WAF 防火墙的限制,又比如基于IP做白名单、黑名单,那它的模块划分很清楚,还比如其他的模块,像linit或者Request只负责限速,不会自己去获取到用户的真实IP再去限速等等。
所以,我说Nginx是一个好的架构,而我们学习Nginx,也可以获取到非常好的架构思维。
其实,我觉得大家比我幸运很多,现在可以找到很多Nginx的学习资料。但在我一开始学Nginx的时候,也就是2009年吧,网上可查的资料非常少,连英文资料还都只有一本书。我大概只看了一个10页教你怎么开发的文档,就开始跟着源码学了。
因为09年的时候我大概有五到六年的工作经验,已经形成了一套自己的知识体系,所以对着源码学习相对比较容易。Winter老师在直播的时候也提到了,知识体系这个点,说我们不断地在学习新的知识点,会觉得很困难,这时候你一定要建立自己的知识体系架构。那知识体系架构最重要的是逻辑性、完备性。所谓的逻辑性,就是把一个新的知识点罗列到之前的知识树状结构中的能力。在的课程中,你跟着我学,也能梳理出树状结构的知识框架。后续新的知识点,哪怕不是Nginx,只要是Web服务器类的,你都可以归到这知识框架中。
在我看来,学习就是道与术的关系。
我认为有三个知识点一定要学:
1、第一个知识就是HTTP学习,《HTTP权威指南》是一本很好的书;2、第二个是TCP协议一定要学习,因为Nginx在处理的是性能,所以我们一定要了解TCP协议。有一本书叫《TCP/IP详解卷一:协议》,其实它有三卷,第二卷、第三卷比较长,大家如果没有时间就不要看了。但大家一定要看卷一,重点是看TCP协议,大概也就是八、九章的样子。3、第三个是一定要了解Linux的内核。大定不要一听到内核就觉得好恐怖啊,推荐一本书叫《深入理解Linux内核》,这本书对于前端同学来说,就比较恐怖了,学起来会非常的吃力,甚至一些后端同学第一次学也会感到吃力。我再推荐一本书,叫做《Lniux内核设计与实现》,讲的是比较浅,但一定要从第一章开始看,从进程、内存开始讲。你大概看完一半的时候,就会对一套体系非常的熟悉了。其实,如果你真的要学Nginx的话,我首要推荐的是一个英文网站:。
虽然不是中文,但大家不要怕,因为网站上没有什么大段的内容,就是一个一个分析它的指令,大部分指令还是讲的很到位的。不过有些指令讲得也非常的浅,你也可以结合我的课程《Nginx核心知识100讲》来学习,我会专门扩展去讲解一些指令。但总而言之,对于Nginx学习者来说,吃透这个网站是很重要的。
第二个是 ,就是Nginx PLUS那个官网,它有一个,那个中间有个叫Blog,叫博客那栏,那里面有很多很好的文章,像关于NginxPlus,的就不用管了,因为它是广告,它就像你买那个Nginx Plusd。但Nginx又不开源,这个就比较糟糕,那种的就不用看,但是就是关于它的一些新的特性的,这个一定要好好看一看。
第三个就是我的书《深入理解Nginx;模块开发与架构解析》。这本书主要讲的是模块开发,因为我当时工作要写模块开发,但市面上没有任何一本书来讲模块开发,于是就有了这本书。我为了讲清楚模块开发,又讲了一些架构的东西,这个是有参考意义的。但我建议大家一定要先看完《HTTP权威指南》、《Linux内核设计与实现》,再去看这本书,会更容易轻松一点。
最后就是源码一定要看。
在的第六部分课程中,我会有大概会有10节课去讲OpenResty。结合了之前的Nginx基础架构、HTTP模块、反向代理与负载均衡等学习,掌握OpenResty会很简单。OpenResty的官网上有很多错误的,主要在Github上有些指令的错误。但因为你有之前的知识认知,你会发现Github上没有讲到的东西,你也会用。Nginx的知识架构也就是这四个点:HTTP框架、进程架构、变量、Openresty。OpenResty是我认为非常重要的一点。
转载地址:http://jrgjo.baihongyu.com/