国内的云计算平台有没有不是依靠 OpenStack 搭建的?
发布时间:2022-12-06 11:26:28 所属栏目:云计算 来源:
导读: 其实国内主流的公有云平台,从公开宣称的来看,除开有云之外,还真没有什么是宣称采用OpenStack搭建的。当然,除开有云之外,据我所知,也有一些公有云最初的研发是“借鉴”了OpenStack的架构体系(至
|
其实国内主流的公有云平台,从公开宣称的来看,除开有云之外,还真没有什么是宣称采用OpenStack搭建的。当然,除开有云之外,据我所知,也有一些公有云最初的研发是“借鉴”了OpenStack的架构体系(至于借鉴到何程度,由于没有看过相关产品具体的代码,也无从判断。) 我想题主的意思是,似乎觉得OpenStack不靠谱,很多云平台基于OpenStack搭建之后,经常出问题,真正靠着自己研发的技术或许可以避免这个问题。 我想要强调一点的是,很多人误解了OpenStack,认为OpenStack似乎是一个类似数据中心操作系统的开源产品,只要拿过来自己安装就可以用。 但是,事实上这个所谓的数据中心操作系统,只是OpenStack的结果,OpenStack严格来说,只是提供了一套定义数据中心操作系统搭建的框架,例如作为一个数据中心,在存储上需要实现那些目标?在计算上需要实现那些目标?在网络上需要实现那些目标? 然后基于这些目标,开源社区将他们分成不同的项目,最后通过社区的力量,在目标确定的前提下,大家贡献自己的代码和解决方案,然后通过某些评审机制,将相关解决方案加入到最终官方认可的参考发行版本中。这些方方面面的项目最后拼接在一起,就形成了我们通常认知上的OpenStack解决方案,可以安装之后成为一个管理数据中心计算、存储、网络、虚拟机等等相关资源的产品。 强调完以上的内容后,我觉得题主问题要分成两个方面,和4点来看。纯粹个人观点,有任何缪误,请随意拍砖,知错就改的好孩子一枚。 第一个方面,OpenStack到底靠谱不靠谱。 1.OpenStack由于出现的时间并不长,所以不像Linux一样,有一些比较靠谱的发行版本,如论RedHat企业版、CentOS、Debian、Ubuntu。这些靠谱发型版本经历过历史的考验,在稳定性易用性和可靠性上都做到有口界碑。但即便是Liunx,方向也是有所不同的,RedHat企业版还有CentOS都是运行服务器为主,所以功能上可能没有那么花哨,力求稳定,ReaHat是一个商业发行版本,所以你要付费,但是能够获得支持。CentOS是企业级RedHat的重构版,可以简单的认为是非商业版本的RedHat企业版。包括Debian也是如此。Ubuntu由于在界面上做的更好,所以比较迎合初级用户的需求,当然并不是说它不能干更加高级的活儿。 但是问题在于,OpenStack没有类似Linux世界中RedHat、CentOS、Debian、Ubuntu这些发行版本。主要原因还是在于,它的历史太短了。所谓稳定性如何证明,简单来说就是我在100万台不同配置的服务器中最长运行了超过10年,最短运行了2、3年。但是OpenStack以如此之短的历史来说,要有同样的宣称,几乎是不现实的。 2.OepnStack一定不靠谱?这个问题其实没有标准答案。因为OpenStack其实只是提供了一个框架,并在这个框架下面发展了很多项目,有些你可以拿过来就用,甚至你自己一点不开发,完全用别人的组件都OK。 但是请记得一个问题,OpenStack是一个开源项目,且目前基本没有商业发行版本。这意味着,你可以完全拿过来用,一点没有问题,但是出了问题,你也要自己搞定,不会有人帮你的。 简单来说,你可以在网上下载到AK47的详细制作图纸,你完全可以自己制造一把AK47,但是这把制造出来的AK47如果出现准度很低,后坐力过大,甚至爆膛的问题,你也只能自己默默接受,没有任何人可以帮到你。但是如果你是合法正规途径买来的AK47,当它出现各种问题的时候,你的供应商或者制造厂家会帮你搞定。 所以其实制造一把AK47并不是很困难的事情,但是要制造一把精准、后坐力小、射速快且不会爆膛的AK47,就非常考研你金属的加工工艺、你是否能够获得更好的制造材料,以及你是否清晰你期望的AK47特性,并不断向着那个特性去打磨和优化。 OpenStack也是类似,一个OpenStack系统如果要真正做到靠谱并能够商业化运作,其实需要大量后期优化、测试和调试的过程。所以目前来说,大部分使用OpenStack的都是互联网公司,因为这些的公司的程序员数量足够多,出现问题可以投入人力物力去解决。 特别是OpenStack很多功能的实现,就只是功能的实现而已,有可能只是开发这个功能的团队针对某几个特定场景进行了功能实现,并没有考虑多场景适配、兼容稳定性等问题。事实上,相关开发者也没有义务考虑这些问题。 OpenStack放在哪里,现状很多人都知道,如果你没有考虑清楚OpenStack可以帮你干啥,出现问题你是否能够Hold住。个人认为,即便用了OpenStack出现问题,那也是用的人、团队或者公司有问题,而不能单纯怪罪OpenStack。 第二个方面,自研难道就靠谱了么? 3.这个话题分开两说,基本上我不认为目前国内各家的云平台有所谓真正意义上的自研。代码从0开始都是自己敲出来的。这实际上是不现实的,而且也没有任何意义。各家的云平台,可以说都是借鉴了各类开源组件,例如底层基于Liunx去做,hypervisor层面多数都是用的KVM,存储基于ceph或者gsfs,网络有各种所谓SDN,系统监控基于Zabbix等等。 但是我又要回到第一个方面的话题了,靠谱不靠谱其实看的是人、团队和公司。国内大量的自研,其实基本和OpenStack差不多,就是我把这些开源的软件拿过来,拼凑起来,能够跑起来,然后换一层皮,就算自研了。 4.真正意义上靠谱的自研云平台,或者靠谱的OpenStack应该是什么样子的? 我认为,从现实的角度出发,应该基于开源去做,因为确实有很多基础和重复的劳动完全没有必要再去重头做起。我们应该站在巨人的肩膀上让自己走的更远。 但是这个研发团队,需要对那些你base on的开源组件有充分的了解,完全吃透它们。就像你会安装Linux和你熟读了Linux内核代码能够解决问题,都可以算作你会用Linux云计算 案例,但是两者之间的程度和距离是大相径庭的。 自研云平台,我用现在我在的公司举例,来说明一下什么是靠谱的云平台。这个云平台也是base on各类开源组件的,但真的只是base on而已,在这些开源组件的基础上,研发团队投入了大量的精力将这些开源组件真正“融合”到一起。 公司的技术创始人,也是老板,是微软和FaceBook出生大牛,在微软十几年的时间中做过数个重要产品线的首席架构师,C#、.Net Storage、AD、MSN Communities、WCF等,加入Facebook后,Facebook最初开始做分布式系统的时候,他也是主导的架构师之一。算是够牛的一个人了吧。 但是他在上海创立的这家公司从2011年底成立,一直专心在云平台的研发上,直到上个月,老板才认为,我们在今年内可以交付一个“真正的”云平台了,整整花了5年左右的时间。 所以,现在国内很多公司成立不过1、2年,就宣称自己研发了最领先的云平台,有多靠谱?自己感受下吧。 真正靠谱的自研云平台或者云平台,其实要验证很简单。我觉得两个方面足够。 1)不同组件之间是不是真正融合了。以我公司的云平台为例,所有的计算、存储、网络、虚拟机等等IT基础设施的管理工作,用户只需要用一个Portal来管理,并且非常灵活,你想要实现的所有的功能和设定,只需要打勾或者填写参数即可,灵活到不要不要的。并且不同资源之间的相互作用都是可以看到的。并且非常有意思的一点是,老板自己定义了一个网络协议,叫NSP云计算 案例,将所有相关的网络协议打包在一起,大大的简化了网络传输,完全不用烦恼什么配置端口了,安全问题也被简化了,你主要看住这一个端口即可,其它的端口可以全部关闭。 多少所谓自研的云平台,管理Portal,还都是分开的?做的好一点,把UI风格统一化,但是依旧基本是计算的归计算、存储的归存储、网络的归网络、虚拟机的归虚拟机,在搭建的时候还要分别配置。 2)上面多多少少很多人都还是怀疑。最简单的是,解决问题的能力。 我还是拿公司举例,老板为了验证自己的云平台靠谱不靠谱,在2012年的时候,发布了第一个基于云平台的应用,虚拟桌面云,简单来说就是VDI。VDI可能是目前企业级IT里最难做的应用。因为以下三点。 a.VDI和所有的最终使用者高度相关。你IT在后面搞个什么服务器升级、存储升级,其实对前台使用的公司里的普通用户而言,基本是无感的。但是VDI用虚拟桌面取代了物理机,这个和他们的体验是高度相关的,体验稍微差一点,大量的投诉和飞刀就向IT部门丢过来了。 b.VDI这个玩意儿,同时涉及到计算、存储和网络资源的调配,任何一方面做的不好,VDI就好不起来。最简单的,上班和下班的时候,大量用户开机关机,导致对存储系统有一个极大的峰值压力,就是所谓的开机、关机风暴。以至于VDI在过去很多年,都有一个怪现象,你单一部署的规模越大,单点成本反而会上去,因为开关机风暴的峰值压力,导致规模大了以后,你必须买EMC或者NETAPP的高端存储才能顶得住,而高端存储设备的价格可是数倍于普通存储。 c.很多企业的关键传统应用,在开发的时候只考虑了物理机环境,因此在VDI环境中部署会有各种奇葩的问题。特别是国内很多行业所谓关键应用,某些协议都是所谓私有协议,遇到这种问题的几率非常之高。 然后,么想到的是,我们这个公司基于自己的云平台研发的虚拟云桌面,也就是VDI,在公司三无(没历史、没名气、没关系)的情况下,拿下了航空、银行、保险、教育很多行业客户,为什么?就是因为平台都是自己真正研发出来的,套用格力的广告语就是掌握了核心科技,能够解决别人解决不了的客户问题。 a和b两个难点,两个问题是基于我们的云平台搞定的,因为足够好,且是分布式系统,所以计算、网络、存储的资源都被管理运营的很好,并且由于是分布式系统,基本上VDI规模要增加,只需要单纯的加服务器就可以,目前实际最大客户单一集群部署超过1000个点,这在国内都是不多见的,实际上要数倍于这个规模,老板也是很有信心,只是现在没有客户有那么大的需求。 难点c,解决用户问题的,我就举两个客户。 第一个是基地在上海的国内最大航空公司呼叫中心,呼叫中心上VDI的很常见,但是在我们公司服务之前,国内我是没有听说谁家的呼叫中心真正在生产环境实现带内语音,也就是呼叫中心的语音通话,也是放在虚拟机的数据网络上跑。这个是一个非常难解决问题,有多难呢,我就懒得细说了,但是我们搞定了,大概用了一个月的时间搞定POC,三个月内上生产环境。 Citrix、VMWare包括华为算是国内市场做VDI最牛的公司了吧,在国内做的呼叫中心大大小小不知道有多少,基本上语音依旧是通过电话线,然后再虚拟机客户端上插一张电话卡一样的东西,实现语音功能,也就是数据网络还是走数据网络,语音还是走的传统语音线路。多的好处我就不说了,光是那张电话卡,采购成本要多少钱,懂行的来说说就可以了。 第二个是我们在上海上的一个学校的项目,就是我之前说的,目前实际最大的规模的部署,单一集群内超过1000个点。教育部门指定的英语听力考试软件是科大讯飞研发的,不知道为什么,这个考试软件部署在VDI环境下,噪音很大,这是一个历史问题了,无论谁家的VDI环境都有问题,但是一直没有解决。实际上要求科大讯飞来重新升级考试系统,在我国目前的局面下,基本是不现实的,理由不展开,懂得自然懂。但是在我们公司这里,两个礼拜解决。以至于上海好几家做类似听力考试的软件厂商,听说这个问题被我们解决了以后,都跑来找我们谈,希望技术合作。 其实这些问题和自研不自研关系都不大,关键是你的研发团队要能够吃透背后的技术实现,才能知道如何去调整去匹配去解决问题。这就是同样是玩linux的,能够修改内核源代码的、熟读内核源代码100遍的、读过内核源代码的和会安装Linux之间的区别。这也就是,同样都是base on开源的云平台,但是靠谱不靠谱之间的差距。 (编辑:天瑞地安资讯网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐

