地  址:江苏省南京市玄武区玄武湖
电  话:4008-888-888
邮  箱:9490489@qq.com
商  务QQ:3445124039
免费学生网页制作成品:伟人星云张恒峰:伟人星云平台最佳实际
作者:管理员    发布于:2020-06-09 06:53   文字:【】【】【
伟人星云张恒峰:伟人星云平台最佳实际 伟人星云高档体系工程师张恒峰到会IDCC2015大会并在云核算技能与平台效劳论坛宣布主题为《伟人星云平台最佳实际》的精彩演讲。

中国IDC圈1月8日报导,1月5-7日,第十届中国IDC财产年度大典(IDCC2015)在北京国家会议中间盛大召开。本次大会由中国信息通讯研讨院、开展与政策论坛、联盟辅导,中国IDC财产年度大典组委会主理,中国IDC圈承办,并遭到诸多媒体的鼎力支撑。

中国IDC财产年度大典当做海内云核算和数据中间范畴范围最大、最具影响力的象征性盛会,之前已成功举行过九届,在本届大会无论是规格仍是范围都"更上一层楼",引来现场人员爆满,影响力全面掩盖数据中间、互联网、云核算、等多个范畴。

伟人星云高档体系工程师张恒峰到会IDCC2015大会并在云核算技能与平台效劳论坛宣布主题为《伟人星云平台最佳实际》的精彩演讲。

伟人星云高档体系工程师张恒峰

以下是演讲实录:

张恒峰:我们下战书好,起首感激中国IDC圈给我们沟通的时机。我今上帝要讲的就是大家伟人星云遇到的一些问题,前半局部是广告,后边是实战更多一些。盼望给我们带来一些协助。听这个工具能够给了解OpenStack的人协助更大一些,没有效过的话也有协助,你们只要要认识大家在用了,也没有太大问题,根本能够成全大大都的须要。

起首自我先容一下,我是张恒峰,我是在伟人网络目前是伟人星云这块的技能负责人,以是说今天讲的大局部是技能偏多。我重视的几个方向就是云核算、大数据、运维主动化另有容器这块的工具。容器目前太火了,如果不去抓它的话可能就是落后了。今上帝要议程是这些,第一个先容一下伟人星云,第二是大家为什么做星云这个工具?第三就是大家星云粗略阅历了哪些历程?后边两个局部就是讲真实的技能,用的哪些技能?最后大家踩过哪些坑,盼望对我们有协助。

伟人星云实际上是属于上海伟人网络科技有限公司的,是大家在整合大家的一些资源的根底上,做的这么一个基于OpenStack的IaaS平台,现在主要是IaaS,后边可能会做PaaS和SaaS这些工具。大家星云上面跑大量事务,包含手游、页游、端游另有开发测试这些工具都在大家的IaaS平台上在跑。为什么要做?做过游戏的人可能认识这几年来,端游出现一个下滑趋势。手游和页游,尤其是手游是做游戏的未来。手游和页游这方面有一个比拟显着的特点,就是人来的快,去的快,了解云核算的应该认识它的上风就是疾速扩展,弹性伸缩这些都是比拟有上风的。而后是行业开展,目前整个大行业根本上在用云,尤其是用。公有云像阿里、亚马逊这些红利现已大量了,根本大的趋势都是往云上迁,以是大家也要捉住这个趋势做一下大家本人的云平台。第三是运维,大家做运维的话,大大都公司其实就是一个耗费的部门,耗费部门比拟为难的地位就是你成全不了事务须要,可能人家就找你的麻烦,这些人如果在这儿发明不了什么代价?你有可能被赶走,尤其目前公有云这么风行,你不做这个事情,大量人可能存在的代价不太大,轻易被筛选。以是说在这么三个布景下,大家做了星云这么一个工具。

大家开展历程,最初步大家伟人是用虚构化,最先的时分实际上是用ZEN,就是11年那个时分初步有些人在研讨这个工具。大家用ZEN的过程当中遇到各种百般的问题,后来转到KVM上面,转上来之后问题少了大量,工夫推移到13年的姿态,大家伟人星云团队正式建立。其实当时可选的云平台方案其实大量,好比OpenStack、CloudStack等等,固然我做一些调研,从社区的活跃程度、代码孝敬量另有答复问题,海内做这小我私家的数量来说,OpenStack的治理平台多是,当时来说一个更好的挑选。以是大家挑选它,没有再做其他。研讨它到目前,大家现已承载了大量事务,好比之前说的手游、端游、页游根本上也有大局部的事务在这个上面跑。期间遇到大量问题,横竖根本上能够成全百分之八九十的须要是没有什么问题的。不但目前,大家其实也有一些资源其实多是公司内部用不完,大家也对外提供了局部的公有云的效劳,另有一个就是大家既然踩了那么多坑,做了这么多事情,大家也想把它做成一个产物。做成一个产物能够给公司带来那么丝毫的收益,也就表现出大家做运维的这么一个代价。大家未来可能会做基于安稳的IaaS之上,会做一些PaaS或者SaaS的应用,这都是后话了。

技能,大家用的所有的技能栈都在这里。核算方面用KVM、Nova,CPU内存这块,大家不差分也不存在阻隔问题,最主要的问题是CPU,由于CPU你共用了超分了,可能触及到如何把它阻隔开,如何给用户提高更好的体验这个问题,这个也是依照业内大局部人的做法,另有就是依据差别的租户,差别的用户给他把虚构机的核算资源尽可能涣散在差别的物理机上,这样的话也会在大家IaaS层,保证它的事务的安稳性上面,做了一点事情。技能网络,网络这块大家没有效L3、DVL,L3的HA,由于这些工具在我眼里社区版本真的是,实际上是不克不及用的,以是大家用的是最简单的,用ML2,用VLAN阻隔,用虚构的网桥,由于这种是最安稳最高效的,在我眼里。像OVS,由于大家做的时分OVS的版本不是很安稳,大家没有采纳它,后续大家可能会研讨一下OVS这个工具,先用到测试里看一看。

网络方面,你的网络不会大问题,唯独问题就是平安问题。大家最初步做云平台的时分,常常遇到来自方方面面的攻打另有被黑之后攻打他人这种事情,大家后边加了一些平安,目前这种事情少了大量。存储,根本用Cinder、Ceph来做,大局部人,如果用OpenStack都会触摸Ceph这个工具,Ceph这个工具好用,固然也有大量问题。只需你要求不是说十分的高,而后他的可用性仍是十分好的,不论是架构上,它的社区,你去问问题,很快有人回应你。后边我会说一下Ceph大家遇到的问题。监控这个方面包含两个局部,一个是虚构机的监控,一个是物理机的监控。虚构机大家根本用Ceilometer,这个工具可用,问题也有,大家也做了一些本人的事件,根本上能够成全大家的须要。物理机大家是用Open Falcon这个工具,它治理起来的话更方便,我们想用能够去尝试一下。运维第一是布置,另有平时维护、晋级这些,大家大局部用Ansible做,还写了一些脚原来结合,大家还本人做了一个相似治理的页面,经过这个页面能够彻底百分之八九十的运维治理。开发根本就是用Python,治理页面大家是用JAVA写的,另有Sife就是用C++,大家目前对Sife这方面仅限于用,主要遇到一些比拟奇异问题大家可能看一下它的代码,以是也会用C++。

如果想做一个公有云这些工具还不行,还需要计费,计费大家本人做,这个就不拿出来讲了。大家踩过的一些坑,这些就是真实的遇到的问题。第一就是Keystone的认证十分慢,这个核算节点可能上百台的时分,如果是用原生的WSGI跑的话可能会有这个问题,大家看了一下个别步调跑满了十分慢,解决方案就是依照社区提的,目前有几百个核算节点,不会有慢的问题。而后就是Cinder,由于提供一个卷,你用Cinder Iist去看十分慢,大家查了一下代码,Cinder list也有不需要的工具,就是无用的信息加到这个里边过多调用,后来大家把没用的调用悉数去掉,根本上晋升的十分多,目前慢的问题根本上没有了。第三个就是网络,Neutron dhcp agent宕机导致虚构机IP丢掉,大家间接把它的工夫调长一百年,一个机器用一百年的话根本上不大可能。而后是nova带config driver时,live migration会落空,这个也不是所有的都会落空,如果版本是FAT那种格局它不会报落空,惟独是ISO的格局才会落空。这个大家的解决方法就是把代码批改了一下,根本上就解决了。

nova 从影象启动新建一个卷时,启动落空。Cinder可用是同一个域的状况,我也是改了一下代码,另有Ceph几个问题,Ceph -S慢,大家查了半天,它的负载太高,根本都是在申请域的工具,基本缘故原由是其间某一个OSD节点的工夫同步没有做好,由于Ceph里边如果工夫太快,它就会以为你给它的现已过时,它不绝的去要,而后结果他们之间不绝发音讯,导致负载十分高。解决这个问题的话你只要要把工夫同步做好就能了。扩充,散布式体系、存储体系根本都会这么一个问题,扩容的时分关于上层影响比拟大,这个解决起来,思路上让它优先响应客户真个申请,而后加一个盘的时分,把它的Vite值缓缓加,可能工夫比拟久,这个也没有方法就是这样做。另有CephOSD会宕机,这是初步的时分展开文件数另有内核里边总的文件数不行引起的另有就是线程这几个,横竖你把它调到最大值之后根本不会有问题。而后就是ceph mon oom的问题,大家64G内存运转了两年多,也呈现一两次oom的问题,大家后续会把硬件效劳器晋级一下根本就能解决。我就讲这些,盼望对我们有一点协助。论断其实就是OpenStack和Ceph这个工具,间接拿到企业去用,不会有太大的问题。可是你需要有一两个开发,或者两三个好的运维,根本上你就能搞定了。也不像有些人说的坑那么多,其实也没有说太多的坑,根本有四五小我私家,也能够用起来,能够成全大局部的事务须要,谢谢我们。

Copyright © 2002-2020 中小企业网站制作_企业免费建站平台_网站制作软件_网站制作建设_免费网站制作软件 版权所有 (网站地图
地址:江苏省南京市玄武区玄武湖 电话:4008-888-888
邮箱:9490489@qq.com QQ:3445124039