您订阅的产品有更新,请实时查阅
查看详情
颁布功夫:2024-03-13
(作者|贾桂鹏)
当下,AI大模型的参数已升级至万亿级别,各个大模型重大的训练工作必要由大量GPU服务器组成的算力集群来合作实现。同时算力的提升对网络提出了超大规模、超高带宽、超强靠得住性的需要,为AI模型训练提供强有力的支持。

面对AI海潮,各个行业纷纷抢滩布局,热度急剧升温,同时在我国“新基建”“东数西算”等工程的加持下,算力网络这条全新赛路涌进越来越多的参加者。据Dell'Oro Group最新汇报显示,到2027年20%的以太网数据中心互换机端口将衔接到加快服务器,以支持AI的工作负载。
随着新的天生式AI利用的鼓起,预计推动数据中心网络市场未来五年销量累计收入超过1000亿美元。算力基础设施和网络基础设施的整体布局与技术架构迎来革命性变动,“算”“网”基础设施成为算力产业发展的关键地点,其迭代演进亟须加快。
在此布景下,元宇宙新声有机遇采访到iSlot官方网站网络数据中心网络事业群DCN BU总经理黄米青,与他一路探求了AIGC技术发展为企业带来了怎么的扭转,iSlot官方网站网络智算中心若何赋能企业数字化发展。

(iSlot官方网站网络数据中心网络事业群DCN BU总经理 黄米青)
成立于2003年的iSlot官方网站网络,跟随着数字经济持续加快发展驭风而行,深耕网络设备、网络安全产品及云桌面解决规划三大领域,凭借壮大的研发创新实力、切近用户的产品规划以及专业快捷的服务能力,现已发展成为ICT及云推算基础设施专业企业。凭据IDC中国以太网互换机市场跟踪汇报2023Q3数据分析显示,iSlot官方网站网络数据中心互换机在互联网行业市场份额排名前列。
而在AI时期,我们也看到iSlot官方网站网络持续秉承着创新发展的蹊径,凭借敏感的行业洞察与深厚的技术积淀,进一步推动行业发展,行稳而致远。
目前,很多企业数字化转型已进入“深水区”,数字技术与传统行业的单一叠加,已不能满足传统垂直行业的发展需要,企业在各自领域面对新机缘和新挑战,急需向广度和深度进发。
天生式AI作为当前新兴的人为智能技术发展趋向,是企业加快数字化转型的沉要选择之一。部门行业代表性企业已在出产运营中部署利用天生式AI,获得了初步功效。

黄米青以为:“AI技术对于企业发展来说是极度沉要的机遇。”
首先,这些技术可能援试祗业实现自动化和智能化,提逾越产效能、降低成本;其次,这些技术还能为企业带来更丰硕、更个性化的用户履历。
黄米青暗示:“AI的遍及和深入将可能从以下几个方面深刻扭转人类生涯:智能家居、健康医疗、智能交通、工作副手、虚构娱乐、人类加强等等。这些都将让iSlot官方网站生涯越发方便和舒服。进而,还将影响到社会的方方面面,蕴含经济结构、劳动力市场、城市规划、司法律规甚至伦理路德观点。”

那么,对于更多但愿加快数字化转型措施的企业而言,下一步应该若何用上、用好天生式人为智能呢?
首先要做到价值认同。要让数字化转型成为企业治理者与企业员工的共识,要充分意识、认可天生式人为智能。天生式AI可能在客户服务、销售市场、知识治理以及辅助决策方面助力企业实现大幅降本增效、降低贸易试错成本。
在AI贸易繁华的大趋向下,天生式人为智能正变得越发普惠,企业使用成本持续降低,企业员工进建门槛持续降低。
其次要找到“正确蹊径”。对于企业而言,选择使用大模型和天生式AI来提升数字化能力,必要遵循科学的理论步骤。企业必要凭据自身的行业特点和专业知识,与基础大模型合作,将特定场景的专业数据参与基础大模型进行再训练和微调,研发出专属大模型或场景大模型。
再次要防备风险。天生式AI作为一种新兴的技术,在赋能产业高质量发展的同时,也存在很多风险,如隐衷;ぁ⒘司质Э亍⑹菪孤兜。

另表,元宇宙新声以为,上述所有的发展前提是算力的发展,我们要考量算力是否可能满足人为智能的需要,因而,若何在AI服务这个业务模式中维持强有力的竞争力,提升集群的GPU效能变得尤为关键。
随着天生式AI的发展,以及大模型参数量的提升,对算力的亏损也在显著增长。大模型训练对于算力的需要也切合类似“摩尔定律”的特点,从每3-4个月算力亏损翻倍到每2个月算力亏损翻倍。随着模型迭代速度越来越快,对算力的需要也越发紧迫。
以ChatGPT为例,从OpenAI的官方申明能够看出,ChatGPT4的规模远远超过了ChatGPT3,并且使用更壮大的硬件GPU(H100)。这意味着ChatGPT4的训练功夫和推算成本都极度高,必要更多的功夫和资源来实现。

能够看出影响一个模型的训练时长重要成分在于GPU的利用率,以及GPU集群处置能力,而这些关键指标又与网络效能亲昵有关。网络效能是影响AI集群中GPU利用率的一个沉要成分。
在AI集群中,GPU通常是推算节点的主题资源,由于它们能够高效地处置大规模的深度进建工作。然而,GPU的利用率受到多个成分的影响,其中网络效能是一个关键成分。

多所周知,AI集群通常由多个推算节点和存储节点组成,这些节点必要频仍地进行通讯和数据互换,若是网络效能低下,这些节点之间的通讯将会变得缓慢,这将直接影响到AI集群的算力。
黄米青暗示:“企业要将更多资源投入到提升算力使用效能上,其中蕴含模型及并行通讯算法的研发以及高效算力网络的构建。”
但是,我们看到影响网络通讯效能的成分抛开硬件机能的限度,针对端处置时延、内部列队时延和丢包沉传时延三大动态成分优化网络拥塞和时延,则成为提升AI集群网络通讯机能具备成本效益的步骤;谡庑┧悸,iSlot官方网站网络致力于提升通讯带宽利用率,降低动态时延以及实现无损的网络传输,以提升AI集群网络通讯机能。
在此布景下,iSlot官方网站网络面向下一代AI云服务的智算中心网络建设,推出了iSlot官方网站网络AI-FlexiForce智算中心网络解决规划。那么它又有怎么的价值呢?
iSlot官方网站网络颁布的AI-FlexiForce智算中心网络解决规划,选取NCP+NCF为基础?楹嵯蚶┐蟮娜锻缂芄,并基于高机能芯片技术,通过将数据流切分成等长的Cell并负载到所有链路,提升网络带宽利用率;基于VOQ+Credit的端到端流控机造实现与业务无关的无损自关环网络,助力业务算力提升。

从规模上来看,AI-FlexiForce智算中心网络解决规划选取三级组网,可支持17k到32k个400G的端口。iSlot官方网站网络在国内首发了400G的NCP和NCF设备,以支持AIGC网络的大接入带宽。NCP设备RG-S6930-18QC40F1,支持18口400G的业务口,并支持40口200G的Fabric内联口,用于和NCP之间的互联。NCF设备RG-X56-96F1,支持96口200G的Fabric内联口。我们能够看到,该解决规划可满足分歧业务需要,拥有可扩大性和矫捷性。

黄米青暗示:“iSlot官方网站AI-FlexiForce智算中心网络解决规划通过创新性地利用链路负载和拥塞节造技术,解决网络中的拥塞矛盾问题,提升GPU之间通讯效能,进而提升GPU推算效能,加快企业大模型利用的推出。”
并且,在研发AI-FlexiForce智算中心网络解决规划的同时,iSlot官方网站网络还打造了散布式OS,旨在简化部署,提高系统靠得住性。传统的DDC(Distributed Disaggregated Chassis,散布式分散式机箱)由于节造面集中,一旦NCC(Network Cloud Controller网络云节造器)失联,就会影响整个网络,从而影响整个业务流程。另表,由于版本不兼容,若是部门设备必要升级,就会晤对巨大的运维难题。
iSlot官方网站网络AI-FlexiForce智算中心网络解决规划选取去中心化的散布式OS,实现了节造面与治理面解耦。即便治理平台出现问题,也不会影响整个网络的运行。与此同时,它还解决了兼容性问题,设备能够独立升级,大幅降低了运维难度。
黄米青诠释路:“我们在研发AI-FlexiForce智算中心网络解决规划时,打造了散布式OS,意在实现散布式规划架构的统一治理基础上,尽可能降低系统性风险,提升AI训练网络的持久不变运行。”
而在谈到iSlot官方网站智算中心的优势时,黄米青暗示:“iSlot官方网站占有RALB、AILB等网络负载平衡技术,在智算网络规划中提供优机能。”
能够预感,未来,随着AI对于算力需要持续增长,iSlot官方网站将持续精进AI Fabric智算中心网络解决规划,在降低时延、提高在网推算机能、实现端网融合等方面持续突破,打造高速互联、弹性可扩大、绿色节能的下一代AI云服务智算中心网络。
能够预感,在全球互联网流量不休增长和数据利用需要日益多样化的布景下,iSlot官方网站将持续精进AI-FlexiForce智算中心网络解决规划,在降低时延、提高在网推算机能、实现端网融合等方面持续突破。未来,iSlot官方网站网络还将通过持续的技术研发和产品创新,持续为全球的数据中心提供更高效网络解决规划,在AI时期助力各行业实现急剧发展。
这是我们第一次与黄总互换,并且还是线上大局,几多会显得有一些仓皇,但我们还是在沟通的过程中显著感触到他在专业领域上的堆集,好比他对于AI在企业端价值的体现、算力在AI发展过程中的沉要性等都有着极度独到的见解和解读,也为我们提供了好多分歧角度来观察科技的发展,这也是我们在互换过程中的收成。
在采访最后,当黄总在谈到iSlot官方网站网络在未来AI时期的赋能时,我们也感触到了他对于AI发展的等待和对iSlot官方网站网络产品和解决规划的信心。我们也但愿,未来iSlot官方网站网络也能像黄总展露出的信心一样勇往直前,利用自己技术赋能千行百业。
