來源:電子創(chuàng)新網(wǎng)
作者:Steven Woo,Rambus研究員與杰出發(fā)明家
生成式AI最近在科技行業(yè)掀起了一股熱潮,ChatGPT、Bard和Einstein GPT等標(biāo)志性產(chǎn)品吸引了開發(fā)者、企業(yè)和消費(fèi)者的目光。這些AI應(yīng)用能夠生成類似人類的文本、理解上下文,并以驚人的準(zhǔn)確性執(zhí)行翻譯、總結(jié)等任務(wù)。雖然這些例子已經(jīng)足以讓人信服生成式AI的力量,但我們目前仍然處于一個(gè)初始階段,還需要繼續(xù)不斷發(fā)展實(shí)現(xiàn)這一切的硬件技術(shù)。
(資料圖片)
隨著生成式AI的訓(xùn)練和應(yīng)用變得日益復(fù)雜,更加先進(jìn)的模型、更大規(guī)模的數(shù)據(jù)集和海量數(shù)據(jù)處理需求要求更低的時(shí)延、更高的帶寬、更多的存儲(chǔ)和內(nèi)存以及更強(qiáng)大的CPU算力。根據(jù)open.ai的數(shù)據(jù),“自2012年以來,在運(yùn)行最大規(guī)模的AI訓(xùn)練過程中所使用的計(jì)算量已經(jīng)增加了30多萬倍”。這一成就依托的是半導(dǎo)體行業(yè)幾個(gè)關(guān)鍵領(lǐng)域的技術(shù)發(fā)展和快速產(chǎn)品升級(jí)。
在訓(xùn)練和推理加速器中,HBM3和GDDR6這兩種內(nèi)存技術(shù)對(duì)于支持生成式AI的開發(fā)至關(guān)重要。HBM是一種高性能的3D堆疊DRAM架構(gòu),最新的HBM3為內(nèi)存和處理單元之間的數(shù)據(jù)傳輸提供更高的帶寬和更低的功耗,同時(shí)還具有出色的延遲和緊湊的尺寸,因而成為AI訓(xùn)練硬件的絕佳選擇。而GDDR6是一種帶寬高、延遲低且實(shí)現(xiàn)成本更低的高性能圖形內(nèi)存技術(shù)。采用成熟制造工藝的GDDR6內(nèi)存具有非常出色的性價(jià)比,因此是AI推理應(yīng)用的最佳選擇。
HBM3和GDDR6均能在AI應(yīng)用中發(fā)揮更好的性能和效率,提升處理大型數(shù)據(jù)集的速度和效率,使生成式AI能夠獲得強(qiáng)大、高效的存儲(chǔ)系統(tǒng)支持,為大規(guī)模AI應(yīng)用提供必要的算力。
實(shí)現(xiàn)生成式AI的另一項(xiàng)關(guān)鍵技術(shù)是服務(wù)器的主內(nèi)存。這些服務(wù)器用于訪問和轉(zhuǎn)換提供給先進(jìn)訓(xùn)練引擎的數(shù)據(jù),在保持訓(xùn)練流程的完整性方面起到了關(guān)鍵作用,而且對(duì)于找出實(shí)現(xiàn)高精度所需的最佳神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和數(shù)據(jù)格式的實(shí)驗(yàn)同樣至關(guān)重要。作為最新DDR內(nèi)存標(biāo)準(zhǔn),DDR5提供更高的數(shù)據(jù)傳輸速率、更低的功耗和更大的密度,幫助提升數(shù)據(jù)處理的速度和效率。DDR5 DRAM使新一代服務(wù)器系統(tǒng)能夠?yàn)槌笠?guī)模和企業(yè)數(shù)據(jù)中心提供巨大的算力,從而滿足高性能AI應(yīng)用的需求,比如需要大量存儲(chǔ)和算力的ChatGPT等。
CXL?也在這方面起到至關(guān)重要的作用。Compute Express Link?(CXL?)是處理器和加速器、智能網(wǎng)卡及內(nèi)存設(shè)備之間的一種開放、標(biāo)準(zhǔn)的高速緩存一致性互連技術(shù)。憑借內(nèi)存池、交換和“按需”內(nèi)存范式等先進(jìn)功能,CXL能夠部署新的內(nèi)存層,彌補(bǔ)主內(nèi)存和SSD存儲(chǔ)之間的延遲差距。新的內(nèi)存層將提升帶寬、容量和效率并降低總擁有成本(TCO)。這項(xiàng)技術(shù)對(duì)于需要實(shí)時(shí)處理大量數(shù)據(jù)的大規(guī)模AI應(yīng)用尤為關(guān)鍵。
除了上述眾所周知的技術(shù)之外,異構(gòu)計(jì)算也給生成式AI帶來了諸多好處。為了繼續(xù)提升性能,越來越多的服務(wù)器正在轉(zhuǎn)向異構(gòu)計(jì)算架構(gòu),通過專用的加速器為CPU分擔(dān)AI訓(xùn)練等專門的工作負(fù)載。這些加速器提供了這些應(yīng)用所需的專門算力,提高了處理速度與結(jié)果的準(zhǔn)確性。CXL也在這方面發(fā)揮了關(guān)鍵作用,通過內(nèi)存、緩存一致性使CPU和加速器之間能夠共享內(nèi)存資源。
Rambus是公認(rèn)的領(lǐng)先芯片和IP提供商,致力于實(shí)現(xiàn)數(shù)據(jù)中心的連接并解決內(nèi)存和處理之間的瓶頸,為數(shù)據(jù)中心、5G、汽車和物聯(lián)網(wǎng)領(lǐng)域AI的廣泛發(fā)展提供支持。Rambus的多款產(chǎn)品和解決方案都可以很好地服務(wù)于生成式AI應(yīng)用,促進(jìn)生成式AI的發(fā)展。
例如,Rambus內(nèi)存接口芯片、CXL內(nèi)存互聯(lián)計(jì)劃、互連IP和內(nèi)存IP——這些都能幫助滿足生成式AI的發(fā)展需求,有助于提供這類要求嚴(yán)苛的工作負(fù)載所需的速度、容量和連接性。同時(shí),Rambus還通過多層關(guān)鍵任務(wù)接口和安全I(xiàn)P解決方案實(shí)現(xiàn)基于硬件的加速器。隨著AI行業(yè)的不斷發(fā)展,Rambus在內(nèi)存接口芯片以及接口和安全I(xiàn)P解決方案領(lǐng)域的專業(yè)知識(shí)對(duì)于推動(dòng)AI和機(jī)器學(xué)習(xí)發(fā)展的邊界將變得越發(fā)重要。
ChatGPT、Bard和Einstein GPT等最近的生成式AI產(chǎn)品激發(fā)了人們的想象力,展示了AI可以帶來的各種新的可能性。為了使現(xiàn)在的AI繼續(xù)實(shí)現(xiàn)突破,來自先進(jìn)半導(dǎo)體技術(shù)的基礎(chǔ)支持至關(guān)重要。Rambus在開發(fā)這些關(guān)鍵技術(shù)方面處于領(lǐng)先地位,并將繼續(xù)投入,進(jìn)一步推動(dòng)這些技術(shù)的發(fā)展,為未來的生成式AI產(chǎn)品帶來遠(yuǎn)超今天的新可能性。
關(guān)鍵詞:
講座稱性騷擾因女生風(fēng)騷 教育局回應(yīng):已批評(píng)教育 責(zé)令整改
近日,講座稱性騷擾因女生風(fēng)騷事件引發(fā)社會(huì)關(guān)注。8月9日,懷集縣教育局
2023年8月10日云南省韭菜批發(fā)價(jià)格行情
2023年8月10日云南省韭菜批發(fā)市場(chǎng)價(jià)格最新行情監(jiān)測(cè)顯示:2023年8月10日
公安部交通運(yùn)輸部聯(lián)合印發(fā)通知 部署加強(qiáng)暑期道路交通運(yùn)輸安全管理工作
央視網(wǎng)消息:據(jù)“公安部交通管理局”微信公眾號(hào)消息,為深刻汲取連霍高
通過紀(jì)錄片“讀書”
通過紀(jì)錄片“讀書”原標(biāo)題:通過紀(jì)錄片“讀書”(主題)——來自《但是
“院長(zhǎng)、主任說了算” 業(yè)內(nèi)人士揭隱蔽醫(yī)藥腐敗
在新一輪醫(yī)藥反腐風(fēng)暴面前,醫(yī)院院長(zhǎng)、各科室主任等醫(yī)院系統(tǒng)的“關(guān)鍵少
關(guān)于我們 加入我們 聯(lián)系我們 商務(wù)合作 粵ICP備2022077823號(hào)
創(chuàng)氪網(wǎng) www.www.cn-everich.com 版權(quán)所有 技術(shù)支持:廣州中創(chuàng)互聯(lián)網(wǎng)信息服務(wù)有限公司
投稿投訴聯(lián)系郵箱:317 493 128 @qq.com