谷歌 I/O 大會(huì)公布第二代 TPU,內(nèi)部使用,細(xì)節(jié)披露
谷歌的TPU2硬件宛如一座深藏不露的寶藏,知曉其存在的研究人員寥寥無(wú)幾,他們能通過(guò)TRC直接觸及。這個(gè)“高度選擇性”的項(xiàng)目,充滿了諸多謎團(tuán)。單是這一點(diǎn),就足以令人稱奇。如此獨(dú)特的資源,為何對(duì)其訪問(wèn)設(shè)有如此嚴(yán)格的限制?
TPU2與TRC的關(guān)系
TPU2的研究云(TRC)僅供少數(shù)人訪問(wèn),這通道顯然是為研究人員量身打造的。這表明谷歌對(duì)TPU2項(xiàng)目有著明確的目標(biāo)定位。它并非面向大眾,而是專門(mén)為那些專注于特定領(lǐng)域的研究者開(kāi)放。這與大眾可以隨意使用的云計(jì)算資源有著根本的不同。此外,TRC如同一個(gè)門(mén)檻,限制了TPU2用戶的范圍。在硬件訪問(wèn)機(jī)制中,這顯得格外特別,使得TPU2宛如深藏不露的珍貴寶石。
這種做法只允許極少數(shù)人通過(guò)TRC訪問(wèn)TPU2,這難道不是限制了其潛在價(jià)值的深入挖掘嗎?
TPU2連接的隱藏性
在主板處理能力或PCI-E吞吐量未超負(fù)荷之前,谷歌從未公開(kāi)透露連接到服務(wù)器主板上的TPU數(shù)量。這種隱秘的做法讓人難以捉摸。谷歌此舉或許出于多方面考量。一方面是為了技術(shù)層面的保密,另一方面或許是為了減少外部干擾。而且,即便是在將每個(gè)TPU2板連接到兩個(gè)處理器板的過(guò)程中,谷歌也不希望增加自身對(duì)拓?fù)浣Y(jié)構(gòu)的安裝、編程和調(diào)度復(fù)雜性的混淆。這種復(fù)雜的連接方式,在硬件領(lǐng)域堪稱獨(dú)樹(shù)一幟。
難道隱藏TPU2連接狀況就能保證其安全性和穩(wěn)定性的提升嗎?
TPU2與至強(qiáng)芯片的配比
TPU2芯片與至強(qiáng)處理器之間的比例是2比1,這與GPU加速器在深度學(xué)習(xí)任務(wù)中的4比1或6比1的比例有著顯著差異。這表明TPU2與處理器之間存在著緊密的耦合關(guān)系。據(jù)推測(cè),這個(gè)2比1的配比可能是谷歌經(jīng)過(guò)大量實(shí)驗(yàn)得出的最佳比例。不同的配比在數(shù)據(jù)處理速度和能效等方面會(huì)產(chǎn)生不同的影響。特別是在深度學(xué)習(xí)任務(wù)的數(shù)據(jù)運(yùn)算和處理上,這種配比或許能展現(xiàn)出更高的效率。
這種配比與傳統(tǒng)的GPU加速器配比相較,是否預(yù)示著未來(lái)硬件配比的新潮流?
機(jī)柜內(nèi)硬件關(guān)聯(lián)
TPU2機(jī)柜內(nèi)部的聯(lián)系相當(dāng)神秘,我們并不清楚一個(gè)機(jī)柜中的CPU與TPU2芯片是如何相互連接的。TPU2芯片在共享數(shù)據(jù)時(shí),還需依賴超網(wǎng)格的連接。處理器池本應(yīng)提供機(jī)柜的超網(wǎng)格拓?fù)鋱D,以便明確哪些TPU2芯片能夠用于執(zhí)行任務(wù)。這種模糊不清的連接方式,是谷歌技術(shù)中的一個(gè)謎團(tuán),外界難以知曉其具體的邏輯和運(yùn)作機(jī)制,或許這與核心技術(shù)的保密策略有關(guān)。
在難以弄清楚CPU和TPU2芯片在機(jī)柜內(nèi)是如何相互關(guān)聯(lián)的情況下,我們能否推測(cè)出它們之間關(guān)聯(lián)的大致原理?
TPU2運(yùn)算處理模式的優(yōu)勢(shì)
TPU2芯片無(wú)需處理多任務(wù)、虛擬化或多租戶,柜上的運(yùn)算任務(wù)由CPU承擔(dān)。這種運(yùn)算處理方式頗具特色。它使得TPU2能專注于特定任務(wù),將復(fù)雜的管理和多任務(wù)處理工作交給CPU。這樣做減輕了TPU2的工作負(fù)擔(dān),同時(shí)充分發(fā)揮了CPU在管理方面的優(yōu)勢(shì)。在運(yùn)算處理過(guò)程中,這樣的安排有助于提升整體運(yùn)算效率和資源分配的合理性。
CPU負(fù)責(zé)統(tǒng)一管理復(fù)雜事務(wù),而TPU2則專注于運(yùn)算,這種模式能否應(yīng)用到其他硬件設(shè)備上?
TPU2的性能與比較
研究人員雖然能夠連接到一定數(shù)量的TPU2芯片集群,但要擴(kuò)展到整個(gè)機(jī)柜卻面臨挑戰(zhàn)。每個(gè)機(jī)柜都有其特定的性能表現(xiàn),比如FP16運(yùn)算能力在每瓦100至115之間。然而,目前尚無(wú)足夠的信息來(lái)將TPU2機(jī)柜與英偉達(dá)Volta等商用產(chǎn)品進(jìn)行對(duì)比。谷歌的TPU2從第一代到第二代,其與CPU的關(guān)系發(fā)生了變化,但在市場(chǎng)比較方面,卻缺乏足夠的信息來(lái)明確其定位。
在信息不足,無(wú)法與其他產(chǎn)品進(jìn)行對(duì)比的情況下,TPU2的市場(chǎng)價(jià)值又該如何進(jìn)行準(zhǔn)確的評(píng)估?
對(duì)TPU2硬件的這些特性感興趣的話,不妨點(diǎn)贊、分享這篇文章。同時(shí),也歡迎在評(píng)論區(qū)展開(kāi)討論。
作者:小藍(lán)
鏈接:http://www.huanchou.cn/content/3746.html
本站部分內(nèi)容和圖片來(lái)源網(wǎng)絡(luò),不代表本站觀點(diǎn),如有侵權(quán),可聯(lián)系我方刪除。