首頁 > 財經 > 創富故事 > 正文

【英偉達發“新核彈”,但你不應該只看產品】

文章來源:
字體:
發布時間:2018-08-16 13:15:45

  

  老黃又發“新核彈”了,但這次很多地方都變了。

  溫哥華13號當地時間下午4點鐘,英偉達(NVIDIA)CEO黃仁勛在正在舉辦的計算機圖形學年度會議SIGGRAPH上,放出了一個重磅更新——英偉達下一代的GPU架構“圖靈(Turing)”,以及應用Turing架構的對應Quadro系列專業顯卡產品。

  

  對于沒一代GPU架構都會滲透、影響自家全系列產品的英偉達來說,這絕對算是一件大事。但你應該關注的,卻遠不止新產品本身。

  關于全新的圖靈(Turing)架構

  

  在發布會現場,老黃為了說明“圖靈”的強大,專門拿它和“帕斯卡(Pascal)”架構(均為最強旗艦芯片)進行了一個對比。

  晶體管數量:帕斯卡有(GP102核心)118億個晶體管,而圖靈則有186億個晶體管,相比之下增長了57.6%;

  芯片面積:帕斯卡芯片大小為471平方毫米,圖靈為754平方毫米;

  存儲性能:帕斯卡的容量為24GB、等效帶寬為10GHz,圖靈的顯存容量上升到48+48GB(需要通過NVlink將雙卡互聯),等效帶寬上升到48GHz。

  就這幾個數字來看,提升幅度其實還蠻大。尤其是在晶體管數量上。從虎嗅現場了解的情況來看,“圖靈”將會采用12nm工藝,相比“帕斯卡”的14/16nm工藝已經有所提升,但芯片實際尺寸的“暴漲”依舊非常明顯。這種程度的改變,實際上對芯片制造的良品率和之后的散熱,都提出了比較大的挑戰。

  

  除了上面提到的,還有另外幾個對比值得細看:在CUDA處理器數上,“帕斯卡”最多擁有3840個,“圖靈”對應的是4608個,提升約20%。但“圖靈”還擁有“帕斯卡”沒有的Tensor Core和RT Core,其中Tensor Core可以輸出高達125TFLOPS的深度學習運算能力、200TOPS的INT8深度學習運算能力,而RT Core則可以完成每秒十億次的光線追蹤模擬運算。

  最后是互聯能力,這次發布的專業卡RTX 8000,能夠通過NVlink技術直接在雙卡之間形成一條100GB/s的傳輸通道,讓每顆GPU都能利用上96GB的顯存空間。

  

  黃仁勛在現場介紹新架構的一些細節

  整體對比下來,似乎都是華麗麗的提升。但我們不能忘了另外一個前輩架構“伏特(Volta)”的存在。我們再拿“伏特”的數據和“圖靈”簡單去做個對比。

  晶體管數量:“伏特”(GV100)擁有211億個晶體管,“圖靈”為186億個晶體管;

  芯片面積:“伏特”(GV100)為815平方毫米,“圖靈”為754平方毫米;

  顯存形式:“伏特”采用的是直連的4顆HBM顯存,主要通過顯存位寬來提升整體的顯存帶寬;而“圖靈”采用的GDDR6顯存,則主要依靠運行頻率來提升整體顯存帶寬;

  CUDA處理器數量:“伏特”(GV100)擁有5376個(實際中部分被屏蔽),“圖靈”為4608個;

  Tensor處理器數量:“伏特”為672個,“圖靈”為576個;

  Tensor運算能力:“伏特”為125TFLOPS(深度學習運算能力),“圖靈”為150TFOLPS。

  從這些結果來看,其實能夠可以看到一個非常明顯的趨勢,“圖靈”其實和2017年末登場的“伏特”在一系列參數上有很高的相似度,但兩者在實際形態上又相差甚遠。

  至少從現在來看,“圖靈”所采取的一系列變化,關鍵詞都是“實用性”,換個角度來說就是盡可能將最高端的“伏特”架構的部分能力和經驗重新組合,打造出更低成本的解決方案,并由此打造出最新一代的GPU基礎架構。

  其他一些值得關注的點

  

  1、新架構首發選擇在專業顯卡產品線中

  就英偉達自身的顯卡歷史而言,新架構的GPU首發通常都是選擇在主流消費級產品之上,大部分都是旗艦產品打頭。這一規律直到定位相對模糊的TITAN X才有所動搖,并最終在“伏特”架構這一代時完全被打破。

  

  如果說首發還不能解釋一切的話,那么老黃在發布會接近尾聲的一張PPT上其實也表達出了自己的想法:“‘圖靈’架構將打開價值2500億美元的虛擬特效工業”。

  

  性能可觀,售價更加可觀的RTX系列專業顯卡

  這一“轉舵”操作的源動力,最大可能還是游戲市場的“成長天花板”愈發明顯,相比汽車、移動市場這些尚需要時間的市場,專業視覺應該是英偉達贏面最大、最有希望短時間見成績的細分領域了。

  2、專業卡都來了,游戲卡還會遠么

  

  網上泄露的GTX1180Ti顯卡照片,大概率是PS的

  早在今年6月底,其實就已經有消息傳出——英偉達將攜新顯卡登錄德國科隆游戲展。此次“圖靈”架構的首發,則基本直接坐實了新顯卡將在科隆登場的計劃。

  但究竟專業顯卡核心細節、性能在轉向消費級產品時會做哪些調整,暫時仍是一個謎團。最值得期待的或許是全新的RT Core能否直接應用到游戲開發和運行當中,從而進一步提升游戲的顯示效果。

  3、英偉達正在逐漸走上產品細分道路

  最近一兩年間,英偉達各個領域的產品正在顯示出一種自我細分的趨勢:從最高端的、高制造成本的V100 GPU系列解決方案;到相對停滯的消費級顯卡產品;再到開始集成多種專用處理器模塊的最新自動駕駛平臺新一代Xavier;最后是這次引入了全新RT Core設計的專業視覺產品。

  可以看到英偉達各領域產品雖然都保留了同樣的GPU運算部分,但差異部分的確越來越多,這在某種程度上也呼應了摩爾定律再次減緩的趨勢。

  已經在CPU領域出現的“通用計算發展瓶頸”,大概率也會在GPU領域出現,盡管基于并行計算的后者天生優于基于串行計算的CPU。但值得慶幸的是,至少對英偉達來說,并不會固執地“堅持”只走通用路線,而是集中精力“解決問題”。

  這也是為什么,至少在可見的未來,用GPU架構將自身各個產品線“串聯”起來的英偉達,已經在產品功能和生態打造上擁有的明顯競爭優勢。

  寫在最后:以上的大部分內容,基于我自己的猜測。再過3天英偉達就將發布自己最新一季度的財報,微信群,屆時最新的趨勢將有更明顯的展示。

推薦文章:
推薦文章:
河北快3正规网上销售平台