av狼友国产在线观看,VICTORYDAY护士,鲁大师高清在线播放,林心如《春心》1999

您現(xiàn)在的位置：首頁新聞動態(tài)行業(yè)新聞

[芯資訊]AI芯片是什么？邊緣AI芯片或更“出類拔萃”

瀏覽次數(shù)：

來源：

金海創(chuàng)電子

發(fā)布日期：

2023-08-09

首先我們來說說，目前市場上主要有哪些AI芯片？根據(jù)應(yīng)用范圍，可以分為終端AI芯片、云端AI芯片及當下熱潮的邊緣AI芯片。

? AI芯片

終端AI芯片

終端類的AI芯片，其功能要求功耗低、算力低，主要應(yīng)用于AI的推理，往往以各種帶AI模塊的MCU來呈現(xiàn)，專注于某一類應(yīng)用，例如，智能音箱里面的AI芯片，可以用于語音識別。智能門鎖的AI芯片，可以人臉識別等。

云端AI芯片

云端AI芯片則是數(shù)據(jù)中心，用于云端AI加速，不但可以推理也可以做訓練。例如NVIDA的GPU卡、谷歌的TPU等等。云端AI芯片性能比較強，面積也非常大，例如A100據(jù)說在7nm下有826mm2，性能也比較強悍！

那么，邊緣AI芯片又是做什么的？

相對于終端AI芯片很多消費級的場景，邊緣AI芯片更多的是工業(yè)領(lǐng)域的應(yīng)用。邊緣AI基本上將應(yīng)用局限在某個范圍內(nèi)，可以是一輛汽車、一列火車、一個工廠、一個商店。在這個范圍內(nèi)，有一些實時的AI決策及處理需求需要被滿足。相應(yīng)的我們會把AI賦能稱之為，自動駕駛、智能制造、智慧零售等。

其核心目的主要強調(diào)數(shù)據(jù)來源側(cè)來解決問題，這就是邊緣AI芯片存在的需求。

邊緣AI芯片特征

1、算力強

邊緣AI的算力要比終端要算力更強，通常都是獨立解決問題。但是性能要比小區(qū)的人臉識別或者智能音箱這種語音識別的基于某種應(yīng)用的端側(cè)AI芯片的處理能力要強1-2個數(shù)量級。

2、外設(shè)豐富

邊緣AI基本上強調(diào)信息的可獲得性，例如多路攝像頭的輸入的需求，對于類似MIPI的接口的數(shù)量會有很大的需求，例如可以同時支持多路攝像頭等視頻音頻的輸入。

3、可編程性

邊緣AI芯片通常用面向工業(yè)用戶，需要AI賦能用戶，換言之：AI要和用戶應(yīng)用場景相結(jié)合，通常根據(jù)不同工業(yè)用戶不同的場景需要進行編程，用于適配不同的模型和場景。也不局限于某種應(yīng)用。一個良好的可編程的架構(gòu)是解決問題的關(guān)鍵。邊緣AI芯片不是直接給工業(yè)客戶用，而是要根據(jù)工業(yè)客戶的需求進行客戶需求AI賦能，這個是邊緣AI芯片核心特征。

邊緣AI芯片架構(gòu)

那么邊緣AI芯片的架構(gòu)是什么樣子的？舉個例子，邊緣AI計算平臺，JESTON 應(yīng)該算是一個。其最新一代發(fā)布的是JESTON ?AGX Orin 。JETSON作為英偉達邊緣的AI計算平臺，其名氣沒有英偉達的GPU大。但是，JESTON同時繼承了Ampere的架構(gòu)的GPU和 ARM Cortex-A78，在邊緣側(cè)AI芯片中，既可以做推理也可以做訓練。作為一個邊緣AI產(chǎn)品，其有200Tops的處理性能（INT8）。我們以JESTON ?AGX Orin為例，探索下其芯片內(nèi)部架構(gòu)是怎樣的。

這個芯片的計算部分主要是三大件：CPU、GPU、DSA（NVDLA+PVA）

CPU：

JESTON其內(nèi)部有3組4核的A78，頻率可以到2GHz。也就是說，這個芯片內(nèi)部有12核的A78的處理器，不同于手機的處理器，3個cluster的A78是對稱的，不是手機處理器的大小核設(shè)計，其主要是面向計算服務(wù)，而不是手機應(yīng)用中不同負載的低功耗。在一些標量的運算中，多核A78的計算能力也是非常強悍。

GPU：

GPU是英偉達最新的安培架構(gòu)，擁有2048個CUDA核，以及64個Tensor內(nèi)核。這些都是可編程的。安培架構(gòu)是最新一代的GPU架構(gòu)，前面幾代分別是：Kepler，Maxwell，Pascal， Volta等。最新一代的安培架構(gòu)升級了tensor core。用了安培GPU以后，與其他邊緣AI芯片不同的是，可以支持推理和訓練。最重要的是，這個AI芯片可以用cuda來編程了，而可編程性則是邊緣AI芯片的核心需求了。

DSA：

作為AI加速單元，JESTON本身也有另外2個NVDLA 的硬核，以及VISION加速器 PVA；NVDLA主要用于推理。內(nèi)核核心還是一個大的矩陣卷積運算。

PVA用了VPU的架構(gòu)，使用VLIW的架構(gòu)，VLIW是超長指令字結(jié)構(gòu)，其并行度比較好，VIEW架構(gòu)設(shè)計簡化了硬件結(jié)構(gòu)，其二，VLIW的大位寬執(zhí)行并不會以犧牲性能和頻率為代價。但是同時將問題交給了軟件來運行。

IO資源：

除了計算資源，IO資源也比較豐富，畢竟邊緣AI側(cè)，就需要豐富的輸入，支持6個攝像頭以及16組通道的MIPI接口。如果邊緣AI芯片選一個重要的接口，那肯定是MIPI了。畢竟邊緣AI芯片，除了算力之外，還缺少不了的就是MIPI接口。MIPI就是邊緣AI芯片的眼睛，（用于連接攝像頭）。畢竟和人不同，需要很多雙眼睛，畢竟邊緣AI芯片需要“眼觀六路，耳聽八方”。只有大腦，沒有耳朵和眼睛，邊緣AI芯片是不能工作的。同樣還有USB接口，也可以支持一些USB攝像頭。同樣可以支持PCIe。RC和EP都支持，也就是說，可以同時作為加速卡插在別的主機上，也可以作為主設(shè)備插別的加速卡。同時在網(wǎng)絡(luò)方面，支持4路10G口，可以實現(xiàn)高速互聯(lián)，如果有需要可以實現(xiàn)高速網(wǎng)絡(luò)傳輸，或者幾個JESTON AGX的互聯(lián)。

根據(jù)這些參數(shù)，芯片面積小不了，我覺得這顆芯片可能是7nm的制程。才能在面積和功耗上比較平衡一下。其典型功耗大約在15W，30W，45W幾個不同的量級上。

邊緣AI芯片作用

作為一個方案商，不但要有一個非常強勁的AI引擎，其次要有很多的視頻輸入源。最后要通過一個非常強悍的AI框架（SDK）將這些硬件運行起來。也就是說邊緣AI需要根據(jù)用戶對于AI的需求二次開發(fā)。剛才提到，邊緣AI其中一個重要的特征就是，根據(jù)工業(yè)場景進行AI+場景的再開發(fā)。很多AI芯片紙面性能很強，但是如何將這些算力轉(zhuǎn)換成用戶感知的提升，這個里面就有很多內(nèi)功可做。因此工業(yè)用戶需要的是一個開放AI平臺，而不是一個只有算力的芯片，更重要的是，要根據(jù)用戶需求進行AI業(yè)務(wù)開發(fā)。

邊緣AI適用于哪些應(yīng)該場景？

邊緣AI的應(yīng)用領(lǐng)域非常廣泛，包括智能家居、智慧交通、餐廳送餐機器人、新零售應(yīng)用、AR/VR/元宇宙、機器人編程、智慧工業(yè)/物流/金融等。

尤其是邊緣AI視覺，具體來看，常用的技術(shù)包括圖像分類、目標檢測、語音分割等。圖像分類，將圖像送入網(wǎng)絡(luò)，然后網(wǎng)絡(luò)對圖像數(shù)據(jù)分類，在安防、互聯(lián)網(wǎng)、消費電子、汽車、醫(yī)療領(lǐng)域都有應(yīng)用，比如用于進行人體車輛屬性分類、人車分類、紅綠燈、病灶標注等，用到的典型模型包括AlexNet、GoogLeNet、VGGNet、RESNET、DenseNet、mobilenet等。

目標檢測，即識別圖像中的很多對象，并為各個對象輸出邊界框和分類標簽，典型模型包括YOLO、SSD、Fast R-CNN。用于安防領(lǐng)域的人臉檢測、目標檢測，互聯(lián)網(wǎng)領(lǐng)域的內(nèi)容審查，消費電子領(lǐng)域的手機相冊分類，汽車領(lǐng)域的人車檢測，醫(yī)療領(lǐng)域的病灶識別與標注等。

語音分割，將整個圖像分成一個個像素組，然后對其進行標記和分類，語音分割試圖在語音上理解圖像中每個像素的角，典型模型包括FCN、SegNet。用于在安防領(lǐng)域的行為姿態(tài)檢測，互聯(lián)網(wǎng)領(lǐng)域的廣告，汽車領(lǐng)域的可行駛區(qū)域感知，醫(yī)療領(lǐng)域的CT、X光輔助診斷。

經(jīng)過過去這些年的發(fā)展，邊緣AI的應(yīng)用場景越來越豐富，視覺感知的需求在提升，算法也越來越復雜，對算力的需求也越來越多。

（注：文章內(nèi)容摘自于網(wǎng)絡(luò)，如有侵權(quán)請聯(lián)系刪除）

相關(guān)推薦

聚焦ARM架構(gòu)主板特性金海創(chuàng)打造多款主...

新品｜金海創(chuàng)基于RK3568/3399/...

金海創(chuàng)電子提供100+AI視覺算法 AI...