在成為國企和被收購之外,AI芯片公司的另一種活法

撰文 | 四月

綁定國企資源,還是被巨頭收購?亦或者還有沒有一套更為主流的AI芯片公司生存之道?

更加多元化,更接地氣的。

「去年底iPhone X出來之後,客户都在問結構光方案能不能做。但是當下,大家問得最多的是『有沒有結構光的替代方案?』」,耐能創始人劉峻誠談起過去一年手機芯片市場的訴求變化。

下半年以來,創投圈裏關於「AI 芯片」的議題逐步降温,資本熱捧和媒體光環散去,芯片創業的本質浮出水面。

很顯然,並不是所有公司都自信如寒武紀,自誕生之日就綁定國企資源,拿下華為的長期訂單;也不是所有團隊都幸運如深鑑科技,公司成立兩年便深受資本厚愛,順利以不錯的價格「出售」。

在以上兩類稀缺案例之外,更多的是一般創業團隊的生存之道——必須更加多元化,更加接地氣。Kneron(以下簡稱耐能)就是這第三類公司的典型之一。

2015 年,耐能在美國聖地亞哥創立,核心團隊來自於前高通等半導體公司的華人工程師,聚焦在終端 AI 芯片解決方案,主攻智能手機、智能安防、智能家居等領域。公司在 2017 年、2018 年相繼完成兩輪融資,其背後的投資方包含阿里巴巴、高通、紅杉資本、李嘉誠旗下的維港投資等。

近期,機器之心與耐能創始人兼 CEO 劉峻誠對話,探尋產品迭代背後更接地氣的考量,主流客户與市場在過去一年的訴求變化,以及在 RSIC-V 架構、7nm 工藝等行業熱點影響下的趨勢走向,以窺探 AI 芯片產業整體的暗流和潮向。

在成為國企和被收購之外,AI芯片公司的另一種活法
在成為國企和被收購之外,AI芯片公司的另一種活法

以下為機器之心與創始人劉峻誠的對話整理。

NPU IP 不一定要塞進主核芯片,芯片性能提升的關鍵還是在於 CPU、GPU、NPU 多核的協調性。

機器之心:第二代 IP 系列中運算力最高為 5.8 TOPS/s,如何理解?

劉峻誠:5.8 TOPS/s 是高性能版本 KDP720 在 28 納米制程、600 MHz、8bit fixed points 下的性能表現。此外,我們還有超低功耗版 KDP 320、標準版 KDP 520。

機器之心:距離上一代 IP 不到半年,產品迭代節奏很快。

劉峻誠:產品線會保證兩年內的規劃。這款產品一年前就在佈局,性能不斷迭代。當出現較大性能突破,以及獲得核心客户的認可之後就會發布出來。這代產品主打偏高階手機市場和安防市場。下代產品在功耗上會有更大提升。

機器之心:今年已經出現 7 納米制程,性能比 5Tops/watt 的 NPU IP;對比之下,你們的性能如何?

劉峻誠:不同製程會影響芯片的運算能力表現,我們二代 KDP720 在 28nm 製程下的每瓦性能表現預估為 13.17 TOPS/W。

機器之心:有沒有考慮過更高的製程工藝?

劉峻誠:我們提供的 IP 架構默認以 28nm 製程為主,參考數據也是在 28nm 納米制程下的表現。

團隊沒有盲目追究高階製程,主要是考慮到成本和性能的綜合因素。在我們主要聚焦的三大領域裏:手機領域,雖然當下主流芯片廠商的主製程已經提升至 10nm 或以下,但協處理器仍可以使用 28nm;安防領域則以 28nm 為主,16nm 為輔;在 IoT 領域,主要以 40nm、65nm 為主。

機器之心:你們更偏向協處理器的方式?

劉峻誠:是的。我們和大廠合作主要採用協處理器與主核處理器協同的方式。該模式和谷歌 Piexl 手機芯片模式類似,比如,針對機器學習與圖形處理需求專門定製一款「協處理器」Pixel Visual Core,專門用於加速相機等特定應用。

機器之心:該模式和將 IP 綁定在主核芯片的模式有什麼不同?

劉峻誠:協處理器和主處理器可以採用不同製程,以降低主芯片的成本,因為協處理器不需要用到那麼高的製程。將 IP 綁定在主核芯片因為採用同一套製程必然加大芯片成本。NPU IP 不一定要塞進主核芯片,芯片性能提升的關鍵還是在於 CPU、GPU、NPU 多核的協調性。

機器之心:如何看待 7nm 製程之爭?

芯片公司和手機公司的 IC 設計思路不同。比如,蘋果和華為都是自研芯片,其模式和嚴格意義上的芯片公司不同。手機公司設計芯片更大動力在於升級手機性能,而芯片公司面向更廣的客户羣體,必須將成本和出貨量考慮進去。

7nm 會有一個黃金交叉的時間點,在推行一年、加持的模塊更豐富之後,性價比或許才會比較被手機公司接受。

機器之心:除了性能參數,新品還有哪些升級?

劉峻誠:在此之前,我們通過 3*3 矩陣重構就能覆蓋大量神經網絡。不過,過去一年又冒出了很多比較受歡迎的機構,比如輕量級的 MobileNet、YOLO、Tiny YOLO 等、以及一些很巧思的特異神經網絡,部分採用的是 1*1 的矩陣,再用 3*3 矩陣去適配就浪費了。

面對這些輕量級矩陣,可以採用交錯式運算架構去協調。用普通製程達到高性能表現能夠滿足客户的性價比要求。

機器之心:可重構算法主要應用在哪些層面?

劉峻誠:可重構主要面向兩個層面,一個是 Convolution Filter 層面的重構,即將 5*5、7*7 等不同大小型矩陣的卷積濾波器分解為 3*3 或者更小的矩陣,因為在 CNN 模型中 3*3 矩陣是最為常見的模型。今年我們已經針對這項技術進行多個地區的專利保護。

第二個是動態可調整定點運算的重構,針對不同的精度/浮點數的運算層進行動態運算的重組,以達到不同精度值要求與不同浮點數的運算進行精確匹配,更加高效地利用處理器性能進行並行交錯計算。此外,還包括針對不同模型的轉移學習和壓縮,保持儘可能多的 MAC 以提高平均性能等。

現在很多創業公司會更加聚焦在優勢市場,而不是鋪大盤子。因為創業公司需要聚焦資源才能打開市場。

機器之心:手機 AI 芯片市場過去一年有哪些變化?

劉峻誠:手機是我們佈局最深的領域,這一年市場訴求變化很快。去年 iPhone X 發佈之後,我們認為 3D 結構光應該是大勢所趨。所以在一代產品中就嵌入了人臉識別等 SDK。去年底iPhone X出來之後,客户都在問結構光方案能不能做。

但是當下,大家問得最多的是「有沒有結構光的替代方案?」

現在看來,結構光方案接受度並沒有想象中那麼高。我們分析,一是技術沒跟上,二是產品方案太貴。所以我們開始考慮 TOF、雙攝等更多方案,二代產品中三種軟件方案都能兼容。

方案既面向集成芯片廠商,也會面向光學模組廠商。因為人臉信息數據在主核芯片上跑效果仍然不是很理想,一是安全鏈路層空間限制,二是計算量較大。

機器之心:傳統安防廠商對於 AI 的態度是否有所轉變?

劉峻誠:安防市場注重通用性,而不是性能的精簡。過去,AI 算法和識別應用主要放到雲端,所以安防廠商對於 AI 算法和應用的接受度的確不高。

現在新的攝像頭會需要加入一部分預處理的功能,比如黑名單等。所以有一定的需求量了。主要針對一些需要架設新攝像頭的新市場,比如一些地方政府的智能城市工程等;而不是説現有的存量市場來進行攝像頭的更新換代,這個動力仍然不是很大。

機器之心:開源指令集 RSIC-V 的關注越來越高,可能帶來哪些變量?

劉峻誠:RSIC-V 可能會覆蓋到一部分到通用性的市場,比如安防、車載等。越通用的芯片,就容易受到 RSIC 的衝擊。

不過現在各類芯片功效的界限正逐漸模糊。專用芯片通用性越強,可能就會接近 DSP 或者 GPU;而 DSP 定製化程度越高,就越接近 ASIC、AI 芯片。

機器之心:從多起併購案中能看到行業集成趨勢開始顯現。

劉峻誠:一是行業很熱,即使創業團隊缺少很強的營利能力,但在技術上的強創新仍然能夠受到價值肯定。但是 AI 算法很大一部分創新仍然停留在介於硬件和軟件層面之間的 SDK,這樣的團隊在落地和實戰考驗上會遇到瓶頸。

第二也反應出現實問題——沒有差異化的產品路會很難走。比如,新的架構出現可能就會擠壓市場,RSIC 對於安防市場的衝擊我們也可能會遇到。

能夠看到的是,現在很多創業公司會更加聚焦在優勢市場,而不是鋪大盤子了。因為創業規模的團隊需要足夠聚焦資源才能打開市場。