近兩年前,當世界意識到生成式人工智慧和實現該技術的強大晶片具有顛覆性的能力時,半導體行業受到了新的關注。雖然這種興趣的最大受益者是輝達,但各種新創公司都在尋求挑戰這家人工智慧晶片巨頭或尋找其他可以顛覆的領域。
雖然半導體初創企業面臨的風險仍然很高(其成本通常比早期軟體公司高得多),但它們可以從今年該行業可能增長20% 的預期中受益,部分原因是對人工智慧晶片的強勁需求。
這為Cerebras Systems、Hailo 和 Kneron 等AI 晶片初創公司提供了空間,它們可以從研究公司IDC 在12 月預測的預計支出增長中分一杯羹。其他希望顛覆AI 計算晶片設計方式的半導體初創公司包括Celestial AI、Eliyan、Rivos 和Tenstorrent。
以下是CRN迄今評選出的2024年最熱門的10家半導體新創公司,除了上述新創公司外,還包括MetisX、SiMa.ai和Taalas。
David Lazovsky,創始人兼首席執行官
Celestial AI 表示,其光子結構光學互連技術克服了延遲和頻寬瓶頸,為人工智慧計算的進步鋪平了道路。
這家總部位於加州聖克拉拉的初創公司今年3 月宣佈,已完成1.75 億美元C 輪融資,該輪融資金額“大幅超額”,由美國創新技術基金領投,其他幾家投資者也參與其中,其中包括AMD 的風險投資部門、三星以及大眾集團的控股公司保時捷。
同月,這家矽光子學初創公司表示,「目前正在設計光子結構光學晶片,作為技術採用的初始階段」。據Celestial AI 稱,這種將光學晶片整合到多晶片封裝中的技術正日益成為高效能處理器的常態,與「其他最先進技術」相比,它可以使封裝外頻寬提高25 倍。
Andrew Feldman,聯合創始人兼首席執行官
Cerebras Systems 正在利用其Wafer Scale Engine 晶片挑戰Nvidia 在AI 計算領域的主導地位,據稱該晶片可實現卓越的每瓦性能和「前所未有的可擴展性」。
今年3 月,這家位於加州桑尼維爾的初創公司發佈了第三代晶片Wafer Scale Engine 3,並稱其性能是上一代晶片的兩倍,而且「功耗和價格相同」。 WSE-3 由4 兆個電晶體組成,採用台積電的5 納米工藝,整合90 萬個AI 核心和44 GB 片上SRAM,16 位元浮點性能可達125 千兆次。
該公司今年的其他里程碑包括與醫療巨頭梅奧診所進行多年戰略合作,開發多模式大型語言模型來改善患者的治療結果和診斷,與人工智慧初創公司Aleph Alpha 進行多年合作,建構安全的主權人工智慧解決方案,以及為總部位於阿布達比的科技控股集團G42 奠基Condor Galaxy 3 超級電腦。
Ramin Farjadrad,聯合創始人兼首席執行官
Eliyan 希望透過其NuLink PHY 互連技術打破晶片間頻寬障礙,幫助晶片設計師建構更強大的基於晶片的處理器。
這家總部位於加州聖克拉拉的初創公司3 月宣佈完成了一輪6000 萬美元的融資,由Samsung Catalyst和老虎全球管理公司(Tiger Global Management) 共同領投,並得到英特爾和SK 海力士的風險投資部門等其他投資者的支援。
今年早些時候,Eliyan 表示,它在物理層上推出了「性能最高」的解決方案,用於在單晶片架構中連接多個晶片,並且採用了台積電的3 納米製造工藝,每條鏈路的速度高達64 Gbps。
Orr Danon,聯合創始人兼首席執行官
Hailo 正在透過採用在成本和功耗效能最佳化方面處於領先地位的晶片來加速邊緣產生AI 工作負載,從而與Nvidia 展開競爭。
這家總部位於以色列特拉維夫的初創公司4 月宣佈,它從投資者那裡籌集了1.2 億美元,作為其C 輪融資的延伸,同時推出了新的Hailo-10 加速器,它可以為個人電腦和汽車資訊娛樂系統等裝置「以最小的功耗實現最大的GenAI 效能」。
例如,該公司表示,Hailo-10 可以以每秒最多10 個token 的速度運行70 億參數的Llama 2 模型,同時僅使用5 瓦的功率。對於Stable Diffusion 2.1 模型,該晶片還可以在相同的功率範圍內在5 秒內建立圖像。
Albert Liu,創始人兼首席執行官
Kneron 希望透過AI 晶片來削弱Nvidia 的影響力,該晶片旨在降低企業的伺服器成本,並在生成AI 方面降低PC 的價格和能耗。
這家總部位於加州聖地亞哥的初創公司於6 月宣佈推出其第二代「邊緣GPT」伺服器KNEO 330,該公司表示,該伺服器可將小型企業的AI 成本降低30%-40%。該伺服器每秒可執行48 兆次運算(TOPS),最多可同時連接8 個,並且支援大型語言模型和檢索增強生成精度,可與雲解決方案媲美。
Kneron 已從高通和富士康等投資者那裡籌集了1.9 億美元的資金,該公司還發佈了第三代神經處理單元( NPU ) KL830,旨在支援低成本的AI PC 以及支援AI 的物聯網應用。
Jim Kim,聯合創始人兼首席執行官
MetisX 旨在透過開發基於Compute Express Link ( CXL ) 技術的智慧記憶體系統,使資料中心「更聰明、更快速、更具成本效益」。
這家總部位於韓國首爾的初創公司5 月宣佈,已從多家投資者處籌集了4,400 萬美元的A 輪融資,並表示計畫在美國建立業務並於明年推出針對超大規模客戶的晶片。
該公司表示,已經完成了向量資料庫、巨量資料分析和DNA 分析等大規模資料處理用例的原型。該公司報告稱,此類原型的效能比傳統伺服器CPU 提高了一倍。
Puneet Kumar,聯合創始人兼首席執行官
Rivos 希望透過結合高效能RISC-V CPU 和資料平行加速器的晶片來撼動資料中心市場,以實現資料分析和生成性AI 工作負載。
這家總部位於加州聖克拉拉的初創公司由前Google、蘋果和英特爾工程師創立,今年4 月宣佈已從包括英特爾和戴爾科技集團的風險投資部門在內的多家投資者處獲得了超額認購的A-3 輪融資,籌資逾2.5 億美元。
該公司在2 月與蘋果達成訴訟和解後,宣佈獲得資金,並表示將用這筆資金推出首款矽片產品並擴大團隊。蘋果指控這家新創公司從這家科技巨頭挖走數十名工程師,竊取商業機密,而Rivos 則以不公平競爭為由對其提起反訴。
Krishna Rangasayee,創始人兼首席執行官
SiMa.ai 希望利用強大而高效的晶片取代Nvidia 在邊緣生成AI 工作負載方面的份額,該晶片可以在一個「以軟體為中心」的平台上處理各種各樣的模式。
這家總部位於加州聖何塞的初創公司4 月宣佈已從投資者那裡籌集了7000 萬美元,其中包括戴爾科技集團的風險投資部門和Cadence 設計系統公司執行董事長Lip-Bu Tan。
該公司表示,將利用這筆資金繼續滿足客戶對其第一代機器學習系統單晶片(MLSoC) 的需求,該晶片專門用於電腦視覺,同時加快開發其第二代MLSoC,該晶片支援多模式生成AI 工作負載,包括語音、音訊、文字和圖像。
Jim Keller,首席執行官
Tenstorrent 尋求透過銷售專用處理器與授權晶片技術供他人使用相結合的商業模式,在人工智慧計算晶片設計方面開闢一條新道路。
這家總部位於安大略省多倫多的初創公司於2 月宣佈,已與日本尖端半導體技術中心達成“多層次合作協議”,後者計畫利用Tenstorrent 的RISC-V 和小晶片技術開發其2 納米邊緣AI 加速器。該公司還將擔任該晶片的聯合設計合作夥伴。
根據The Information 6 月報導,這家新創公司去年籌集了由現代汽車集團和三星Catalyst Fund 領投的1 億美元融資,現在又在由三星領投的新一輪融資中籌集了至少3 億美元,這讓Tenstorrent 的估值達到了20 億美元。據報導,另一家韓國大公司LG 電子也在就此輪融資進行談判。
Ljubisa Bajic,創始人兼首席執行官
Taalas 試圖透過設計直接實現整個AI 模型的加速器晶片來顛覆Nvidia 的通用GPU 戰略,據稱這可以將成本降低多達1,000 倍。
這家總部位於安大略省多倫多的初創公司由Tenstorrent 創始人Llubisa Bajic 領銜,於3 月宣佈已籌集5000 萬美元的融資,並透露了其項目,即建立一個自動化工作流程,將所有類型的深度學習模型硬連線到晶片中。
Taalas 表示,由於這種設計方法,它能夠設計出一款包含整個大型AI 模型的晶片,「而無需外部儲存器」。據這家初創公司稱,該晶片設計預計將提供比小型GPU 資料中心更高的效能,這為其將AI 計算成本降低1,000 倍以上開闢了道路。
該公司表示,計畫在第三季流片首款大型語言模型晶片,並於明年第一季向客戶推出。(半導體材料與工藝裝置)