我把這篇評價讓DeepSeek評價了一下,他是這麼說的:
這篇分析對DeepSeek的評價整體上是基於技術細節和市場邏輯的,具有一定的客觀性和精準性,但也存在一些值得討論的地方。以下是我對評價的進一步分析:
1. 技術突破的認可:
- FP8訓練、MLA架構和多token預測技術:這些確實是DeepSeek的核心創新點,能夠顯著提升訓練和推理效率。FP8精度的引入尤其重要,因為它降低了記憶體和計算需求,使得模型在本地裝置上運行成為可能。
- 推理成本的降低:評價中提到r1的推理成本比o1低93%,這一資料如果屬實,確實是一個巨大的優勢,尤其是在實際API使用中。這將大幅降低AI技術的使用門檻,推動更廣泛的應用。
2. 市場影響的邏輯:
- 邊緣計算的潛力:分析中提到邊緣計算可能引發PC和手機的升級潮,這一觀點是合理的。隨著AI模型在本地裝置上運行的可行性增加,硬體製造商和軟體開發商將迎來新的機會。
- AI應用層企業的利多:隨著AI技術的普及,軟體、網際網路等企業將受益,這一邏輯也是成立的。獨特資料和分發管道的價值確實會隨著AI的普及而提升。
3. 地緣政治因素的提及:
- 雖然地緣政治因素在技術發展中確實有一定影響,但評價中提到的“川普‘星際之門’計畫”與DeepSeek發佈的關聯性可能有些牽強。技術的進步更多是源於長期的研究和積累,而非單一的政治事件。
---
1. 訓練成本的誤導性:
- 評價中提到“6百萬美元訓練成本具有嚴重誤導性”,並指出這並不包含前期研究和大規模叢集的成本。這一點是正確的,但也可能被過度解讀。實際上,任何大型AI模型的訓練成本都不僅僅是直接訓練費用,還包括前期研發和基礎設施投入。這一點並非DeepSeek獨有。
2. 模型蒸餾技術的依賴:
- 評價中提到DeepSeek大量依賴模型蒸餾技術,並認為這暴露了美國GPU出口管制的漏洞。這一觀點有一定道理,但也忽略了模型蒸餾本身是一種常見的技術手段,並非DeepSeek獨有的策略。此外,蒸餾技術的成功也離不開DeepSeek自身的技術創新能力。
3. 對邊緣計算的過度樂觀:
- 評價中提到“兩年內超級手機將具備同等能力”,這一預測可能過於樂觀。雖然邊緣計算確實有巨大潛力,但其發展速度受限於硬體性能、能耗和成本等多方面因素。實現這一目標可能需要更長的時間。
4. 對人工超級智能(ASI)的推測:
- 評價中對ASI的經濟回報和潛在影響的推測更多是基於假設,而非實際資料。雖然ASI的潛力巨大,但其具體影響和回報尚不明確,需要更多時間來驗證。
---
這篇分析對DeepSeek的評價整體上是客觀且精準的,尤其是在技術細節和市場影響方面。然而,其中也存在一些過度解讀或過於樂觀的推測。技術的實際表現和市場影響往往需要時間來驗證,未來的發展可能會與預測有所不同。 (輕流AI嚴琦東)