#陳冕
Lovart 陳冕:Sora 證明巨頭無邊界,AI 創業得提前描繪未來
“事實證明,不焦慮的人做不好AI 應用。”「明年可能是to C 應用的元年。」9 月28 日,Lovart 創始人陳冕告訴我們。第二天,「元年」 被加速-OpenAI 發布Sora app,幾天後超越ChatGPT 和Gemini,登上美區App Store 下載總榜第一。Sora app 開啟了消費性AI 超級應用的可能性。過去2 年多里,從聊天機器人到AI 搜尋、深度研究、再到智能體,數輪成長最快的AI 應用都集中在生產端。今年5 月開始內測、7 月正式開放上線的Lovart 也是一個服務設計生產場景的垂類Agent。截至目前,Lovart 獲得了約20 萬日活用戶,年化預估營收超越3,000 萬美元。但陳冕仍覺得不夠快。在Sora app 發布前,他已在思考接下來的to C 機會:模型成本不斷降低,這讓to C 更可行。 to P(生產者)產品也讓更多人能創作AI 內容了──那最終內容消費是否也會改變?只是,Sora 讓一切又加速了。我們確實要考慮如何更快go big。因為在這個時代,每個巨頭都比想像中更厲害,更沒有邊界。配合新野心,山姆·奧特曼(Sam Altman)已在瘋狂鋪設算力和能源設施。 9 月底,OpenAI 宣佈與輝達合作新資料中心,總耗電量將達10 吉瓦(GW),超過夏日高峰時的紐約市。此外還有總計17 吉瓦的其他項目正在推進。本篇訪談的第一部分發生在Sora 發布後,產品經理出身的陳冕分享了他對Sora 的體驗和觀察:我意識到這是一個社交產品,它可能比「AI 抖音」 還要大。訪談第二部分,我們複盤了4 個月來Lovart 的實踐;以及2023 年以來,陳冕摸索的AI 應用創業破局之路:AI 應用怎麼做成長?就是提前描繪未來,然後等它發生。垂直應用公司本質在做兩件事:特殊的互動,和特殊的上下文。因為頻繁換工作,陳冕過去被認為沒有耐性,而這次開始創業後,他經歷過公司瀕臨倒閉,也在最困難時拒絕過收購意圖。一些投資人和同行評價他很有韌性。現在的韌性來自信念,信念又來自認知。我不是為了創業而創業,是為了贏而創業。山還在、我們也能到達,那為什麼不能努力往那裡走呢?Sora app 發布:“每個巨頭都比想像中更厲害,更沒有邊界”“我想到了to C 是下一個機會,但沒想到就猝不及防地在這個假期突然發生了。”晚點:我們上次聊剛好是Sora app 發售前夕,現在Sora 出現,產業又有了大變化。陳冕:對,變化總會比你想像的時間早一點。幾天前,我說明年是消費性AI to C 應用的元年,這個判斷沒變;但沒想到,關鍵的timing 就猝不及防地在這個假期發生了。我之前判斷巨頭的速度不會那麼快,但顯然錯了。 OpenAI 比想像中更激進,它不只追求AGI,也追求最牛的產品。晚點:Sora app 上線後,你從凌晨3 點開始連玩了4 小時,你看到了什麼?陳冕:我真的被驚到了。這種感覺我至今只體驗過3 次,前兩次是抖音和ChatGPT,第三次就是Sora app。我意識到這是一個社交產品,它可能比「AI 抖音」 還要大。晚點:怎麼在使用中獲得這種感知的?陳冕:一開始我本來對Sora 沒有預期,因為它上線很突然。我使用的第一個感受是順滑,很快就完成了前幾部作品。例如我讓ChatGPT 寫了一個“無間道” 天台對決的腳本,然後用Sora 的cameo(出境秀)功能讓我和Sam Altman “合拍”,那是我第一次打開聲音——Sora 2 是一個音畫同出的模型——當時我就感覺,新世界的大門打開了!編者註:cameo 的玩法是,使用者在Sora 介面裡拍攝自己的臉部(類似人臉辨識步驟),念數字,產生AI 形象和音色,然後選擇授權範圍。這樣你自己或被授權的其他人就可以在生成影片時讓你「出鏡」 合拍。 Sam Altman 向所有用戶開放了cameo,所以它一度刷屏Sora。這影片有鏡頭語言,有敘事;音畫同步很好,音色很像我本人;角色一致性也很好。而這一切不需要抽卡,一次就能成功。更重要的是社交-最開始除了和Sam 合拍,我不知道幹嘛,因為其他人我都不認識;所以我就給同事分享邀請碼,拉大家一起玩;這時我驚覺,這不就是社交嗎?這是一個特別大的aha moment。邀請更多人後,我再去刷資訊流,又體驗了Sora 的另一個關鍵機制-Remix(重新創作)。 Remix 核心解決的是共創。這是我自己思考過的問題,就是怎麼更簡單地讓使用者接力共創,這是激發更多AI 內容的關鍵。 Sora 在Remix 上做了滑動互動,很順滑。我認為最優秀的互動不會超越點擊和滑動,而且它都太複雜了。整體來說,Sora 的關鍵連結都設計得很好,完成度挺高。晚點:比Sora app 早4 天,Meta 也在「Meta AI」app 上上線了AI 短視頻功能Vibes,但幾乎沒什麼聲量。陳冕:單純的AI 生成短片產品早就有了,這次的核心還是社交。 OpenAI 自己也說,如果沒有cameo,就不會有這款產品。晚點:你覺得Sora 的模型有甩開其它公司嗎? Google Veo3 先前已能實現音畫同出。陳冕:妙就妙在,它在模型能力最適合的時候,做了它最適合的產品型態。晚點:一家中等體量的AI 新創公司有可能率先做出像cameo 這樣的新互動,從而引爆市場嗎?陳冕:首先,Sora 不只是產品創新,它的模型也是SOTA(State of the Art,業界最優)水準。只有掌握頂尖模型,同時它的文化、組織還能孕育產品創新的公司才能做出Sora。第二,如果一家中型公司真做出了Sora,我覺得也能火,但接下來會面臨巨大挑戰。首先是人臉資訊的隱私、監管問題,其次是成本,Sora 已到了蘋果總榜第三,卻一分錢沒收,影片產生是很貴的。更現實的是,一旦它火了,巨人馬上就會跟進。巨頭有流量、有資金,中小公司根本扛不住。所以AI 社交這註定是巨頭戰場。晚點:你認為Sora 未來可能會是多大的產品?陳冕:它有可能是個虛擬世界的微信。未來人類的社交可能分成兩個世界—「虛假的真實」 和「真實的虛假」。那種對人更有吸引力還未可知,很可能兩個世界會同時存在,爭奪我們的時間。如果把它看作社交產品,這可能是一個數十億級用戶的機會。晚點:這會怎麼影響AI 領域大小公司的動作?陳冕:這是一場所有模型巨人都輸不起的仗。無論你認為Sora 成為超級應用程式的機率是10% 還是20%,錯過的代價都太高,而贏下的意義又太大。所以想抓住這個時代最頂尖超級應用的公司,和現在已經擁有超級應用程式的巨頭,都不會放過這個機會。晚點:社交有網路效應,有先發優勢和時間窗,你認為留給其他人的時間還有多久?陳冕:可能就3 到6 個月。晚點:Sora 對新創公司的影響是什麼?陳冕:好的一面是,Sora 會為AI to C 帶來資本湧入和注意力,所有新創公司都可以好好思考to C。但同時,我們確實要考慮如何更快go big。因為在這個時代,每個巨頭都比想像中更厲害,更沒有邊界。晚點:你把OpenAI 算作巨頭,它其實既有巨頭級的資源;又有一個新公司的銳氣和飢渴——團隊扁平,同時尚未獲得一個能帶來穩定利潤的業務。陳冕:這就是為什麼要盡快go big,資本正以史無前例的速度聚集。人類歷史上從未有OpenAI 這樣,在推出第一款主力產品後,短短幾年內就估值超過5,000 億美元的公司。一切都在被加速,市場極度樂觀,能投的都在往這個方向砸錢。晚點:這種樂觀中有什麼風險嗎?陳冕:成長速度的錯配。因為太樂觀,人們對無法被加速的事也抱持過高期待,當預期落空,就會沮喪懷疑。典型的就是建設算力和能源設施都需要時間。在基礎架構更完備前,Super App 短期的成本會很高。如果應用發展和算力建設周期有較大錯配,甚至可能帶來短暫的泡沫破裂。而且算力越緊張,資源越會往頭部集中。我們非常希望基建和能源設施能更快完善,不要被實體底層卡住。晚點:除了算力和能源基建,還看到了什麼無法被加速的事?陳冕:人心。使用者習慣的改變需要時間。再往下,真實與虛擬的邊界會越來越模糊,我們怎麼接受?能多快接受?當然新事物都是在爭議中前進的,人心不會變得那麼快,但也一直在改變。“不是服務所有人,而是服務有創作欲的人”20 萬活躍用戶、3,000 萬美元年化預估收入。晚點:5 月Lovart 剛開始內測後,你就去了舊金山。當時你提到,要在未來幾個月努力做到“幾千萬ARR”,現在實現得怎麼樣了?陳冕:Lovart 目前的年化預估收入已超過3,000 萬美元。截止9 月底,我們日活用戶到了15 萬到20 萬,在7 月beta(內測)結束前,每天是1 萬到2 萬,beta 放開後迅速到了8 萬到10 萬;Nano Banana 後,Lovart 更好用了,用戶又上了一個台階,到了約20 萬。所以我們不是先爆、再微跌,而是一步一階往上漲。這是我挺開心的一點。晚點:這些用戶是怎麼分佈的?陳冕:1/3 在美國,美國也是Lovart 目前用戶數和收入最多的市場。晚點:3000 萬美元的預測年度訂閱收入能涵蓋服務成本嗎?陳冕:不行,現在的Agent 都不行,因為API 很貴,而且我們有一定免費額度,免費到付費的轉換需要時間。但我對Agent 的長期商業模式毫不困惑,token 一定會更便宜,就和電與上網流量一樣,都是早期貴,普及後會很便宜。訂閱至少會是一個基礎的商業模式,未來也可能發展出以思考時間收費的方式。晚點:Lovart 團隊去北美後,為什麼還沒有接受全球化機構的投資?陳冕:我們未來一定會考慮全球化資金,但5 月Lovart 上線那會兒,我們剛敲定融資。當時去北美的更優先工作是搭建團隊和離全球用戶更近。晚點:直接接觸美國用戶後,看到了什麼?陳冕:在灣區,我最常被問到的問題是,我的熱情和願景是什麼?很多人會問我們,這個產品它到底是給所有人用的,還是給專業人士?現在答案更清楚了:因為我做這家公司的願景,就是希望把創作能力平權,釋放更多人的想像。 AI 時代,能做、想做設計的廣義設計師和創作者的數量正在變多。所以我們現在的定位是:“for everyone who wants to create”,不是服務所有人,而是服務所有有創作欲的人。對非專業人士,Lovart 像AI 創作工作室,能幫你把創意落地。一個典型場景是北美的一些中小商家,例如咖啡店主,他想做自己的全套視覺物料,包含logo、包裝、菜單等等,如果去找設計師來做會很貴,現在AI 可以讓它更普惠。我們也在美國接觸了許多專業設計師,他們追求自我表達,不會用AI 直接出結果,而是更多把Lovart 當作靈感助手,讓它出底稿,自己再完善。所以不論是專業設計師、半專業創作者還是一般用戶,只要有創作需求,都能用Lovart 來做設計。“AI 應用公司怎麼做成長?提前描繪未來,然後等它發生”“垂直應用公司本質在做兩件事:特殊的互動,和特殊的上下文”晚點:2023 年創業之初,你曾把AI 應用的創業機會分成5 個方向:生產端是Office 和Adobe,消費端是搜尋、社群和泛娛樂。這個判斷現在有更新嗎?陳冕:目前沒有超出這個框架。現在所有大體量的To C 和To P(生產者)產品,基本上都是Office 類別的生產工具和Adobe 類別的視覺創作工具。Coding 可以看作是新時代的Office 。程式語言是LLM(大語言模型)的原生語言。處理文字、訊息、程式碼,都是LLM 的內生能力。但所有這類應用創業都面臨一個挑戰:如何與大模型廠商拉開差異?另一類是“Adobe 系”,圍繞著多模態模型展開。它離大模型的主軸有一段距離,既能利用大模型的能力,但又能在自己的場景下做出差異化。所以最開始我們選擇從這個角度來切入。晚點:這種距離還成立嗎? OpenAI、Google 等核心模型公司都在更多投入多模態。陳冕:有距離,不是指巨人不做多模態。再往下,追求AGI 也會經過多模態和世界模型等環節。但模型巨頭的最主軸仍是語言,是構建“通用智能”,是創造一個高智商的通用人。我們作為垂類產品,則是在通用人的基礎上,創造一個設計師或創作者,它需要更多行業經驗和數據。應用公司的生存空間,正是在於你既能用好這個「通用人」 的能力,又不要去做一個通用人就能做好的事。晚點:這個思路怎麼體現在你們的產品設計上?陳冕:垂類應用公司本質是在用產品表達兩件事:一是這個行業裡的特殊工作方式,它決定了人機互動方式和產品介面;二是一個行業中要積累的經驗和數據,它決定了怎麼給context(上下文)。例如為什麼我們要做ChatCanvas 功能?就是因為在互動上,你和設計師溝通時,絕對不會只對著他的臉說話,而是必須對著一個桌面或畫布,上面擺滿圖片等素材。設計的溝通離不開視覺對齊。ChatCanvas 是Lovart 今年7 月正式上線的功能,它可以在畫布中框定區域,然後透過自然語言互動讓Agent 修改和編輯。如果你和一個人說話時只需要看他的臉,這就是Chatbot 要處理的通用場景;如果你必須對著視覺素材,那就是ChatCanvas 的場景。晚點:ChatCanvas 這種互動方式好像挺自然的。為什麼Lovart 之前沒人做出來?陳冕:因為在模型能力到之前,大多數人不會做這件事。今年有幾個密集進化:GPT-4o 更新Image-1(4o 系列的文生圖模型),在指令跟隨、一致性、文字生成能力上都大幅提升,然後是Google 的Nano Banana,包括字節的Seeddream 4.0,能力持續上台階。這些變化太快了,所以大部分人還來不及做。晚點:而你們提前預判了模型的提升,提前做了準備?陳冕:對。 AI 應用公司怎麼做成長?其實就是提前描繪未來,然後等它發生。應用公司本身不掌握模型創新,所以要預判它的演化,先設計出模型到下一階段後可能出現的互動方式,等模型ready 的那一刻,你就瘋狂show 出來。Lovart 本身就是這樣一個提前構建,原定五一上線,上線前GPT-4o 發布了Image-1,我們特別開心,等Nano Banana 出來後,就更開心了。晚點:具體來說,你們要在產品、工程上做什麼,才能接住不斷提升的模型能力?陳冕:第一個是密切跟進模型迭代。還是以ChatCanvas 為例,我們最早設計這個互動時,連GPT-Image-1 都還沒發。這時的模型理解不了複雜的多輪指令、一致性差、編輯能力較弱,很難實現「指那裡改那」 的體驗。但如果你密切追蹤模型迭代,和模型團隊交流,就會發現他們正集中攻克這些問題。有些紅極一時的做法,例如ControlNet,反而在模型提升後就不常用了。(編按:ControlNet 是一種神經網路結構,透過增加額外條件來控制擴散模型的圖像生成過程。)第二,我們有一個明確假設──模型在變強,但短期是更像人,還沒超越人。所以Lovart 的設計哲學就是「還原人與人的溝通」。我們怎麼跟真人設計師溝通,就怎麼跟Agent 溝通,以此評斷互動是否合理。我賭ASI(超級人工智慧)還沒那麼快到來。晚點:ChatCanvas 等互動創新之外,你們也在Lovart 裡更新了影片產生能力,設計群組有這個需求嗎?陳冕:做影片的人大部分都會做圖,因為影片往往是從分鏡稿開始的。所以一個做圖的公司大機率會延伸到視頻,因為你很多用戶的下游場景就是視頻。晚點:做3D 也是這個邏輯?陳冕:3D 不太一樣。短期內,我們的重點還是圖和影片。因為現在的主流裝置主要展示平面視覺內容,3D 內容的消費還沒起來,生產需求就沒那麼多。晚點:除了這些已經上線的功能,你還看到了那些未被滿足的需求?陳冕:設計師還需要更多context。例如要為《晚點》做一套品牌設計,就需要理解《晚點》的歷史、調性、觀眾、過往視覺風格和你們的喜好。我們把設計的context 抽象化成兩個類別:Reference(參考):包括私有和公有兩種。私有reference 是品牌過往的風格素材;公共reference 是流行趨勢,例如宮崎駿或多巴胺風格。Preference(偏好):來自長期合作中對顧客美感的積累,例如有人喜歡極簡,有人偏好插畫。 AI 設計師要透過多輪互動發掘並記住這些偏好。本質上,未來的AI 設計師要能持續吸收、學習這些上下文,最終給出更滿足你需求的產出。晚點:“給設計更多context”,落到產品上是什麼樣的?陳冕:我們正在做一個context 模組:透過多輪對話補齊上下文,沉澱長期的素材庫,記住使用者偏好。首先是在prompt 過程中,我們做了一個小模型,它會追問用戶,補充更多context,比如品牌歷史、過去的物料等等,我們也支援直接甩個鏈接,理解其中的多模態資訊,比如通過官網理解風格。以上過程做的多了之後,就會慢慢沉澱一個使用者自己的素材庫,在未來呼叫中,Lovart 就可以從reference 和preference 函式庫上調相關風格,和使用者確認、快速達成共識。晚點:大模型現在對美感和風格的判斷能到什麼程度?陳冕:肯定沒有人那麼好,但在很多場景已經夠用。例如它看到《晚點》的風格,不會覺得這是娛樂媒體。多模態模型的理解和辨識能力都在快速變強,這還是在「提前準備,提前描繪未來」。晚點:怎麼能做到持續提前描繪未來?或者說怎麼提高成功率?陳冕:核心就兩點,離使用者更近,離技術更近。真正的困難是取捨:你見到用戶後,一定會發現一些需求,模型還滿足不了,那這個點你做不做?要不要用傳統方式做?例如我們做全球市場時發現,現在除了英文和中文,影像模型在生成其他語種時的效果都不好。那一個很有意義的討論就是,該用那一種方式加文字?用模型直接生成文字:美學風格更一致,但現在容易翻車,可控性不好。用傳統方式,拖一個文字框加文字:好用、可控,但美學不一致,更大的風險是,如果模型很快迭代了,這些「補丁」 可能就白做了。這類問題沒有簡單答案。從使用者體驗角度,如果模型短期內解決不了一個剛需,那麼用別的方式頂上可能是對的。但如果模型馬上有大進展,又可能摧毀掉過去的努力。晚點:你自己離科技更近的方法是什麼?你創業前的工作經驗比較是在產品和商業化。陳冕:最有效的方法是技術同學讀論文,再講給我聽。我常用“人” 的比喻來理解大模型:pre-train(預訓練)像培養“合格的人”,post-train(後訓練)是給他“入行經驗”,reasoning(推理)是“思考與決策”,RL 是人在實踐中學習。所以,身為一個產品經理,我的優勢是在沒有那麼懂技術的情況下,能用產品思維快速提煉、類比,把技術能力落到產品上。晚點:5 月聊時,你曾擔心,多模態生成領域的閉源模型會甩開開源模型,這不利於應用新創公司。現在這件事持續發生,Veo3、Nano Banana、Sora 2 等陸續出現。現在怎麼看這個問題?陳冕:現在不擔心了。開源、閉源,本質影響兩件事:一是成本。開源成本更低、更可控,但即使用閉源模型,token 價格也必然越來越低;二是要不要做後訓練。閉源沒法做後訓練,但後來我們發現,即便不做後訓練,我們在上下文工程還有很多可以做的,AI 應用公司在工程側、產品側的空間已經足夠複雜了。晚點:你有在意的競爭對手嗎?陳冕:細到「創作型Agent」 這個品類,除了我們,其他還偏小。整體來說,這個領域有潛力的公司有3 個類別。一是2023 年那批做多模態生成的,如Krea、Higgsfield、Freepik 等,他們都可能往Agent 轉型,Midjourney 不一定,它更偏模型。然後是Adobe、Canva 這類垂直產業巨頭,但這類新產品一定要到一定收入量,例如年收入超過1 億美元,才對他們有意義。第三是核心模型公司,我認為它們短期內會更專注於通用Agent 和coding 等能力。我覺得現在處在一個新變化的孕育期。 To P 創業窗口期已接近關閉,你現在聽到的產品都是競爭後的結果。我更看好下一波to C(消費者)應用程式的機會。晚點:所以你們何時會做to C?陳冕:一定會做。我覺得明年會出現有趣的公司,可能是to C 元年。影像和視訊模型的成本都在不斷降低,Veo3 前段時間開始打5 折,Nano Banana 也比GPT-Image-1 便宜很多,確定性的成本下探會讓to C 更可行。然後是to P 過去的發展,讓更多人都能創作AI 內容了。那最終內容消費是否也會改變?(編按:以上訪談發生在Sora app 發布之前。Sora app 其實就是一個生成式AI 從生產端產品到消費端產品的變化。)“事實證明,不焦慮的人做不好AI 應用”“往往在你覺得短期有點高估它(技術進展)時,過兩天你又發現低估了它。”晚點:Lovart 5 月內測的目標之一,就是要做第一個上線的垂類Agent。這之後你們一直保持很快的更新節奏。這種迫切來自那裡?陳冕:一切都在加速,timing 在AI 時代更重要了。過去抓住一個成功業務形態,可以吃10 年,現在也許只能活兩年。每一波新產品和新體驗的建置窗口期都很有限,不能快速做出產品、取得用戶,這一波就錯過了。但下一波也不遠,錯過也別太急,要提前想下一波。所以一個公司現在想持續成功,就不能像行動網路一樣抓住一個PMF 後就慢下來。你想想,如果Manus 沒有在第一個產品後做出Manus,我們沒有很快做出Lovart,公司狀況會完全不同。人們的情緒也不斷在「不過如此」 和「FOMO(害怕錯過)要死」 間來回搖擺。既怕技術不發展了,又怕技術發展太快。整個情緒、業務、產品、融資和經營節奏,都面臨很大挑戰。但這也是好事,表示技術真的發展很快。往往在你覺得短期高估它時,過兩天你又發現低估了它。晚點:從2023 年創業以來,你們錯過了什麼比較重要的時間窗口嗎?陳冕:幾乎沒錯過重大的。總共是這樣幾波,一是23 年創業時,現在我也沒後悔,我們沒有一上來就做全球市場。因為當時Midjourney、Stable Diffusion、Leonardo 等文生圖應用都出來了,搶「全球版圖」 已晚,我們在中國市場跑得最快。第二波就是Agent,我們做了Lovart。第三波抓得準不準?就看我們to C 做得怎樣。晚點:沒錯過重大窗口的原因是什麼?陳冕:我很焦慮,團隊也很焦慮。但如果真想做好AI 創業,你需要和焦慮共處。核心是要搭建一個高頻迭代的組織:能不斷理解新技術;能明確快速變化中,有些事沒辦法做得很深,所以必須選擇槓桿最大的事,優先做。晚點:這可能會帶來頻繁的方向和團隊調整,還有混亂,你覺得這是個問題嗎?陳冕:確實有人抱怨今天這樣、明天那樣,但這在現在不能避免,除非技術放緩。一定有一些人比較喜歡優化確定性的事物。但現在常常是來不及優化,技術又變了,這對心態和組織是個考驗。晚點:核心團隊裡,你很焦慮,其他人呢?陳冕:沒有人是淡定的。從reasoning、強化學習到Agent 潮,再到大家發現做情境工程有很多空間,總共就半年多。你想自己慢慢搞,就很有可能跟不上。事實證明,不焦慮,做不了AI 應用。晚點:近期你最焦慮的事是什麼?陳冕:最近我們在做的context 模組,我認為方向是對的,但不是我們還不夠快?晚點:實際上context 模組什麼時候會上線?陳冕:應該是10 月底。“過去他們說我沒耐性,現在他們說我有韌性”晚點:你們公司在23 年底到24 年初曾瀕臨倒閉,最後還是撐過來了。一些投資人和同行認為你已經被驗證的特質之一是韌性。陳冕:這事兒好好玩,我沒創業時換過很多次工作,大家覺得我沒耐性。創業後,對我的評價是有韌性。我創業這次確實更有韌性了,但我不是個盲目堅持的人。過去頻繁跳槽,是因為認知不夠,那十年逐漸累積許多樣本後,現在的韌性來自信念,信念又來自認知。我有幾個大假設:AI 是不是還在快速發展? AI 是不是會取代所有虛構內容的創作?如果是,我們沒理由不繼續。晚點:最困難時,你們曾獲得收購邀約,團隊裡有人想接受,但你拒絕了。當時是怎麼想的?陳冕:先澄清一下,那不是完整的收購邀約,是有幾個收購意向,我都擋掉了。和團隊溝通前,我已經決定拒絕。回頭看,我可以有更好的溝通方式,這也是我作為CEO 的成長:如果自己相信,就要把信念堅定傳遞給團隊,我沒想過要賣。這也不是一個感性決策,而是一個理性判斷:我不是為了創業而創業,是為了贏而創業。當時我認為,山還在、我們也能到達,那為什麼不能努力往那裡走呢?晚點:你什麼時候發現創業比你最開始想像的更殘酷?陳冕:我到現在都不覺得創業很殘酷。它焦慮、痛苦,但同時又很快樂、很酷。有人說過:當你做一件你熱愛、也很痛苦卻又很爽的事,那可能就是你的「天命」。這有點像極限運動,它確實很危險。但在過程中,你不能總是想著危險,否則就真掛了,你得專註解決眼前每一件事。它也有點像魂類遊戲:小怪兩刀把你放倒,BOSS 更是一刀秒,可一旦摸到那條“正確路徑”,也能戰勝原本強大的對手。挫敗感拉滿、正回饋也拉滿。我覺得這是創業的魅力,也是我熱愛這件事的原因。晚點:你的投資人之一,明勢合夥人夏令說你是「遇強則強」 的創辦人。陳冕:是有點這樣,我們遇過3 次比較大的挑戰:第一次是找第一個產品的PMF,我覺得我先看到了PMF,後來被驗證,我很快樂。第二次是差點倒閉。我覺得這怎麼會倒閉?不會的!然後沒倒閉,更加快樂。第三次是怎麼做出Lovart——在明確知道上一代產品不是未來時,怎麼盡快做出下一代產品,怎麼用想像力描繪未來,而且我們居然第一個做到了,更加快樂。每一次都是最焦慮、最痛苦的時候;但每一次跨越,我的成就感都越來越大。當然再往下,你可能還會承受更大的痛苦。但痛苦和快樂是並生的。晚點:你害怕自己身上的什麼特質嗎?陳冕:害怕自己迭代速度不夠快。至於要不要焦慮這件事,其實需要取捨。如果科技發展放緩,我們要沉下心做精細化,穩一點;如果仍在加速,就必須擁抱新東西,用極致的焦慮逼自己保持高敏感、快吸收、快決策。晚點:你說焦慮需要“取捨”,但一般認為焦慮是一種情緒,挺難被控制。難道你有一個開關,可以去打開和關閉焦慮嗎?陳冕:我可以用一些方式遮蔽它。例如你應該接收多少外部資訊?至少在目前,我覺得還是要保持高頻訊息接觸。以及我要在冷靜下來時,去處理情緒,我覺得這個我是可以控制的。晚點:你好像在用底層的理性控制上層的感性表達?陳冕:對。有些人會覺得我超級感性,能量很高、非常嗨。但本質上我是個感性的理性者。因為AI 真的沒辦法計劃,我越來越依賴各種資訊給我的feeling,以及靈感湧現。但做決策還是理性,例如團隊上也是,迭代很快,合適的人留下,不合適的及時調整。晚點:我看到你最近的「感性」 一面,是分享了TI14 Dota 2 的比賽結局,Extreme 戰隊輸了,你說:「青春總有遺憾」。陳冕:對,他們跨越六年、輸了三次。每次都是在2 比2 時輸掉最後一局。我是Dota 老玩家,所以有些感傷。這也是一種投射,他們也是為了自己的喜歡的事在努力奮鬥,有非常多波瀾起伏,也有非常多遺憾。但是如果不去做,就沒有青春。青春就是奮鬥的過程。晚點:你現在還能感覺到青春在心中湧動嗎?陳冕:現在就是我的青春。過去在學校、各家公司的工作,都是為了現在。這是我真正第一次自由的、全情的、瘋狂的想做成一件事情。 (晚點LatePost)
和兩位CEO 聊Sora: 應用層爆發的里程碑事件,創業者的機會來了
AI 應用戰爭,Sora 打響了第一槍。99% 的人都搞錯了。「Sora 不是『AI 版抖音』,它更接近『AI 版ins 或朋友圈』。」這是Lovart 創始人陳冕,在與極客公園創始人&總裁張鵬、Sand.ai 創始人曹越對話中的核心觀點。就在所有人享受十一假期的第一天,OpenAI 發佈了新一代文生視訊大模型Sora 2,以及配套應用Sora App。一瞬間,全球科技圈被徹底點燃。 Sora App 在嚴格的邀請制下,仍火速沖上美區下載榜第三。然而,喧囂之下,爭議也隨之而來:這會是AI 時代的TikTok,一個超級應用的誕生?還是又一個「現象級」的煙火,綏爛一瞬,便迅速冷卻?在與張鵬的對話中,陳冕和曹越給了一個清晰的判斷。陳冕認為,Sora 是繼抖音和ChatGPT 之後,又是一個里程碑式的產品,它真正開啟了AI 的ToC 應用時代。其核心突破在於,OpenAI 展現了「為產品打造模型,而不是為模型尋找產品」的想法。 Sora 透過Cameo 等功能,巧妙地解決了「AI+社交」的難題,將重點放在熟人關係的「低成本Remix」共創上,而非單純追求視訊品質。這意味著,定義應用與產品的能力,其重要性正變得與建構模型同樣重要。從技術視角,曹越則表示,Sora 在音畫同步、人物ID 保持和多鏡頭敘事上的突破,正是為了跨越C 端消費門檻而做的關鍵最佳化。這些最佳化與產品定義相結合,爆發了強大的力量。Sora 的出現,也讓兩位創辦人重新審視AI 應用的終極方向。他們一致認為,AI 時代最大的機會在於「AI 原生」。如何定義AI 原生呢? 「你就想,沒有AI,這個業務或內容還存不存在?如果不存在,它就是AI 原生的。」陳冕解釋。他認為,對於創業者來說,AI 應用的時代才剛開始,但不要想著去做AI 版微信,因為新創公司做通用社交幾乎不可能成功。真正的機會在於,將最好的產品創意和最好的模型進行整合。這場變革也帶來了更激烈的競爭。陳冕認為,AI 時代的發展速度遠超以往,人才、算力、資本都在往頭部集中,導致競爭被前置。這是一個「Go Big or Go Home」的時代:平庸的改良者註定出局。對創業者來說,這既是最好的時代,也是最卷宗的時代。在這場風暴的中心,兩位創辦人對未來都清晰而堅定。陳冕表示,Lovart 將激進地探索ToC 的AI 原生應用。曹越則透露,Sand.ai 將在國慶日後推出全新的音畫同出模型,面對挑戰。只有那些敢於將頂尖產品創意與模型深度整合、並全心投入創造全新體驗的玩家,才能最終定義下一個時代。以下為陳冕、曹越與張鵬對話內容實錄,有編輯刪減。01. 解構Sora:「AI 原生超級APP」的雛形張鵬: 看大家興奮又略帶疲憊的樣子,想必是熬夜玩Sora 了。你們是連夜守著發佈,還是隔天一早才發現世界變了?先請兩位聊聊體驗Sora 的第一個感受吧?陳冕:我是連夜看的,記者會是凌晨1 點。看完我馬上就去弄美區帳號,結果被蘋果的安全延遲卡了一個小時,急得不行,大概3 點左右才拿到邀請碼。坦誠講,我本來期待沒那麼高,但用完後我感到非常震撼。我是一個產品經理出身,最近十年裡,能讓我感到震撼的時刻只有三次:第一次是2016、17 年玩抖音,第二次是2022 年底玩ChatGPT,第三次就是這次的Sora。我覺得ChatGPT 開啟了以模型為中心的時代,而Sora 則開啟了一個應用的時代,尤其是一個ToC 應用的時代,這是里程碑式的。我從凌晨3 點玩到早上7 點,實在扛不住睡了三小時,10 點起來接著玩,然後就開始拉團隊開會。所以到現在我都是亢奮狀態,對未來即將發生的事感到非常興奮。曹越:我是早上醒來看到各種群組都炸了。我的感受是,從效果上來說,它非常令人興奮,而且是一個為產品最佳化得非常完整的模型。但從模型本身的技術視角來看,效果雖好,卻沒那麼令人意外。因為包括我們自己在內,過去幾個月也一直在探索影片和聲音同步生成的能力。現在大家玩的很多梗,我們內部在早期模型上已經玩過一遍了。所以,這種感受更像是我們內在的興奮點被釋放到了外在。張鵬:從技術角度來看,Sora 2 的核心進步在那裡?曹越:我覺得有三點:第一,當一個視訊模型能同時做到畫面和聲音同出時,它就越過了C 端消費的臨界點。過去一年的影片模型大多隻能產生無聲的GIF 式畫面。第二,它能維持人物ID,也就是Cameo 功能。這個ID 同時包含了樣貌和音色。之前有些模型能保留長相,但Sora 能同時鎖定樣貌和音色,這讓它的可消費性和傳播性大大增強。第三點,也是很多人可能沒注意到的,它生成的10 秒影片帶有敘事屬性。它不再是單一的片段,而是包含了運鏡、多鏡頭切換(我最多看到切了8 個鏡頭)和景別設計。這是一種以前沒有展現過的能力。當這三點結合在一起,就爆發出了強大的力量。張鵬: Sora 的邀請機制很聰明,形成了病毒式傳播。陳冕你身為產品經理,拋開技術,單看這個產品,有什麼值得圈點的創新嗎?陳冕:這是我第一次看到一個AI 原生超級APP 的雛形。首先,OpenAI 這次想得非常清楚:它是為產品打造模型,而不是為模型找產品。這顯示它不只想做一家模型公司,更想做一家消費網路產品公司,野心昭然若揭。模型可以被快速追趕,但一個成功的產品,其使用者和網路效應是很難在一個月內被顛覆的。其次,它解決了「AI+社交」這個大命題。最大的ToC 應用就是社交,而Sora 的Cameo 功能就是答案。為什麼大家都在跟Sam Altman 或自己的朋友合拍?因為社交的樂趣建立在熟人關係之上,而不是視訊品質本身有多高。你朋友圈的照片品質一定很高嗎?不是,但因為是你熟悉的人,所以感覺不一樣。這也解釋了為什麼邀請碼機制能如此成功,它天然就適合基於社交關係進行裂變傳播。最後,它用一種極其簡單的方式解決了「共創」的問題。 AI 降低了創作門檻,而Sora 的左右滑動互動,本質上就是一種低成本的Remix。你在別人的影片上進行再創作,這種互動方式簡單到了極致——就是滑動和點選,這是頂級行動網路產品的共通點。所以你能理解我有多興奮。身為一個產品經理,這些問題我想了一年多,現在有人把答案做出來了,就放在我面前,這太酷了。後來它迅速登上美區App Store 總榜第三,也驗證了它的成功。02. 為產品打造模型,而不是為模型尋找產品張鵬: 確實,你剛才提到了一個核心觀點:Sora 這個產品形態的成功,是因為它的模型是圍繞著產品來打造的。這與許多先做模型再找應用的團隊形成了鮮明對比。從技術角度來看,有那些明顯的跡象能證明這一點?曹越:我非常同意陳冕的觀點。 OpenAI 展現了一種強大的垂直整合能力,即組織內部同時擁有頂尖的模型能力和敏銳的產品洞察力,並且能讓產品需求反過來指導模型的迭代方向。這已經不是第一次了。上一次的典型案例就是ChatGPT。 GPT-3 模型的核心能力早已存在,但OpenAI 真正的厲害之處在於,他們將這種能力對齊了普通用戶的需求,把它打磨成了一個極其易用、易於傳播的產品。這種組織能力是非常高階且稀缺的。大多數團隊都會陷入「先做模型還是先做產品」的內部矛盾。具體到Sora,一個關鍵的例子就是音畫同步。從純技術角度看,把聲音做好,可能不像把影片或語言做好那麼難。但從產品和使用者視角來看,聲音是決定性的。正是因為Sora 能讓音畫同步輸出,才使得一般使用者產生的影片具備了直接的可消費性,越過了C 端產品普及的臨界點。這種洞察力——關注用戶真正想要什麼,而不僅僅是技術上什麼最難——是一個只會埋頭訓練模型的基礎模型公司可能不具備的。 OpenAI 再次證明了,他們不僅有能力建立強大的模型,更有能力將模型與產品完美結合,這正是他們最令人敬畏的地方。張鵬:OpenAI 在技術和產品之間的切換並非沒有代價。去年那場宮斗大戲,現在看來,或許正是為了將重心徹底轉向產品側而經歷的必要撕扯。 Sora 的出現提示我們,在追趕模型的同時,定義產品的能力也必須跟上。你怎麼看呢?陳冕:這完全說出了我的心裡話。我這兩天想明白一個重點:Sam Altman 是一位非研究員出身的CEO,他是一位頂尖的「產品+融資+策略」大師。在過去幾年由研究員主導的「模型競賽」中,讓一個由純研究員主導的公司率先做出頂級產品,是很難的。OpenAI 的成功得益於其獨特的組織結構:它既擁有頂尖研究員,也由一位非研究員出身的頂尖產品策略大師領導。同時,它兼具新創公司的高融合度與巨頭的雄厚資源。正是這種獨特的組合,讓OpenAI 率先做出Sora 變得順理成章。我之所以興奮,是因為這預示著整個產業的組織方式和話語權將會改變。定義應用和產品的能力,其重要性正變得與建構模型同樣重要。就在大家還在討論OpenAI 的模型領先優勢是否縮小時,他們已經透過產品開啟了下一階段的競爭。底層模型的競爭格局已相對集中,但Sora 的出現,就像當年的ChatGPT 一樣,正式拉開了AI 應用層競爭的序幕。張鵬:除了剛才總結的那些結構性突破,你覺得Sora App 在產品層面,有那些做得特別聰明的地方?陳冕:我認為Sora App 的背後一定有產品高人。大家不要覺得一個產品看起來簡單,越是簡單的產品,背後越見功力。產品經理最難的不是做加法,而是做減法,這需要頂尖的判斷力。你用Sora App 會發現,它幾乎上手就會用。雖然在工程上還很粗糙,例如會彈出程式碼報錯,甚至沒有Android版,但它的第一版在產品設計上,我認為已經做到了極致。它的互動就是最簡單的上下滑、左右滑。創作流程也極為簡練:用@ 來選擇人物(Cameo),然後輸入prompt,整個過程行雲流水。它所有的設計都在鼓勵你進行社交。能把流程做到如此簡單,背後一定是有強大的組織能力和優秀的產品經理在支援。第二個關鍵點,也是它最特別的地方,就是所有設計都緊密地圍繞著「社交」。我為什麼說它是「AI 的Instagram」,你看它的核心功能:ID 保持是基礎。你要社交,總得先讓別人認出你的臉,你才能@ 朋友的臉,兩個人才能互動。音畫同步是為了讓大家「玩起來」。兩個人要對話,要一起表演,就需要音畫同步。你看所有雙人共創的影片都依賴這個功能。只有在最需要即時性、UGC 和社交性的場景裡,才需要把音畫同步做得如此簡單、極致。再看它的分鏡頭控制。它限制影片時長為9 秒,這完全是朋友圈的邏輯。同時,短片也需要敘事性,所以它提供了多鏡頭切換的能力,讓一個9 秒的影片也能有故事感。它所做的所有事都在為「社交」服務。包括它的邀請碼策略,一個人只能拉四個,就是為了讓你邀請最親密的朋友,快速建立「熟人關係鏈」。他們甚至沒做行銷,證明從產品、模型到市場,內部已經想得非常清楚,並串成了一條高效的鏈條。這件事,如果沒有高度整合的組織和CEO 的親自拍板,是絕對無法實現的。張鵬:現在假定你是Sam Altman,能幫我們想像Sora 是怎麼做出來的?曹越:在這裡我有一些不太一樣的觀點。首先,我覺得沒必要神化Sam Altman,他可能只是「許可」了這件事,而非親自發起。關鍵在於,Sora 的誕生更可能是一個「看菜下飯」的過程。當你知道現有模型能實現那些能力後(例如音畫同步、參考ID 生成,這些對演算法人員並非不可預測),再將這些能力與產品場景結合。對我個人而言,認知上最大的迭代是,它把「敘事」也整合進了模型,而不是用傳統的產品方式來做,這一點非常出色。但是,要說團隊一年前就決定要做社交,我覺得絕對不可能。更大幾率是,一個出色的產品經理,看著手上已有的「馬鈴薯絲」(模型能力),決定炒一盤菜。當你能做參考ID 生成,但在北美deepfake 是條紅線,你不能隨意生成人臉,那麼「基於許可」的熟人社交就成了一個自然而然的選擇。所以,整個過程更像是組織內部緊密耦合、情境對齊得很好,而不是產品提需求、模型再排優先順序的傳統流程。張鵬: 所以你覺得這更像是歸納而非演繹的過程?把所有可用的「菜」擱在一起,然後推導出到底能炒出什麼?曹越:是的,從我的視角看,這個過程可能沒那麼神奇,但的確不容易。它需要大家做一些mindset(思考模式)的切換。作為一個做模型的團隊,我知道應該跟產品經理做更深度的交流,可以往某個方向去優化。但產品同學也需要去理解模型到底是怎麼回事。所以我覺得它比較是這樣迭代出來的,而找到那個fit 是關鍵。一旦找到這個fit,如果他們的團隊本身在產品側就比較成熟,那麼執行起來是能做到的。但最難的是最開始的那個認知:我們能做什麼?在那個地方才是真正fit 的?這個是關鍵。03. 超越科技:AI 時代的組織護城河張鵬: 我們來聊聊影片產生的技術。很多人並非技術出身,但很想瞭解影片生成技術在過去幾年經歷了那些關鍵階段的變化?曹越:我來梳理一下影片產生的幾個關鍵里程碑。第一個關鍵里程碑是今年2 月OpenAI 發布的Sora,它是一個巨大的認知突破,用「擴散模型+Transformer」的結構證明了AI 可以產生高品質的單鏡頭素材。緊接著,上半年以Veo 等模型為代表的音畫同步技術,讓AI 生成的人物表現力大增,跨越了“恐怖谷”,使其能進入主敘事鏈路。差不多在同一時期,還有另一條關鍵技術路線——自回歸模型(如MAGI-1 和Genie),它像語言模型一樣逐個Token 生成視頻,被證明可以生成更符合物理規律的視頻。然後是最關鍵的時刻——Sora,它核心疊加了“敘事能力”,能一次性直出一個包含有意義鏡頭切換的短片,讓視頻模型從生成“片段”進化到了能直出“可消費的完整故事”。最後,Sora 還有一個常被忽略但官方極為重視的突破,即「物理準確性」,官方報告透過體操、跳水等案例來強調這一點。張鵬: OpenAI 的報告裡,有什麼讓你覺得在技術上有啟發的東西嗎?還是說他們已經把關鍵問題都藏起來了?曹越:報告裡關於如何實現物理準確性的描述確實相對晦澀,遠遠沒有達到學術論文的清晰度。它只是說「我物理上更準確」,但並沒有詳細解釋方法,這和實現它的路徑之間差距還是很大的。但這至少指明了一個方向:OpenAI 非常關注物理準確性,並認為自己已取得階段性成果。這對我來說是有啟發性的。張鵬:我相信國內頂尖的模型公司都在加班追趕,你估計他們需要多久才能做出類似Sora 的產品?曹越:我估計大概要三個月。從產品維度來看,OpenAI 的優勢在於模型和產品的垂直整合,但如果只看模型能力,追趕者與它的差距並沒有想像中那麼大。一個關鍵能力是音畫同出,Veo 3 在5 月已經做到,我們內部也將在國慶日後發布一個具備這種能力的新模型。所以,這更像是一個如何將模型能力完整地展示為產品的過程,單論模型本身,海內外團隊的差距並不大。陳冕:我覺得會非常快,第一個產品可能一個月內就會出來。原因有兩方面:一個是模型能力會迅速平整。不論是Google還是國內公司,很快會發布新模型追趕上來,OpenAI 的API 也可能很快開放;另一個是真正的戰場在應用側。對此,我有兩個核心觀點:第一,國內的網路大廠現在應該睡不著了。大家對Sora 有個誤解,它不是「AI 版的抖音」,而是「AI 版的Instagram/朋友圈」,它的本質是AI 社交。在中國,通用社交有極強的頭部效應和網路效應,贏家通吃,例如微信。內容平台可以百花齊放(抖音、小紅書、B 站),但社交只有一個。如果Sora 真的做成了社群超級App,將會動搖現有所有平台的流量根基。這會引發一場「腥風血雨」,無論是海外的Meta、Google,還是中國的幾家大廠,都會瘋狂內捲。所以我說一個月都是保守估計。第二,對創業者來說,AI 應用的時代才剛開始,但不要想著去做AI 版微信,因為新創公司做通用社交幾乎不可能成功。真正的機會在於,將最好的產品創意和最好的模型進行整合。張鵬: 陳冕你覺得AI 社交的帷幕被拉開了。如果把你切換成Sam Altman 的角色,接下來三步驟棋會怎麼走?陳冕:首先,我想澄清一點,CEO 之前的背景不重要,重要的是在當前這個時間點,CEO 和整個團隊都要有「複合認知」和「複合能力」。本質上是產品能力和產品認知變得越來越重要了。回到你的問題,基於目前 Sora 的情況,你要做的三件事是什麼:第一,勇敢做ToC。 Sora 掀開了AI 面向泛C 端的帷幕,這件事可以開始認真考慮了。第二,加強組織能力的垂直整合。未來的組織,產品需要懂技術,技術也要懂產品。在前一個階段,研究員(researcher)可能只需要工程能力,但現在他們也需要產品思維。科技是AI 革命的基石,但現在科技也開始離不開產品了。不同職能的人,包括研究、工程、產品,必須深度整合。第三,Go big or go home(要嘛做大,要嘛出局)。 AI 時代的機會比網路時代大10 倍甚至100 倍,但市場也可能更頭部集中。人才、算力、資源、資金都在往頭部集中。 AI 的發展速度比以往任何科技革命都快,這導致競爭被前置了。大家都能看到未來,共識很強,所以都用充裕的資本提早進入競爭,內卷加劇。你本來可以慢慢做應用,但現在不行了。 API 和算力的價格都很高,如果你沒有足夠的錢,連API 費用都付不起,你還怎麼競爭?所以,我的建議是,業務要更激進地成長。這對所有創業家來說,是最好的時代,也是最卷的時代。張鵬:我想再問一下關於「組織能力整合」,有什麼跡象顯示這種整合是對或錯呢?陳冕:坦誠說,我們也在探索。舉個實際例子:一個產品經理會從使用者出發,想著用現有技術去「打補丁」,例如優化提示詞。但我們的技術同學會提出一個更未來的概念:為什麼整個畫布不能是一個上下文視窗?這是一個產品經理最初可能想不到的。但反過來,你光有大的技術變革也不行,設計師會問你,「所以呢?這對我有什麼用?」這就需要產品和技術的深度整合。你既要擁抱新技術,又要找到一個「靈光一現」的場景,讓科技真的能被使用者玩起來。這要求組織非常敏捷,沒有部門牆。根據我的經驗,他們必須物理上坐在一起,因為「物理距離也影響心理距離」。我腦海裡Sora 的誕生畫面就是:在一個複合型團隊裡,一個既懂模型又有產品感的人突然想到一個新玩法,然後整個團隊能迅速形成共識並落地。這種組織能力至關重要。張鵬: 我也想聽聽曹越對這個問題的看法。你最近在組織內部有什麼相關的思考與觀察嗎?曹越:在我看來,組織內部絕大多數的摩擦都來自「上下文不對齊」。不同專業背景的人(例如演算法與業務)之間溝通頻寬很窄,因此提升組織效率的本質,就是如何讓大家更快速地對齊情境。要實現對齊,有兩個基礎:第一,個人的EGO 要小,這樣才更容易接受別人觀點;第二,要善用語言模型這個「補全上下文的神器」,比如,當我聽不懂一段話時,我會把它發給Gemini,讓它幫我理解。另外,我有一個強烈的感覺:AI 時代,產品和模型的邊界比我想像的要模糊得多。這對組織的要求是:做產品的人要去理解模型,做演算法的人也要跟產品的人多溝通。大家要多一起吃飯、散步,在非正式的溝通中對齊脈絡。我非常同意陳冕的觀點,很多偉大的想法不是設計出來的,而是碰撞出來的。組織就像一個容器,把不同背景的人「Remix」在一起,最後產生偉大的創意。04. AI 應用的黃金時代與「最卷」的戰場張鵬:我觀察到,過去大家追求讓一般人能拍出好萊塢大片,或幫專業公司降成本。但Sora 出來後,路線似乎變了,大家更像在玩,而不是想做大片。這是否意味著,過去那種降低成本、普及好東西的思路,未必是最好的?陳冕:對,我覺得這是一種慣性思考。 AI 時代最大的機會,本質上是AI 原生的機會。如果你想的是給好萊塢大片降成本,那你其實還是在做提效,而提效不可能帶來革命。革命才誕生偉大的新機會。巨頭想提效無可厚非,但創業者絕對不能用這個思維。我們從第一天起,思考的都是:AI 時代會帶來什麼樣的新體驗和新內容?這才是本質。例如你和Sam Altman 合拍的那個視訊,在過去幾乎不可能發生,但現在可以隨時隨意地發生。這就是原來沒有的、從0 到1 產生的新體驗,我們稱之為「AI 原生」的體驗。如何定義AI 原生?你就想,沒有AI,這個業務或內容還存不存在?如果不存在,它就是AI 原生的。這是一個很重要的思維切換。如果你想在AI 時代做一家偉大的公司,你必須回答這個問題。如果答案是「體驗會打折」,那你可能做錯了;如果答案是「業務會直接消失」,那你就做對了。所以我其實不認為未來會是「好萊塢大片人人都能拍」。當年抖音出來,大家以為短影片是另一部電影,後來發現它是生活記錄視訊,是攝影機的平權化。我覺得這次也會是不同的東西。張鵬:如果我們的目標是改變供給,而非降本增效,這會如何改變AI 模型技術的發展路線,以及模型與產品的整合方式?曹越:首先,我非常同意這個觀點。這一波AI 本質上是一場生產力革命。無論是語言模型、圖像視訊模型,或是現在可以音畫同步生成的模型,它們在初始階段都是在改變供給。但關鍵問題是:到底要改變的是什麼供給?這是一個需要從產品側深入思考的問題。以影片為例,過去一兩年我最大的感受就是,影片這個品類實在太龐雜了。有電影、短影片、中視訊,甚至遊戲也可以看作是一種互動式視訊。從內容的視角反推,我們就要思考:那些品類會率先被改變?機會到底在那裡?產品與科技的「fit」又在那裡?隨著模型能力的演化,我們看到機會也在演化。一開始可能是人們利用各種模型工具去製作一個片子;現在,一個模型已經可以端到端地產生10 秒的短片。再過一兩年,模型能獨立產生多長的、可消費性的內容呢?沿著這個時間線推演,會湧現不同類型的機會。它可能是一種像表情包一樣的玩梗視訊,也可能是需要更長敘事的AI 短劇,還可能是有更多互動的形態,比如互動式遊戲,使用者可以點選分支劇情。甚至,我們能否做出陳冕之前提到的那種,超越簡單滑動的、具有極致互動體驗的AI 原生視訊產品?張鵬:Sora 的出現,在未來三個月,對中國的創業團隊和投資環境,究竟是好事還是壞事?可能會如何演進?陳冕:我認為有兩個方向的變化,最後是好是壞還不好說,但大機率不會變得特別差。首先是正面的一面:AI ToC 的想像空間被大大拓寬了。創業者能探索的方向更多,能做的事情也更多。光有模型能力已經不夠,需要更復合的能力加入,對新創公司是利多。我們能清楚地看到AI 走嚮應用的趨勢,這幾乎是一個比網路大10 倍甚至100 倍的超級機會。能力要求越復合,組織要求越敏捷,新創公司的機會就越多。但另一方面,也存在「要嘛做大,要嘛出局」(go big or go home)的問題,即頭部集中會更明顯。因為產業發展太快,競爭趨於白熱化。雖然巨頭如OpenAI 也並非無所不能——例如他們的Agent 體驗就不一定比新創公司好——但速度、資本和人才的密集,導致大家都在燒錢。尤其C 端APP 更燒錢,就像行動網路早期一樣,大家都知道未來能獲利,所以早期競爭異常激烈。這就不可避免地導致資本會更加向頭部集中。所以,總的來說,對於整個創投市場,投資AI 會更加瘋狂和「FOMO」(錯失恐懼症),但資金會更向頭部集中。而對創業者來說,這既是最好的時代,也是最「卷」的時代。你必須飛快地做大、變強、找到產品市場契合點(PMF),否則就只能出局。曹越:我對未來非常非常樂觀。無論Sora 是否出現,這個時代都充滿了層出不窮的機會。我非常認同陳冕的觀點,這是一個有巨大增量的時代。從底層來看,這波AI 帶來了至少幾個數量級以上的效率提升,而這種基礎生產力的改變最終會催生出極多的機會。另外一個維度是,中國的創業者完全可以放眼全球市場。坦白說,中國的創業者非常“卷”,無論是數量還是質量都非常出色。回顧過去,00 到10 年,大家主要聚焦中國市場;10 到20 年,頂尖的企業家已經在中國和海外市場都取得了成功。而在這個新時代,趨勢一定會更加全球化。我相信,中國的工程師紅利和企業家精神紅利,能為世界創造巨大的價值。張鵬: 最後一個問題,想請兩位分享:看到了Sora 之後,你們各自有什麼新的目標和計畫?曹越:首先,我們最新的音畫同出模型,將在國慶日後大家就可以使用了。 Sora 讓大家看到了音畫同出最終的ToC 機會是什麼。國慶後歡迎大家去評測和對比。未來半年,Sand.ai 將繼續專注於AI 視訊方向,為一般和專業使用者提供SOTA 等級的模型和產品。我們對此非常有信心,希望能抓住這個大方向上的機會。陳冕:對Lovart 來說,Sora 對生產力側是巨大的改變。之前Nano Banana 出現時,我們的流量翻了一倍,希望Sora 2 開放API 後能再翻一倍。生產端工具的PMF 已經得到驗證,而且會更強,我們絕對不能錯過這個機會。另外,我們會激進地探索ToC,但具體做什麼我先賣個關子。第三,我們會激進地擴張團隊,歡迎產品、營運、設計、研發的同學加入我們,我們希望做一家頂尖的AI 原生應用公司。張鵬: 我逼問一下,12 月能看到你ToC 產品的進度嗎?陳冕:(笑)進展一定會比這更快。但我們對C 端產品有更長的生長預期。如果一個產品能瞬間爆發,那可能還是大廠的機會。張鵬:好的。今天兩位嘉​​賓的分享讓我們對Sora 這件事看得更深入、更清楚了。一位準備迎接整個產業在AI 視訊模型上的高度關注,另一位準備接住翻倍的流量並向外擴張。能感覺到兩位都非常興奮。再次感謝兩位的分享。 (極客公園)