一場極致的算力成本壓測

“如果日均建模數80000次,每次兩毛錢,每天花費16000元,如果是一個月,就是48萬元。”

在說起算力消耗這個話題時,Remy創始人王正男掏出了手機,很認真地算了筆帳,如果放在輝達的顯示卡上跑,每個月固定消耗50萬元。

對於一家創業公司來說,這筆Token消耗是不小的開銷。這是建立在所有任務都跑在輝達的顯示卡上。嚴格意義上說,Remy所做的事情跟Token的關係並不大,但Remy的生意,卻與算力的消耗息息相關,甚至關係到這家公司的關鍵商業模式。王正男有他自己的一套控製成本的方法。

“我們從去年年底至今,半年時間,Remy的使用者數達到了250萬。”但王正男在思考另一件事,他就像一個精力無限的陀螺,語調昂揚,眼裡有光。

Remy在2025年華為開發者大會(HDC2025)亮相

未來的Remy,要跟抖音和小紅書爭奪入口,這是個聽起來“螳臂當車”的事,但並非不可能。我們在討論這個極致算力成本控制案例時,也與王正男聊到了Remy的未來。

“我們從去年年底至今,半年時間,Remy的使用者數達到了250萬。”但王正男在思考另一件事,他就像一個精力無限的陀螺,語調昂揚,眼裡有光。

Remy的算力帳本

大模型燒Token,每次推理呼叫一次API,按呼叫量計費,可復用,可以平行,成本曲線相對可預測。Remy不是這個邏輯。

3D重建的每一次任務,都是一次獨立的訓練過程。使用者掃了一個場景,伺服器就要為這個場景從零開始跑一次高斯潑濺訓練;下一個使用者來了,再跑一次,兩次之間毫無復用。Remy現在的三種模式裡,物體模式平均5分鐘出結果,人像模式10分鐘,大場景40分鐘——每一分鐘,都在消耗GPU時間,對算力的消耗甚至比和大模型對話還多。

使用Remy記錄下曾經陪伴寒窗苦讀的課桌在B站獲得大量觀眾共鳴

“我們的成本其實不是Token,而是GPU。”王正男說,“我們跑的是自己的高斯潑濺模型,購買的是顯示卡時間和電力。”

這就帶來了一個普通SaaS公司不會遇到的麻煩:波峰和波谷。

2025年10月22日,Remy在國內首次上線。按王正男的話說,接下來96個小時堪稱“失控”。上線第五秒,他們預備好的八九百張顯示卡全部拉滿,排隊任務數量眼看著直線往上漲。最終,他們在彈性算力平台上把算力擴到了1900張GPU,才勉強穩住局面。9天之後,Remy使用者量突破100萬。

"如果我去向大廠每個月租1900張GPU,顯然不划算,因為峰值之後根本用不到這麼多。"

所以,最划算的辦法是把3D重建部署在彈性算力平台上,王正男選擇了一家叫做共績科技的公司,這種彈性算力的模式叫做“算力滴滴”,算力資源像打車一樣,按需調度,用多少取多少,峰值結束就釋放。價格是美國同類彈性算力公司的十分之一。這樣,他每個月的算力成本可以控制在20萬-30萬元。

2月10日的那次功能升級,Remy推出了3D全家福和房間掃描功能,使用者可以通過Remy 3D的記錄自己曾經生活過的老房子以及與父母親人團聚的時刻。正值春節,流量再次暴漲。每10分鐘處理200次任務,每次大場景重建需要40分鐘,這意味著任何時刻都有800張顯示卡沒有停歇地在跑。但依然是,當春節接近尾聲,使用者的使用頻率就會下降,如果按固定購買的邏輯囤卡,這個帳根本沒法算。

Remy的商業模式

王正男至今堅持不向使用者收費。

王正男本人 圖片由Remy提供

讓王正男重新想清楚商業模式的,是一個意料之外的數字。Remy每日的3D掃描數,是日活使用者數的1/10。

也就是說,十個打開Remy的使用者裡,九個在“看”,只有一個在“拍”。

這個比例,最初讓他困惑。3D重建的直覺邏輯是:你來是為了記錄,不記錄來幹嘛?但資料顯示,大量使用者登錄之後,只是在瀏覽或者反覆翻看自己此前留下的記錄。

想明白這件事之後,他對Remy的定義發生了根本性轉變:Remy不是一個工具,而是一種新的記憶媒介。

“工具產品解決效率問題,適合訂閱收費。但Remy是在幫使用者記錄人生、保存記憶,這和效率沒有關係。”

這個判斷,直接否定了訂閱模式。

訂閱制的邏輯是:你付月費,我通過產品來提升你的效率。這是Photoshop的邏輯,是Notion的邏輯,是所有生產力工具的邏輯。但Remy的使用者,記錄一段孩子的童年、一套老房子的房間,然後打開來看,不是為了提高效率,他們在消費記憶。

消費行為,對應的是流量模式。

“廣告一定是一個方向。包括開屏廣告、上傳等待廣告。只要使用者規模起來,就會產生商業價值。"他說,“我更相信流量模式,而不是訂閱模式。"

雖然現在所有使用者都會記錄,但不會天天記錄。記錄天然是低頻行為,因為用3D的方式來記錄天然有門檻。想明白了這點,王正男決定,未來如果想提升留存率和使用者價值,必須讓使用者從“拍”轉向“看”。

最近Remy加入的沉浸聲場功能,就是想讓3D記憶有更多情感的元素。在 AI 時代,大模型模仿人說話、拍視訊,但人類複雜的情感它們模仿不了。因為這是各種經歷產生的“化學反應”,我們想用技術將這個“化學產物”保存下來。

最近Remy加入的沉浸聲場功能,就是想讓3D記憶有更多情感的元素。在 AI 時代,大模型模仿人說話、拍視訊,但人類複雜的情感它們模仿不了。

王正男要解決的是,為什麼這些人會每天打開Remy,而不是打開抖音或朋友圈?這個問題,他自己還沒有完整的答案。“3D內容對比2D內容到底有什麼獨特的價值,這是我今年要重點回答的問題。”

以下為虎嗅的對話精選:

虎嗅:過去半年,你對Remy最大的認知變化是什麼?

王正男:最大的變化是我越來越確定,Remy不是一個工具產品。過去大家會把它理解成3D掃描、3D重建或者空間記錄工具,但現在我更願意把它理解成一種新的記憶媒介。工具產品解決效率問題,因此適合訂閱收費;而Remy是在幫助使用者記錄人生、保存記憶,這和效率沒有關係。

虎嗅:為什麼你反覆強調“記錄”而不是“生成”?

王正男:因為我認為生成是創作者的需求,記錄是所有人的需求。生成式AI主要服務於創作者,他們用AI生成圖片、視訊、內容來表達和傳播。但記錄是所有人都會做的事情。我們會拍父母、拍孩子、拍畢業典禮、拍老房子,因為這些時刻以後可能再也不會出現。

虎嗅:很多人會問,照片和視訊已經存在了,為什麼還需要3D?

王正男:因為人類一直在追求更真實的記錄方式。黑白照片變成彩色照片,照片變成視訊,視訊變成沉浸式內容,本質上都是同一個方向。

我經常講一句話:記錄也許是對抗時間唯一的武器。時間會帶走很多東西,人們之所以記錄,是因為知道很多場景不會再出現第二次。我們希望Remy能夠讓這些記憶保存得更真實。

虎嗅:為什麼在Remy以前沒有成功的3D內容社區?

王正男:因為沒人回答一個問題:使用者為什麼要看3D內容。

如果只是把一個東西變成3D,那並不足以支撐消費行為。視訊更方便,圖片更輕量,傳播效率也更高。

虎嗅:現在最大的產品挑戰是什麼?

王正男:使用頻率。現在很多使用者會記錄,但不會天天打開。記錄天然是低頻行為,因為創作有門檻。未來如果想提升留存率和使用者價值,必須讓使用者從“拍”轉向“看”。

虎嗅:Remy未來的目標是什麼?

王正男:不是生成一個不存在的世界,而是儘可能1:1還原真實世界。

AI 行業開始認真算帳了。不是只看模型能力,而是看 AI 是否真正進入業務、產生結果、跑出回報。

這也是虎嗅想追問的:錢燒那了?幹成啥了?賺還是虧了?能復用嗎?

圍繞這四問,我們將深度對話AI產業鏈條上的重要公司,沉澱AI帳本樣本庫;還將在7月WAIC期間推出系列直播、閉門會,與企業關鍵決策者共探AI生意。

詳情請戳,一起見證AI時代商業落地的真實變化。 (AGI 介面)