AI不一定要學人,不一定要超過人。
6月盛夏,在清華無錫研究院智能產業創新中心,我們見到了張亞勤院士。他匆匆趕來,一進門,就建議讓室內溫度降得更低些。
訪談中,聊起當下具身智能、AI投資創業熱潮,張亞勤也覺得大家應該降降溫,“更冷靜些,不要急躁”。
五年前,張亞勤建立了清華大學智能產業研究院(以下簡稱AIR),聚集了多位有AI產業經驗的知名教授。據介紹,如今AIR的第一屆博士生已經畢業;而這裡孵化、走出的十家公司,累計“融資約150億元,估值1500億元”。其中,華深智藥、它石智航等獨角獸,在資本市場備受追捧。
1500億估值是個亮眼資料,但張亞勤卻告訴我們:AIR首要任務是做科研;孵化公司只是自然長出的副產品,而且多數公司正處在“證明能力”的階段。
作為國內最年輕的IEEE fellow、中國工程院院士,張亞勤經歷過技術革命和資本周期的潮起潮落。在他看來,當下AI所處階段,像1998-1999年的網際網路,正在大規模投資基建(電力+算力+演算法)。長期看AI產業充滿巨大潛力,“AI沒有泡沫,但早期AI公司會有泡沫”,未來兆市值巨頭可能不是眼前的明星公司。
2026年,“物理AI”成為了技術開發和資本押注的最熱方向,而過去五年,張亞勤和團隊在自動駕駛、具身智能大腦、工業能效AI等已佈局了多家公司。對於“趁市場熱多融資”的慣性,他直言拿太多錢,業務不聚焦,結果可能是錢燒完了卻沒轉化成業績。
近幾年,張亞勤每年都會給出AI發展的觀點預判。比如,在2024年6月,他提出需要開發新的AI演算法體系,包括世界模型、Agent等,以實現百倍效率提升。從時間維度,為什麼說當下AI像1998年的網際網路?面向物理世界的AI資料缺失,VLA、世界模型技術路線如何結合?如何看待教授創業?
自2024年起,每年6月,AIR都會在無錫舉辦一場“太湖對話”,今年已是第三屆。以下是論壇前夕,張亞勤與暗湧Waves的對話(經編輯):
01. 教授重站創業C位,但多數不適合做CEO
暗湧:三年前,投資機構還在系統反思“不投教授”。新一輪具身智能和AI創業中,科學家又重新站在了C位,你怎麼看待“教授創業”?
張亞勤:這輪AI創業是強技術驅動,因此教授技術能力和理念就格外重要。現在,中國有一批高水平教授,已經能做出世界級的主流創新,而不再是跟隨美國。
科學家創業有三種方式:第一種,教授從院所離職,All in創業;第二種,教授以學術為主,將好的研究與技術轉化成企業,但他並不直接管理公司,公司市場化運作;第三種,教授仍在學校就職,同時還管理多家公司。第三種,基本做不成。
暗湧:第一、二種方式比較好?投資人可能更偏好投全職創業的教授。
張亞勤:第一種有成功的。像高通,是由兩位MIT教授建立;AIR彭建教授全職創立了華深智藥,在AI製藥賽道表現非常好。
但其實大部分教授不適合run company,即便all in,教授做CEO創業的失敗機率也遠高於普通創業者。這在中美都一樣。因為把研究變成技術,把技術變成產品,再把產品規模化鋪開,中間有很多鴻溝。很少有人既懂前沿研究,可以從0到1;又懂市場和商業化,能從1到N。
AIR教授創業大部分是第二種:科學家有了不起的研究和技術,作為聯合創始人或首席科學家去孵化企業,以技術入股。同時,企業尋找一位懂商業和工程的CEO,按市場化方式運作。這樣能發揮教授的優勢,也兼顧企業的發展特點,是比較好的模式。
暗湧:全職創業,一旦成功,會有非常大的收益。
張亞勤:全職創業的風險也很大,可能到最後商業沒做好,科研也丟了。來AIR的教授絕大多數是想做科研,希望有用的基礎研究成果能產業化,最好有團隊幫他們做產業化。我也比較喜歡在學校做科研、培養人才,我們學院有三個博士生拿過清華特獎。
AIR的定位還是一家科研機構,並非是孵化器。孵化器通常會一次孵化很多項目,有VC投資機制、靠規模取勝,但我們一年只有一兩個公司出來。
暗湧:AIR一個目標是為行業輸送CTO、頂級架構師,你覺得培養這類人才的核心是什麼?
張亞勤:核心是在成長階段就要有產品和系統思維。只在校園裡,沒有真實場景和資料,博士生也能做演算法、寫論文;但關鍵是驗證它能否在真實系統裡跑起來。
這也是AIR成立的一個初衷。我們跟字節、阿里、百度、比亞迪等20多家大企業合作,通過聯合實驗室等方式做科研項目,AIR很多學生都會到大廠實習,參與到最前沿的研發系統中,做規模化驗證。
暗湧:現在有許多年輕的大學生、極客輟學創業。
張亞勤:現在年輕人確實厲害,我很支援AIR有商業頭腦的博士生、博後去創業。
高中生、本科生輟學創業,過去也有,像比爾·蓋茲、祖克柏。但這個成功率得看統計結果,對多數人而言,還是上完學比較好,不急那兩年。大學也有提前畢業的通道,高校也鼓勵學生孵化創業。
暗湧:適合做創業公司CEO的人很稀缺。你會幫孵化公司找CEO麼,比較青睞怎樣的CEO畫像?
張亞勤:創業第一步,在技術孵化階段,教授可以兼顧一些公司管理工作。最難的是下一步,找到CEO,把工程團隊和商業模式搭建起來。現在我們孵化的多數企業正從第一步走向第二步,還處於“證明自己”的階段。
理想狀態是我能為每一個團隊配個合適的CEO,但事實上,我真的配不了(笑)。
CEO不一定是職業經理人,可能是連續創業者、科研團隊裡的年輕人。現在AI的人才,我們反而比較容易找,難得是找到產業裡紮根很深的人,既有產業經驗,又能理解一部分AI技術。
核心是這個人要有非常強的信念感,創業過程一定會遇到很多困難,有些人在艱難時候會容易動搖。沒有信念感,幾乎做不成。
我還是想說一句,不能把創業想得太簡單。像1500億這樣的估值數字,其實沒太大意義。企業最終還是要靠技術實現商業化,有收入、有利潤,形成競爭力。
02. AI不是泡沫,但AI公司有泡沫
暗湧:創業公司拿到高估值,應該算階段性的成果,但你覺得要格外冷靜?
張亞勤:我看到是一種風險。市場期望越高,你需要證明得就越多,這個階段必須清醒。在學院裡我會給大家潑冷水,(成立公司前)會問他們很多:到底要解決什麼問題;AI能解決什麼;誰來為產品買單。短期拿到高估值,並不能說明已經成功了。
比如當前機器人賽道,現在有幾百家公司,但可能三四年後只會剩下20家公司。像大模型賽道,最終國內可能只剩下三四家。我們經歷過網際網路泡沫,當時資本市場比現在還狂熱,但很多明星公司迅速在市場上消失了。
暗湧:這種冷靜,跟“趁著市場好,多融資”的邏輯,衝突嗎?
張亞勤:創業需要足夠的錢,但錢不是最重要的因素。
做startup本來就是九死一生,一定要聚焦。如果還沒想清楚,就拿很多錢,什麼都干;更多情況是:錢燒完了,也沒能轉化成業務結果。當一家企業有真正好的產品、獨特的技術、足夠強的團隊和清晰的前景,一定會有人願意投。
暗湧:人人都說AI、具身行業有泡沫,卻也都義無反顧地往裡沖。這種氛圍跟上一波網際網路創業有點像,但又很不一樣。
張亞勤:不同的是,多數網際網路公司一開始沒有規模化收入,但這次AI頭部公司的收入增長很快,像OpenAI、Anthropic的收入增速史無前例,所以市場對AI更有信心。
這種高增長能不能持續,我不確定。
目前全球幾家科技巨頭,在資料中心、晶片等方面的投入非常高,這也是基於對未來的高預期——花了之後還能賺回來。這些投入到底能不能轉化成訂單、收入?我覺得還需要證明。
未來2-3年是關鍵的觀察期,如果(巨頭)收入不能按現在預期的指數曲線走,這個循環就會受到影響。大公司會受到影響,小企業會更加敏感。
暗湧:以網際網路技術周期對照的話,你覺得現在AI大概處在什麼階段?
張亞勤:可能相當於1998、1999年。網際網路剛剛興起,雅虎被追捧的階段。
網際網路不是泡沫,但網際網路早期很多企業有泡沫。長期看AI產業沒有泡沫,但AI公司和估值會有泡沫。短期的資本炒作沒有意義。做企業還是要專注,願意做髒活累活,用結果證明自己的價值。
03. 讓機器人先干髒活苦活
暗湧:你此前提到機器人還沒有迎來chatGPT時刻,通用機器人可能還得10-15年。這中間的“卡點”關鍵有那些?
張亞勤:通用的家庭機器人、服務機器人確實還需要很久,可能10年以上。但如果是在特定場景中,做具體工作的機器人其實很快就可以實現。像無人駕駛,本質是“開車機器人”,技術難點基本已經突破,剩下的更多是工程化和商業問題。像工業機器人,處理程序會更快。
家庭機器人面對的環境非常開放、複雜,最重要的是它要和人互動:和人說話、理解人的意圖、真正完成動作。這其中還有一些科學問題沒解決,理論和演算法都還沒有真正突破。
暗湧:為什麼物理世界AI會慢很多?
張亞勤:十年前,我就把智能分成三類:數字智能、物理智能和生物智能。
數字智能發展得快,是因為過去20多年,網際網路積累了海量資料,文字、圖片、視訊都可以訓練模型,有scaling law,再加上演算法和算力,模型的通用能力就會變強。
但物理世界情況不同。第一,我們沒有那麼多資料;第二,物理世界的場景非常分散;第三,數字世界的位元,要和物理世界的原子結合起來。原子世界,並不遵從摩爾定律。關節、手等機械結構的控制,也不是靠堆算力能解決。所以物理智能的進展會更慢一些。
沒有足夠的資料怎麼辦?有幾種方式:一是學人,從第一人稱視角,收集人和世界互動的資料;二是機器人自己去採集資料;三是在模擬環境裡模擬各種場景,生成模擬資料。
但是,在模擬器裡跑通了,到真實世界裡不一定能work。所以我們在做RSR(Real-to-Sim-to-Real),從真實世界到模擬場景,再回到真實世界,形成閉環。這個閉環非常難,AIR周谷越教授在這個方向做了很多年,在特定場景很快就會有突破。
暗湧:面對物理世界資料缺失的挑戰,目前有那些可行的技術路線?現在關於VLA、世界模型的討論非常熱烈。
張亞勤:現在確實有一些方法,但還沒能像網際網路那樣,收集到如此海量的資料。
一種方式,是把大語言模型的方法論向外拓展,到能夠處理自然語言、理解視覺資訊並操控物理行動的VLA模型(Vision-Language-Action)。
這一路線的好處在於主線還是語言,能用到現在大語言模型已形成的方法論;但問題是動作往往很難用語言精確描述。對機器人而言,視覺是最重要的輸入,所以還有一種思路是從視覺直接產生動作,把語言作為輔助。
另一路徑是世界模型。世界模型也有很多種,構想是希望機器真正去理解這個世界。怎麼理解?有很多不同方式,比如做模擬器等。我覺得最終的方法,可能是這兩種路線結合起來,AIR最近孵化的創業公司域變換就在做Hybrid的模式。
暗湧:怎麼理解“兩種路線的結合”?
張亞勤:做VLA、做各種不同的世界模型,我覺得沒有絕對的對與錯。要兩種路線結合,是因為機器人面對的環境相當複雜。比如自動駕駛,開車過程更像以視覺為主、端到端的系統,不需要很多語言。
但機器人很多時候是通過與人對話、獲得指令,它需要理解語言;做事時,又主要依靠視覺形成決策,再轉化為電機的動作訊號。這個過程,目前還沒有清晰的scaling law可用。
在語言模型中,token(詞元)是人類經過抽象的、有結構有含義的字,但圖片的最小物理單元是像素,一片像素本身沒有物理含義;動作也是一樣的道理。
AIR老師做了很多探索,詹仙園團隊研發的X-VLA系統,嘗試把不同機械臂、機器人的能力“歸一化”,實現部分技能的可泛化,可跨裝置遷移。也有團隊讓模型觀看大量流視訊,來理解視訊中的動作和環境。
在很多科研問題沒突破的情況下,一方面要繼續做通用性的研究,同時也要先在通用性要求沒那麼高的特定場景裡,著手解決真問題。
暗湧:現在機器人可以率先用在那些場景?
張亞勤:我覺得(機器人)首先要在真實生產力場景裡用起來,先做人不願意做的事,比如在極危險、艱苦的地方作業。比如我們現在和煤科院合作,開發煤礦場景裡的無人車、機器人;和首創合作,開發地下管網巡檢機器人、電網機器人等。
AIR也孵化了一家具身智能大腦系統開發公司“域變換”,讓具有自主進化能力的物理智能體賦能機器人,先做髒活、苦活。
這類場景,目前還需要人機協作。我一直在講,AI和具身智能還是要幫助人,而不是上來就讓機器人搶人的工作。
暗湧:當下AI領域有一個趨勢,是不斷追求“超級智能”、“通用AI”。但聽下來,你並不認為這是目前最重要的事?
張亞勤:作為科研目標,這當然可以。但從社會和企業角度,我認為還是要解決具體問題。
有些美國企業開始鑽牛角尖,一味追求智能上限,彷彿擁有了“超級智能”,什麼都可以做。但假如沒有明確目標,只是“學人、要比人更厲害”,風險往往不可控。
而且,AI是不是一定要“學人”,一定要“超過人”?我覺得未必。
人有好的部分,也有壞的缺陷;AI在放大能力的同時,也會放大那些人性中壞的部分。這就有安全和倫理風險。
暗湧:你會格外關注AI可能存在的那些風險?
張亞勤:AI現在主要有三類風險:失控、濫用和系統性風險。系統性風險也包括失業等社會問題,但目前我更關注失控和濫用。
AI系統越來越複雜,很多機理是人類並不清楚的黑盒。而且具備行動能力的agent,正從實驗室走向現實部署,存在自主複製、約束逃逸等現實隱患。2026年4月,Anthropic披露了模型Claude Mythos,但沒有向公眾開放。因為Mythos能自主識別軟體漏洞,有形成大面積網路攻擊的風險。
所以,在一個AI產品、技術被設計時,就要明確它到底解決什麼問題,這樣AI的可控性會更強一點。AI終究是要幫助人,讓人活得更久、更舒適、更幸福一點。 (36氪)
