#海外版
Seedream 5.0預覽版上線!字節又一新模型
新模型對標Nano Banana Pro,能免費體驗。Seedance 2.0的熱度還沒下去,字節新模型又來了!智東西2月10日報導,今日,字節圖像生成模型Seedream 5.0 Preview在視訊編輯應用剪映、剪映海外版Capcut、字節AI創作平台小雲雀均已上線,在即夢AI平台開啟灰度測試,圖片生成可限時免費體驗。▲Capcut官宣截圖(左)、小雲雀首頁模型選擇(右)Seedream 5.0 Preview的圖像支援2K和4K解析度輸出,2K為圖片生成直出,4K為AI增強後的解析度。根據Capcut官網,新模型5.0 Preview的升級點為首次支援檢索生圖,對提示詞的理解精準性增強、支援更細節、精緻紋理的圖像生成,還允許使用者精確調整圖像。Seedream 4.5於2025年12月4日上線。智東西實際體驗並對比了Seedream 5.0 Preview與Nano Banana Pro、Seedream 4.5,發現新模型可以理解“靜謐科技感”等抽象提示詞,但最後的生成效果相比Seedream 4.5很難說有跨越式提升,其聯網搜尋能力尚不穩定、生成效果升級點體現在更美觀、多樣化上。Capcut的官宣推文裡提到,Seedream 5.0 Preview可與Nano Banana Pro對標,且更便宜,目前所有使用者可免費使用20次,美國地區之後上線。有網友對比了Nano Banana Pro、ChatGPT、Seedream 5.0 Preview、Grok Imagine Image的生成效果,其提示詞為:生成一張高品質的資訊圖,解釋在特拉普修道院製作啤酒的過程,並配有豐富的插圖。▲第一排從左至右為Nano Banana Pro、ChatGPT生成,第二排從左至右為Seedream 5.0 Preview、Grok Imagine Image生成相比於其他幾個,Seedream 5.0 Preview的步驟解釋最為詳細,每步都有詳細的文字說明,但藝術設計感相比Nano Banana Pro稍弱。從社交平台X上的網友評論來看,此次Seedream 5.0預覽版的升級優先考慮的是智能水平而非美觀,可以應對複雜的知識驅動型任務。有網友認為,Seedream 5.0 Preview的智能水平、中文能力有提升,但都比不上Nano Banana Pro。還有網友調侃,新模型的進步程度僅0.09,僅相當於加了網路搜尋的Seedream 4.5。01.三大能力增強主攻實用性需求根據Capcut官網,此次Seedream 5.0 Preview的重要升級點包括精準性與智能水平增強、更快更具表現力的圖像建立、支援聯網知識整合。首先在智能水平方面,Seedream 5.0 Preview能深入理解提示詞,生成與使用者意圖相匹配、細節精準、佈局清晰、文字渲染效果更佳的圖像。第二點是增強風格化效果,其圖像到圖像功能增強了風格化效果,模型可以提供更清晰的細節、精緻的紋理和平衡的照明。該模型還新增了編輯功能,使用者可以控制筆刷精準選擇並調整相應元素。最後是智能推理能力,其官網提到,新模型的多步邏輯、空間理解及特定領域知識增強。02.相較Seedream 4.5提升小能理解抽象需求智東西體驗了Seedream 5.0 Preview的圖片生成能力。第一個提示詞是“為《靜夜思》生成古詩插圖”,可以看到生成的結果中人物“舉頭望明月”這一關鍵元素都沒有缺失,還附上了人物在月光下的影子等,但原詩中的“床前”等沒有在圖片中涉及到。為了考驗Seedream 5.0 Preview的聯網搜尋能力,智東西輸入了提示詞“最近有很多家機器人都要參加2026春晚,生成一張已官宣參加春晚的機器人海報”。Seedream 5.0 Preview生成的視覺元素精準,在大段文字生成中也未出現亂碼,表現穩定。但其並沒有理解“已官宣參加春晚的機器人”,而是僅生成了機器人上春晚的海報。還有抽象的提示詞,智東西輸入“生成一個靜謐科技感且帶有落日餘暉氛圍的鬧鐘圖片”,新模型生成的圖片中,從鬧鐘的設計到背景將落日、科技感融合在了一起。關於更為細緻的圖像輸出,提示詞為“特寫電影感肖像,一位有雀斑、深色捲髮的年輕女性,被鮮豔的野花和藤蔓環繞,頭上戴著花冠。在黃金時段拍攝,溫暖的逆光在她的頭髮和皮膚上形成光暈,淺景深,前景花朵柔焦,照片級真實感”。可以看到,輸出的圖片中的逆光效果非常到位,髮絲邊緣的光暈、皮膚的光澤以及前景花朵的柔焦虛化,都營造出了自然的氛圍感。當智東西的提示詞為“最新奧斯卡獲獎者紅毯風格”時,Seedream 5.0 Preview可以直接生成有紅毯、背景板、攝影師的完整圖像,背景板還有不少奧斯卡的小金人。根據參考圖生成圖片方面,智東西上傳了最近熱度超高的《閃靈》男主傑克,並讓Seedream 5.0 Preview“生成這個人的拜年圖片,主人公要身有年味的服裝,手拿燈籠和對聯”。生成的效果中,主人公的面部與參考圖一致,手拿燈籠、對聯的元素也都具備。智東西還比較了Seedream 5.0 Preview與Nano Banana Pro的生成效果。一個超難提示詞為“生成一個用左手寫字的人,背景有一個顯示5:25的模擬時鐘”,Seedream 5.0 Preview與Nano Banana都失敗了,要麼是拿筆的手不對,要麼是背景的鐘錶時間不對。Nano Banana Pro生成的圖片中,人物握筆的手為左手,可以從模糊的時鐘看出其時間為5:30左右。▲Nano Banana Pro生成的圖片雖然Seedream 5.0 Preview有些圖片生成的並不精準,但其一次性生成的圖片更具多樣性,從現代風、古風到卡通都有。▲Seedream 5.0 Preview生成的圖片在比較Seedream 4.5和Seedream 5.0 Preview時,智東西上傳的提示詞是“幫我生成番茄炒雞蛋的菜譜,卡通風格”。相比之下,Seedream 5.0 Preview的整體排版、架構設計會更為美觀。▲上為Seedream 4.5生成的圖片,下為Seedream 5.0 Preview生成的圖片03.結語:圖像模型正朝實用能力升級迭代當前頭部圖像模型的迭代路徑,正朝著提升理解能力、可控生成、編輯精度等實用能力升級。從Seedream 5.0 Preview的升級來看,其選擇在檢索增強、細節紋理、精準調整、4K增強上做最佳化,生成的結果並沒有顛覆性效果,這或許更貼近使用者的實際需求。但從實測與輿論反饋來看,使用者對小版本迭代的感知正在變弱,尤其在抽象語義理解、文字渲染、複雜邏輯構圖等方面仍存在技術瓶頸。 (智東西)
Rokid Glasses(海外版)中國香港首發,Rokid深化全球化佈局
科幻電影中的產品終成真。一副“AI+AR”眼鏡,輕至49克,戴上如同正常眼鏡一樣。但與此同時,只要輕按兩下右側按鈕,一切變得科幻起來:眼前出現《駭客帝國》裡熟悉的綠色字型,可即時翻譯、可提詞、可AI識圖、可導航,還能以第一視角拍攝照片和視訊Vlog。今年因“提詞器”功能火爆出圈的AI+AR眼鏡Rokid Glasses,至今已拿到全球30萬訂單。另一邊,其主要供應合作方藍思科技正在加班加點供應生產,以保證產品交付。8月13日,Rokid在中國香港舉辦發佈會,首發了支援粵語互動的Rokid Glasses(海外版)。中國香港成為Rokid Glasses海外藍圖的第一站,此次事件也成為Rokid加速全球化佈局的關鍵里程碑。1. Rokid Glasses中國香港首發,全球首款消費級“AI+AR”眼鏡Rokid Glasses中國香港發佈會上,引進這款產品的中國香港最大移動通訊營運商CSL的個人業務行政總裁CEO林國誠戴著這款眼鏡試用講解,成為Rokid Glasses出海歷程的一個記憶點時刻。CSL Mobile與中國香港科技及家電品牌代理商UNITY Tech成為Rokid此次佈局中國香港市場的兩個主要合作方,並一同進行Rokid Glasses的聯合首發。此次發佈會地點“io.t by HKT”概念店便是UNITY Tech旗下店舖,待產品上市後,Rokid Glasses將成為這間店舖、以及UNITY Tech旗下全港店舖的明星產品之一,並鋪開線上線下全管道售賣。Rokid Glasses從一個想法到如今落地,歷時三年,成為全球首款“AI+AR”(人工智慧+增強現實)一體式智能眼鏡。當使用者真實地將這款產品戴在眼上,會感嘆Rokid Glasses是一件如此超越時代的作品。它僅僅49克,甚至比許多框架眼鏡還要輕巧和無負重感。而在這樣一個看起來、戴起來與普通眼鏡無異的產品上,整合了包括題詞、翻譯、導航、AI問答等強大的AI+AR資訊互動體驗。Rokid Glasses(海外版)還在現場展示了粵語互動能力,當使用者面對一幅畫,以“Hi, Rokid”喚醒AI助手,並用粵語提出“幫我描述下眼前的這幅畫”的需求時,粵語文字版的問答資訊可以直接呈現在使用者視野中。Rokid Glasses還支援近視和散光人群定製鏡片,並通過磁吸緊密貼合,可以作為日常功能性眼鏡使用。它將數字資訊無縫融入現實世界,為使用者在工作、學習、娛樂和日常生活中帶來革命性的效率提升和體驗革新。據Rokid海外負責人邵華強介紹,相關中國香港代理商已為這款產品下訂數萬台,等待十月份產品交付,便可展開全港落地售賣。目前,使用者已經可以通過CSL的官方管道進行預定。2. Rokid全球化戰略深化,中國香港成為出海門戶2012年,Google推出第一款AR眼鏡Google glass,成為AR行業中的標誌性事件。隨後國內也進入了AR眼鏡探索期,在各個技術維度上不斷爭相探索,歷年間AR眼鏡產品經歷了數次迭代。2014年,Rokid由前阿里巴巴M工作室負責人祝銘明在杭州創辦,致力於以人工智慧為核心技術探索下一代人機互動平台。在過去的十一年,Rokid此前研發的數款AR眼鏡產品已經廣泛應用於工業、文旅博物等數個B端市場。也陸續發佈Rokid AR Lite等注重AR功能的C端產品。去年11月18號,Rokid Glasses作為Rokid首款面向C端,支援使用者全天候佩戴的“AI+AR”眼鏡,正式在杭州發佈。今年2月18日,在杭州餘杭區經濟高品質發展大會上,Rokid Glasses通過用眼鏡題詞展示了產品的跨時代功能,這個場景被現場視訊記錄後迅速登上社交媒體熱搜。在最近的一年裡,Rokid Glasses也頻頻亮相各大行業活動,在社交媒體高頻曝光,從行業破圈,引發市場和大眾的廣泛關注。目前,Rokid Glasses全球預訂單達到30萬,於去年預定的第一批使用者(F碼使用者)已經收到產品,公司按照不同的付款優先順序陸續發貨。Rokid創始人祝銘明此前提到,相比AR眼鏡,AI眼鏡市場的消費體量,使之成為“另一個等級的賽道”。也因此,能夠真正做出一款面向大眾消費者的產品,其在技術成熟度、互動體驗、使用體驗等各個方面都提出了更高的要求。因此,Rokid Glasses的亮相,以及如今Rokid Glasses(海外版)的即刻上市,也標誌著這家行業頭部的先驅公司,奠定了能夠向全球更廣闊市場走去的信心。邵華強說,在成立伊始,Rokid事實上就將自己定義為全球性的公司,Rokid的市場野心從來就不侷限在國內市場。此次中國香港發佈會,也成為Rokid Glasses出海歷程的第一站以及關鍵性一步。Rokid選擇中國香港作為Rokid Glasses全球化戰略的重要首發站,具有深遠的戰略意義。中國香港不僅是國際金融、貿易和航運中心,更是連接中國內地與全球市場,特別是亞太地區的關鍵樞紐。其成熟的消費市場、開放的商業環境以及對新科技的高接受度,為Rokid Glasses(海外版)的落地提供了絕佳土壤。“中國香港連接了中國大陸和整個國際市場,也是輻射東南亞市場的最佳門戶”,邵華強說。中國香港市場的開拓經驗,將為Rokid後續進軍文化相近、語言需求多元的亞太市場提供寶貴的借鑑和強大的信心。Rokid看到了新加坡、馬來西亞等亞太地區在AR眼鏡領域的巨大增長潛力和使用者需求,中國香港地區的發佈正是撬動這片藍海市場的重要支點。據邵華強介紹,東南亞佈局的下一個城市很可能就是新加坡。此外,Rokid Glasses北美市場的出海工作也已開啟——從中國香港開始,Rokid的出海佈局正在加速中。3. Rokid Glasses,是“AI+AR”眼鏡行業的“初代iPhone”正如蘋果定義了智慧型手機的產品形態,在接下來的十年、二十年中,儘管產品有升級,技術有迭代,這個時代智慧型手機的基礎產品形態都逃不出初代iPhone所定義的樣子。眼下,即是Rokid的“初代iPhone”時刻。目前市場上有兩種智能眼鏡形態,一種是以計算性能為優先向,側重AR能力的眼鏡;另一種是以眼鏡形態為優先向,側重AI能力的眼鏡。前者為分體式產品,眼鏡和搭載晶片、電池等的主機通過一根資料線相連,更接近娛樂性質的頭顯裝置,而後者則將晶片、電池等配件都安裝在眼鏡本體裡,無需額外配備主機,外觀上和普通眼鏡相似,可全天候佩戴,是通往更廣闊消費市場、更貼近日常生活的大眾級產品,商業空間想像力也更大。Rokid先前佈局的Rokid AR Studio、Rokid AR Lite等都是前一種智能裝置形態,在祝銘明看來,這兩種形態在Rokid的發展歷程裡,可以理解為前一種是為後一種誕生發展的技術探索與鋪墊。前一種Rokid AR眼鏡的算力優先順序形態,決定了它要往另一種娛樂方向走去,此前,祝銘明還在Rokid AR Lite眼鏡上打通了《黑神話》。Rokid在AR行業領域深耕11年,積累的光學、系統等核心能力,都為Rokid Glasses的研發鋪墊了技術基石。Rokid給文博市場做AR眼鏡導覽的經驗,也成為其得以從B端到C端的重要橋樑。此外,行業的AI時刻也成為Rokid Glasses誕生的另一個契機。“AI扣動了最後的扳機”,祝銘明說。三年前,Rokid開始研發打磨Rokid Glasses的產品形態。光波導技術是一個重要的技術向問題。目前,相關領域的光學顯示方案有兩種,分別是Birdbath和衍射光波導。Birdbath的光學模組體積會較大、鏡片會較厚,而衍射光波導方案下光線透過率更高、鏡片也更輕薄,但成本高且良品率較低。在多年打磨下,Rokid Glasses採用了雙目衍射光波導技術,亮度最高達到1500nits,顯示畫面在各種外部光源條件下依舊非常清晰。祝銘明此前提到,市場正在“跑馬圈地的階段”。縱觀國內外,Meta、小米、雷鳥等都已經發佈自家的AI眼鏡,包括Google、蘋果、阿里巴巴旗下夸克等眾多國內外大廠也都正在佈局跟進。在行業內,這樣一款大眾消費等級的AI眼鏡,面臨著行業的不可能三角:算力、續航力以及展現力。想要做高性能,就會讓功耗增大;電池做得越大,續航就越長,但是產品也會變得更加笨重。此外,在光學技術的打造上,也要兼顧美感與舒適度。Rokid Glasses採用了行業領先級晶片高通AR1,在此基礎上,通過軟體的調教達到晶片的最大性能發揮;續航方面,Rokid Glasses的電池為210毫安,但通過系統性的最佳化,能夠達到260甚至310毫安的續航水準;在眼鏡設計上,Rokid與Bolon品牌聯手為產品打造出時尚且舒適的設計,並且配備了可調節的鼻托與鏡腿。此外,Rokid也頻頻強調,自己是一家系統平台公司。Rokid自研的YodaOS-Master系統,成為產品展開一切內容生態的核心基礎。十一年以來,行業先驅Rokid在AR、AI眼鏡產品上的研發、打造,也印證了這個賽道的整體發展歷程。如果要給Rokid Glasses定一個階段性的市場定位,邵華強難掩激動,他說:“當下這個時刻,就是Rokid Glasses的初代iPhone時刻。”Rokid Glasses定義了消費級“AI+AR”眼鏡的形態。可以預見的是,接下來的十年,市場同類產品都會在這個範式中走下去。 (境外上市指南)