#Runway
Runway to Future:啟動桃園新引擎,鏈結世界未來產業版圖
記者李婉如/綜合報導當全球供應鏈重組、AI技術加速改寫產業版圖與人才流動形塑城市競爭格局,具備整合產業與城市能量的桃園航空城,正站上發展關鍵節點。由桃園航空城公司主辦的《Runway to Future|鏈結未來產業・啟動未來城市》論壇,於(21)日在桃園會展中心盛大舉行,匯聚產、官、學、研代表,共同對話航空城在新一輪產業轉型與城市布局中的戰略角色。產官學對話聚焦三大主題 描繪航空城未來藍圖本屆論壇以「Runway to Future」為主軸,從產業戰略、科技創新到人才布局三大面向展開,聚焦航空城在全球產業重組下的關鍵角色與未來藍圖。論壇規劃三大主題:「經濟 × 科技:未來產業的智匯基地」,探討航空城如何透過產業鏈整合與創新科技導入,成為連結全球的新經濟節點;「AI × 創新:驅動全球競爭力」,解析AI如何成為推動城市與產業升級的關鍵引擎;以及「人才 × 城市:共築新世代舞台」,強調打造宜居宜業的環境、匯聚青年與企業菁英的重要性。論壇集結產官學界重量級講者齊聚一堂,展開跨領域對話。歐洲商會理事長張瀚書則從國際視角剖析全球產業重組下的新契機,為論壇奠定宏觀格局。桃園市副市長兼桃園航空城公司董事長王明鉅先以「啟動未來:航空城下一頁篇章」為題,擘畫航空城的嶄新願景,展現航空城在全球經濟中的關鍵定位。並與桃園國際機場公司董事長楊偉甫、遠雄自由貿易港區董事長葉鈞耀帶來精彩對談,從戰略規劃、建設營運與產業佈局等多個面向提出洞見,描繪航空城作為新一代產業基地的藍圖。下半場則聚焦AI與人才兩大主題,AI大聯盟召集人李立國、英業達人資長林世斌等產業代表,分別就科技導入與人才策略分享關鍵觀察,並於「人才×城市」壓軸座談中,從企業需求與城市願景展開深入對話,凸顯航空城在未來城市競爭力布局上的關鍵角色。本次論壇不僅是產業與城市戰略的交流舞台,更是航空城邁向下一階段的重要起點。桃園市政府表示,未來將持續推動航空城的前瞻布局,攜手產業界與人才,共同打造具全球競爭力的城市新引擎。(更多活動訊息請至活動網站:https://www.cw.com.tw/feature/event/2025aerotropolis )
財富FORTUNE—這家新創公司的AI顛覆了電影業
1874年,首屆印象派畫展遭遇慘敗。克勞德·莫奈、皮埃爾-奧古斯特·雷諾阿和埃德加·德加等藝術家備受嘲諷,評論家們將他們的作品斥為“低劣”、“未完成之作”,並稱其為藝術史上最糟糕的事件。這場展覽在商業上一敗塗地,僅有3,500名參觀者,其中大多數人來此閒逛,只是為了對樸素的畫框和個性鮮明的繪畫技巧表達驚駭。大約十年後,喬治·修拉開始創作《大碗島的星期天下午》(A Sunday Afternoon on the Island of La Grande Jatte)。這幅高七英呎、寬十英呎的畫作《星期天》將成為印象派分支技法——點彩派——最為著名的典範。Runway首席執行官兼聯合創始人克里斯托瓦爾·巴倫蘇埃拉。圖片來源:KYLE GRILLOT/BLOOMBERG VIA GETTY IMAGES《星期天》的核心構想很簡單,這幅畫描繪了塞納河畔巴黎公園一個喧鬧午後的精細畫面。若仔細觀察,你能看到清晰分明的色點和光點,它們匯聚成遮陽傘、樂器、帽子、人物以及一隻拴著鏈子的猴子。每一幅畫面都可以被拆解,還原為獨立的點,這就是模擬時代的像素。而在修拉、印象派畫家與本月的Runway AI電影節(AIFF)獲獎影片《全像素空間》(Total Pixel Space)之間,存在著直接的聯絡。影片中柔和的旁白說道:“像素是數字圖像的基本單元,如同構成馬賽克的小瓷磚。每個像素都由代表顏色和位置的數字定義。因此,任何數字圖像都可以表示為一個數字序列……因此,所有可能被拍下的照片都以坐標點的形式存在。所有影片的每一幀都以坐標點的形式存在。每一張面孔都可以以坐標點的形式存在。否認這一點,就等於否認數字本身的存在。”《全像素空間》的創作者雅各布·阿德勒是一位科班出身的古典音樂家和作曲家,並且隨著AI技術的進步,他從一位涉獵廣泛的藝術家轉型成為電影製作人。阿德勒為這部影片花了一年多時間,期間生成了數萬張圖像,其靈感來源於豪爾赫·路易斯·博爾赫斯的短篇小說《巴別圖書館》(The Library of Babel),以及在隨機而廣袤的世界中找到意義的奇蹟。阿德勒表示:“我被生成這些圖像的過程深深吸引,它引發了一系列哲學思考。在這個龐大的語言組合空間中,絕大多數字母組合都是毫無意義的資料。那麼,將其應用於數字圖像領域:究竟可能存在多少張圖像?其中又有多少是難以理解的噪音呢?我曾嘗試用其他媒介表達這個想法,但都失敗了。最終它以一部AI短片的形式得以呈現。”估值30億美元的AI視訊初創公司Runway自2023年起主辦AIFF,旨在展示由AI製作的短片。今年的電影節(由《全像素空間》摘得桂冠)標誌著一個重大飛躍:從2023年在紐約市一座小型劇院舉行,只有300部作品參賽,發展到今年在林肯中心一票難求,共收到6,000份參賽作品,吸引了來自世界各地的觀眾。獲獎者並非由Runway選定,而是由包括導演哈莫尼·科林和加斯帕·諾埃在內的評審團決定,但《全像素空間》反映了Runway對其未來的構想:AI生成的體驗不僅僅是講故事,更是建構世界。Runway首席技術官兼聯合創始人阿納斯塔西斯·傑馬尼迪斯表示:“我們將擁有超越電影和遊戲的新媒體形式,它們存在於介於兩者之間的所有領域。其中一些可能更接近於沉浸式戲劇製作,雖有固定故事情節,但你可以在某種程度上自由移動,從不同角度體驗它。”傑馬尼迪斯補充道,想像一下,這些模型變得非常擅長生成對現實的逼真描繪,那麼你將擁有一個世界,在其中你基本上可以模擬我們在探索世界時關心的大部分事物。這將成為解決問題的關鍵一環。傑馬尼迪斯更多地將世界模擬視為一種根本原則;這一原則不僅能應用於故事創作,還能應用於生物學、機器人學和物理學。其核心顯然在於尋找既能模仿人類,又能模仿物理和生物的方法。Runway首席執行官兼聯合創始人克里斯托瓦爾·巴倫蘇埃拉表示:“我們希望能夠模擬物理世界中幾乎所有的指令。我們知道這一目標即將實現……AI實驗室一直痴迷於模擬人類思維。但我認為從長遠來看,這可能是錯誤的方向。你需要模擬的不是人類如何運作,而是世界如何運作。”我們正見證這一戰略初見成效的跡象,Runway計畫推出一款互動遊戲體驗,標誌著其進軍遊戲市場。目前的產品是文字和圖像生成,但預計隨著時間的推移將更加注重視覺效果。這一切最終如何導向世界建構應用場景尚不明朗——而這正是關鍵所在。巴倫蘇埃拉表示:“如果你有預先確定的實現路徑,那就太遲了,也太顯而易見了。“對我來說,關鍵在於(某物的)創造性……如果你不參與創造性活動,你就無法理解。大多數在工作中進行某種形式的創造性表達的人都知道,開始時他們並不確切知道目標在那裡。你讓自己處於一個非常脆弱的位置,只為探索一切可能。然後,最終你會憑經驗明白,你必須到達某個目的地。”Runway在AI視訊生成領域不乏競爭對手,包括但不限於OpenAI的Sora、Stability AI、Moonvalley和Pika Labs。Runway目前必須持續彰顯自身獨特性以維持競爭力。迄今為止,該公司已從泛大西洋投資(General Atlantic)、軟銀(SoftBank)、輝達(Nvidia)、Salesforce Ventures、Felicis和Coatue等投資者那裡融資超過5億美元。據報導,Meta曾試圖收購Runway未果,隨後於今年夏天斥資數十億美元收購了Scale AI。AI的“警鐘”從印刷機的發明到20世紀20年代“有聲電影”的出現,藝術的歷史就是一部技術顛覆的歷史。當然,工作崗位的流失是這段歷史的一部分,並且向來如此。瓦倫蘇埃拉表示:“在印刷機出現之前,只有僧侶和少數懂得如何傳播特定故事。後來,隨著印刷機的普及,更多人可以讀寫,這在當時被視作一場末世浩劫。”事實的確如此:當印刷機於1440年發明且該技術逐漸普及後,宗教當局擔心失去控制權,抄寫員行會也被取代。但如今人人都能閱讀,故事得以大規模傳播。瓦倫蘇埃拉舉了另一個有些滑稽的例子。瓦倫蘇埃拉表示:“在鬧鐘發明之前,你會雇一個人,在你需要的時間來到你家門口,朝你的窗戶扔石頭。那確實是一份工作。如果家人不在身邊,又需要按時起床,你還能怎麼辦?”在19世紀的英國和愛爾蘭,這些人被稱為“敲窗人”。他們會用長棍敲打窗戶或向窗戶射豌豆,以喚醒輪班的工人。鬧鐘一經發明,人們自然而然地就用起了鬧鐘。如今,隨著AI進入好萊塢(瓦倫蘇埃拉正直接參與這一趨勢),業界的反應充滿了憂慮,儘管人們私下裡也在使用它。獅門影業(Lionsgate)副董事長邁克爾·伯恩斯在AIFF舞台上指著瓦倫蘇埃拉說道:“這其實一直是個不為人知的秘密,因為無論是Runway還是其他公司,你知道的,他確實有一些競爭對手。我們相信,所有人都在使用這個工具,只是避而不談他們在使用它的事實。”Runway的傑馬尼迪斯表示,技術驅動的藝術發展分為三個階段:讓技術運作起來、模仿現有藝術形式,然後創造獨特的形式。他表示,我們才剛剛開始“借助生成式模型進入第三階段”。當然,這並非意味著一切都應該採用AI——雖然藝術家阿德勒利用AI從根本上拓展了自己的藝術實踐,但他非常清楚某些事物(如超現實主義圖像和哲學概念)非常適合AI,而其他內容(如複雜的人類互動)則不然。阿德勒表示:“我將[AI]視為一種工具,但我還不確定它是否構成了一種新的藝術門類。有些東西我能用相機創作而AI做不到,反之亦然——有些東西我能用AI實現而相機卻無能為力。”單純這一點就是一種令人驚嘆的現象,它體現了Runway及其AI視訊競爭對手已經在全球藝術、媒體和娛樂界掀起的興奮和恐慌。然而,對於Runway的創始人來說,如果他們能成功實現其AI願景,真正的回報將遠遠超出螢幕範圍,以一種壯觀、沉浸式甚至可能面目全非的形式存在。(財富中文網)
中國國產視頻大模型雙榜登頂!分數超Runway、Sora,一鏡到底運鏡絲滑,價格低至3毛/秒
智東西4月22日報導,AI視頻生成創企生數科技最新上線的全新Vidu Q1視頻大模型,同時登上多個權威文生視頻、圖生視頻基準測試榜單的第一。此模型可支援產生1080p解析度5秒視頻,產生效果清晰穩定,已在網頁端(Vidu.cn)、手機端上線。相較2.0版本,Vidu Q1進一步提升了語意理解、畫質、動作、美學、逼真和絲滑程度,首尾幀銜接更加流暢,上傳兩張圖就能生成一鏡到底的自然運鏡。性價比也相當高。一個1080p 5秒影片價格最低1.34元,價格低至0.3元/秒,僅為同類產品的1/10。Vidu Q1的動態表現出色,能駕馭特寫、特效、微縮鏡頭,生成即可商用,適用於廣告行銷、短劇、電商、互動娛樂等場景。例如用它來產生耳機、香水的廣告:有海外網友回饋說,Vidu Q1對提示詞的遵循表現提升很多,能執行一些複雜的提示詞,比Veo2的表現更好。這位網友曬出了Vidu Q1做的毛氈風動畫。影片中,小狗從虛化到清晰的聚焦轉換處理得非常自然。Vidu Q1已拿下海外權威視頻生成評測榜單VBench-1.0和VBench-2.0綜合榜單的雙冠,分數超越Runway、Sora、Luma AI等國內外知名視頻生成模型,並在VBench-1.0的視頻質量、視頻語義一致性和VBench-2.0的最識質量、物理水平這幾個維度上達到當前維度模型的綜合維度模型上。同期,Vidu Q1也在國內權威通用大模型綜合性評量基準SuperCLUE最新的圖生影片榜單中,拿下動漫風格、寫實風格雙榜單的第一。生數科技也推出了全新AI音效功能,支援一句話產生專屬音效、精細控制每段音訊的出現時間點。01 .兩張圖實現電影級運鏡,影片生成風格多元,多人物遮擋也不會崩Vidu Q1首尾影格功能升級,基於兩張圖即可實現電影級運鏡。例如上傳這兩張圖,分別作為首幀和尾幀:輸入提示詞「女特工手持手槍,射出子彈,子彈穿破玻璃球瞬間爆炸,吉恩·科蘭的漫畫風格,緊張刺激的動畫場景」後,Vidu Q1生成的視頻效果是這樣的:在生成電影場景方面,Vidu的畫面表現力已經接近以假亂真的水平,而且能夠對複雜語意理解到位。例如,讓Vidu Q1如下提示字產生影片:提示詞:深夜古堡的走廊,身穿西裝的男子手持蠟燭轉身走在走廊中,兩旁的燈光忽明忽暗,緊張刺激的氛圍,推進鏡頭拍攝,鏡頭定格在男子的臉。提示詞:寂靜的車廂裡,老人抽著香煙,煙霧瀰漫,車廂內的燈光忽明忽暗,鏡頭推進拍攝,推進到老人的臉部。提示詞:鏡頭聚焦在一位身穿皮夾克的男子,他獨自走在白天的城市街道上。陽光在人行道上投射出逼真的陰影,背景中是汽車和行人,而模糊的畫面則以電影般的照片寫實風格呈現。在主角快速移動且有遮蔽的情境下,Vidu Q1依然能夠產生人物運動自然、穩定的影片。提示詞:一張黑白照片,一位優雅的黑髮女子穿過人群,動作模糊,從街道拍攝,穿著現代服裝,空靈,穿越時空,電影攝影,對比,顆粒在Vidu模型已經非常擅長的AI動漫場景,Vidu Q1持續保持業界領先並再度升級動漫風格,支援日漫、3D動漫等多元化動漫風格,風格一致性較好,動態表現自然、穩定流暢,畫面生動。提示詞:充滿活力的動漫風格水下場景,一個睜大眼睛的女孩,有著飄逸的水藍色雙馬尾和水手風格的校服,輕輕地懸浮在水中,伸手去夠在閃閃發光的氣泡和旋轉的光束中嬉戲遊動的金橙色錦鯉魚,魔幻的氛圍,超細節,吉卜力風格的幻想,16:9 的寬高比提示詞:一個身穿運動服的超現實動漫風格女孩,被特寫鏡頭捕捉到,她滿臉雀斑,汗流浹背,臉頰緋紅,睜大的眼睛反映出情感和好奇,對著鏡頭眨眼微笑,慢慢地把手伸向屏幕,廣角微距鏡頭拍攝,超現實的紋理與風格化的柔和相結合,慢慢地把手伸向屏幕,廣角微距鏡頭拍攝,超現實的紋理與風格化的柔和相結合,情感的時刻,169 的紋理與風格化的柔和相寬,由於我們把Vidu Q1生成影片轉換成了gif動圖格式,畫質有所壓縮。原始影片很高清,可以看到皮膚上清晰逼真的紋理和汗跡。Vidu Q1同時支援文生影片、圖生影片。下方是用圖生影片功能產生的日漫風格影片範例。02 .AI音效功能發布:精準控制時間點,可疊加多段音效,率先支援48KHz高保真除了上線Vidu Q1外,生數科技也推出了全新AI音效(AI Sound Effects)功能。此功能有三個主要特點:(1)精準Timing:可精準控制每段音效的長短區間,精準設定每段音訊出現的時間點,如0-2s風聲、3-5s雨聲,是商業領域全球首家支援精細化時間控制的文生音效系統。(2)音效疊加:支援多段音效疊加,例如暴雨天的場景,涉及雨聲、風聲、打雷聲等多種類型聲音的混合,可以透過「音效疊加」來實現層次分明且動態變化的音效,具備影視級混音表達力。例如用它來產生鍵盤聲音咖啡機的複合音效。提示詞:{"提示": "@{敲打鍵盤& <0.00,8.00>}@{印表機雜訊& <2.00,3.00>}@{咖啡機& <4.50,5.50>}","開始秒數": 0,"開始秒數": 8.0}鍵盤聲音咖啡機複合音效,智東西,10秒(3)高取樣率音頻,高保真音質:業界大部分為16kHz、32kHz,Vidu做出了商業領域全球首家支援48KHz的文生音效系統,解決音效刺耳、壓縮失真、聲音不自然流暢等問題。可以感受下用此功能產生的48kHz高保真蟋蟀聲、「世界毀滅」氛圍感音效:提示詞:蟋蟀聲蟋蟀聲,智東西,6秒提示詞:形容世界毀滅的音樂傳遞「世界毀滅」氛圍感的音效,智東西,10秒03 .結論:AI影片生成進步提速,正重塑影片製作方式生成式AI正以前所未有的速度重塑影片製作的方式。 AI影片生成工具的迭代升級,可望使動漫、影視、廣告、影片剪輯、UGC創作平台等眾多行業受益。近年來,AI視訊生成模型的進步日新月異,從只能產生幾秒鐘的簡單視訊畫面,逐漸發展到能夠輸出更加複雜、連貫、自然的高品質視訊內容,不斷為視訊內容創作拓寬邊界和降低門檻。從Vidu Q1的發布可以看到,精確的語意理解、擬真的表現力、角色穩定一致、強時空連貫性等特性,是目前影片產生模型提升輸出品質的重要最佳化方向。同時,更好用的AI影片工具也要搭配更豐富、更方便的編輯功能。生數科技最新推出的AI音效功能可與影片產生功能形成互補,根據影片或場景,用一段文字即可自動產生符合氛圍、精準搭配影片畫面的背景音樂或個人化音效,有助於減少搜尋音效庫的時間,甚至減少對昂貴版權音樂的依賴。(智東西)
AI視訊生成一夜被顛覆:Runway重磅發佈Gen-4,保真度、動態性、一致性全面升級
今天,專注於視訊生成的 Runway 公司正式推出了他們的新一代模型系列 —— Gen-4。我就說Runway 這麼長時間憋啥大招呢,模型直接上線,沒有套路,最牛的是Gen-4解決了場景一致性問題,還有視覺特效加持下面給大家第一時間劃個重點:簡單來說,Gen-4 在視訊生成的保真度、動態運動捕捉和可控性上都樹立了新的標準,相較於之前的 Gen-3 Alpha 版本,提升非常明顯它的核心優勢在於:1. 高動態與真實感:能生成運動軌跡極其逼真、充滿動態感的視訊內容2. 高度一致性:無論是視訊中的主體人物、物體,還是整體的藝術風格,Gen-4 都能保持高度連貫統一3. 精準理解與執行:對使用者輸入的提示詞(prompt)理解更深刻,執行更到位,並且擁有頂尖的“世界理解”能力,讓生成內容更符合邏輯和物理規律視覺參考+指令=精準創作Gen-4 的一大亮點在於它能利用視覺參考(比如你提供一張圖片或一段視訊)結合文字指令,來創造新的圖像和視訊。這意味著你可以指定某個角色、特定風格或場景,讓 AI 在此基礎上進行創作,確保內容的連續性和你對故事走向的掌控力實戰檢驗:短片作品展示 Gen-4 強大實力為了展示 Gen-4 的敘事潛力,Runway 團隊用它製作了一系列短片和 MV:《The Lonely Little Flame》:這部短片完全由 Gen-4 生成,展示了其端到端的創作能力《New York is a Zoo》:集中體現了 Gen-4 驚人的視覺特效(VFX)潛力。製作團隊先通過 Gen-4 的 References 功能,將真實的動物參考圖和紐約實景照片融合,再結合提示詞指定具體動作,最終效果是將超寫實的動物無縫置入了紐約的電影感場景中《The Herd》:這部短片講述了一個年輕人在夜晚被牛群追逐的故事。僅用了幾張圖片作為參考,Gen-4 就建構出了角色形象和迷霧籠罩的牛群場景,最後再結合 Act-One 工具將故事串聯起來《The Retrieval》:一部動畫風格的短片,講述探險者尋找神秘花朵的故事,同樣完全由 Gen-4 製作如何用上 Gen-4?好消息是,Gen-4 的圖像生成視訊)功能,現在已經面向所有 Runway 的付費方案使用者和企業客戶正式推送。而備受期待的 References(視覺參考)功能也將在不久後上線試用地址:https://app.runwayml.com/login更多關於 Gen-4 的技術細節和研發背景,可以訪問官方發佈頁面:http://runwayml.com/research/introducing-runway-gen-4(AI寒武紀)