全球的開發者都來上海了!
今天,全球開發者先鋒大會(GDC)在上海正式開幕,這是開年以來上海乃至國內最為盛大的技術盛會之一,吸引了全球逾百個開發者社區參與,可謂是AI界的一場「超級大派對」。
全球開發者先鋒大會源自世界人工智慧大會(WAIC),截至今年已成功舉辦三屆。大會圍繞著「人工智慧+」產業生態,服務全球的開發者。
大會上彙集了來自AI產業鏈上下游的各大主體,既有像商湯、階躍星辰這樣的基礎模型企業,也有專注於提供語料、算力、垂類模型、工具等細分領域企業,更有諸多投資機構的參與。
全球開發者先鋒大會圍繞著線上新經濟、具身智慧、自動駕駛、科學智慧、智慧終端等五大應用領域開展活動,推動基礎大模型與金融、醫療、教育、製造、文旅、城市治理等產業的供需對接。除了今天上午的開幕式之外,還會有大量企業講壇與開發者活動陸續舉辦。
本次大會的定位是“社區的社區”,Hugging Face、Linux社區、CSDN 社區、阿里魔搭社區、微軟開發者社區等國內外知名開發者社區悉數參會,儼然成為全球科技領域的重要行業盛會。
本屆大會上,多模態AI成為了一大趨勢。透過整合文字、圖像、音訊等多模態資料,AI模型能擁有對複雜環境的理解與生成能力,不僅能理解語言,還能理解現實世界中廣泛存在的多模態資訊。
這不僅推動了AI在更多領域的應用,如自動駕駛、智慧零售等,更是通往世界模型的必經之路,並有望加速通用人工智慧(AGI)的實現。
本屆大會參展、承辦活動的各家AI企業,也都在近期於多模態AI這一前沿方向做出了最新成果。
階躍星辰開年以來在多模態AI領域持續發力。 1月,階躍星辰推出了涵蓋語言、語音、影像和視訊生成等領域的6款多模態大模型,還在2月開源了2款多模態大模型,包括全球參數量最大(300億)的開源文生視訊模型Step-Video-T2V。
商湯科技在大會上推出小浣熊2.0與LazyLLM開源Agent開發框架。其中,小浣熊2.0 是基於「日日新」融合大模型開發的智慧工具,能完成跨檔案的多工程式碼修改開發作業,涵蓋軟體需求分析、架構設計、程式碼編寫、軟體測試等環節,滿足使用者程式碼編寫、程式設計學習等各類需求。
MiniMax稀宇科技舉辦講壇,探討多模態大模型開源技術的最新發展及其在各行業的應用落地。其旗下視訊生成產品海螺AI全球爆火,支援400萬tokens上下文的MiniMax-Text-01模型更在全球開源發佈。
上海人工智慧實驗室則在今年2月聯合南京大學、中科院深圳先進技術研究院,共同開源了視訊多模態大模型書生InternVideo2.5,記憶力較前代模型擴容六倍,具備萬幀長視訊中精準的大海撈針能力。
在大會的互動區,出門問問也帶來了多款AIGC工具,其中包括AI配音助理魔音工坊、AI數位分身奇妙元、AI短片生成平台元創島等。
這些進展不僅推動了多模態AI技術的普及,也為全球開發者提供了強大的工具,加速了AI在智慧汽車、影視創作等領域的應用落地。
本屆全球開發者先鋒大會上的另一個重要趨勢便是具身智能。大會現場,宇樹、特斯拉、智元、星海圖、開普勒、中電科21所、鈦虎、雲深處、智元新創、創新中心、無錫巨蟹、傲意等一眾人形機器人廠商悉數到位。
剛在春晚舞台上大放異彩的宇樹人形機器人再次成為焦點,上演了機器人遛機器狗的超現實畫面。
來自加速進化的人形機器人則進行了一場別開生面的球賽。
這些機器人不僅擁有類人的外觀和行動能力,也開始逐漸具備對世界的理解、認知能力,這是機器人進化為具身智慧的重要一步。
具身智能源自於認知科學中的具身認知理論,而這個理論認為,智能不只是大腦的功能,也需要透過身體與環境的互動逐漸培養。同樣的,人工智慧系統需要透過與環境的互動來獲取資訊、理解問題、做出決策並實現行動,才能產生真正的智慧行為和適應性。
隨著AI、機器學習、電腦視覺等關鍵技術的突破,具身智慧迎來了極大的發展機遇,使得機器人能夠更好地適應複雜多變的環境和任務,具備自主學習能力、感知能力、決策能力。
除了上述兩大重要趨勢之外,全球開發者先鋒大會的活動也涵蓋了線上新經濟、自動駕駛、智慧終端等應用場景,全面涵蓋了當下科技產業的前沿進展與落地案例。
在今天早上的開幕典禮上,有不少「AI+場景」、「AI+服務」的專案簽約。 AI+金融方面,商湯科技與太平洋保險簽約,此舉正值上海市推進「AI+金融」的實踐,可望發揮AI在支付、保險、銀行等金融場景中的優勢。 AI+醫療方面,衛寧健康分享AI在醫療應用場景的落地,發佈WiNGPT醫療大模型最新版本,發佈國內首台內建大模型的醫療核心應用一體機等產品。
根據大會主辦單位上海市人工智慧產業協會秘書長鐘俊浩介紹,與世界人工智慧大會不同,GDC大會更注重開發者群體的交流與合作。多個全球知名開發者社群參與了本屆大會,包括Linux社群、CSDN社群、阿里魔搭社群、微軟開發者社群、AWSUG社群等。
在他們看來,開發者大會的定位不僅限於AI領域,隨著技術的成熟,開發者的群體也不斷擴大。現在的開發者不僅是程式碼編寫者,還包括AIGC(人工智慧生成內容)開發者、硬體開發者等。例如,有人用AI技術作畫、生成文字,也有人開發人形機器人或智慧穿戴裝置。
DeepSeek掀起的開源浪潮,也讓開源AI成為這屆大會上繞不開的話題。香港科技大學校董會主席、美國國家工程院外籍院士沈向洋便談道,開源促進了大模型時代的合作,中國團隊正積極參與當下的開源潮流。
大會上,開放原始碼的機器學習平台和社群Hugging Face會舉辦程式設計機器人Seeed具身智慧駭客松,全球最大的開放原始碼軟體基金會——Apache基金會全球副總裁Justin McLean也作為嘉賓出席並演講,還有許多開發者社群會組織分享最新的開源技術和應用案例。
上海市人工智慧產業協會秘書長鐘俊浩認為,開源不僅是一種商業策略,更是一種文化、一種精神,如何促進開源開放的這種精神,促進全球AI產業的平權,是這次大會中的核心要點之一。
對開發者而言,開源降低了技術門檻和成本,提供了豐富的工具和資源,加速了創新與協作。
對產業整體發展而言,開源推動了AI技術的普及,打破了技術壟斷,促進了透明度和信任。同時,開源加速了AI在各行業的應用落地,建構了更廣泛的生態,並推動了安全、倫理等方面的討論。
本屆大會也見證了全球科學智能開發者社群的啟動。這個社群旨在推動AI在科學研究中的廣泛應用,將聚集全球頂尖的科學家和開發者,共同探索AI在科學智能領域的潛力,研究機構、頂尖高校及AI企業作為代表出席,形成產學研用的協同創新。
本次GDC大會的口號為「開發者,找找找」。透過「找場景,找大咖,找融資,找技術,找工作,找項目,找夥伴」等一系列的活動,讓項目找到資本,讓場景找到服務,讓企業找到市場,讓人才找到僱主,讓開發者找到技術,讓年輕人找到夥伴,促進開發者們資源對接,產業融合。
聚焦大模型、算力、語料、工具、軟體平台等核心技術,大會參與的開發者群體來自硬體開發、雲端運算、巨量資料、物聯網、AI、機器人、區塊鏈和元宇宙等多個領域,開發者活動將為這些來自不同產業的開發者創造交集,相關活動包括沉浸式互動體驗、開發者工作坊、GDC Talk 開放式大展場大比賽表演大展館大賽事。
本屆大會也會用真金白銀幫助開發者將自己的想法變成現實。投資機構一直是全球開發者先鋒大會的常客,去年,共有100余家知名投資機構參會,超200個項目參加路演,新創企業融資金額超10億元。今年,上海國投、徐匯資本、中金資本、孚騰資本、中科創星等實力雄厚的投資機構將會參與路演。
此外,本次大會上將有100億以上的專案場景,面向開發者群體和企業進行招標,可望創造更多的專案機遇,可謂是誠意滿滿。
資金之外,高品質資料將持續推動AI發展,因此,本屆大會也將見證上海市人工智慧產業協會資料語料工作委員會的成立。
鐘俊浩認為,高品質的語料變得越來越重要。目前,網路上的資料只占人類可見資料的20%左右,更多的資料存在於圖書館、工廠檔案室、教育檔案等地方。如何從這些資料中提取高品質的語料,是未來AI競爭的關鍵。
本委員會由上海AI語料資料平台企業庫帕思科技和上海市人工智慧協會推動成立,大會上也將探討如何從現有資料中提取語料,以及如何透過合成資料提升大模型的能力。
大會在建構開發者網路、促進資源對接、保障語料、算力等AI核心生產資料的努力,可望為AI產業打造堅實的發展基座,並輻射整個科技產業。
本屆大會不僅是全球開發者群體的盛會,更突破傳統技術會議的侷限,成為集技術探索、職業發展、創新激發與全球合作於一體的多維平台,為開發者與AI產業注入全新活力與無限可能。
從產業視角來看,大會展現了AI技術的前沿創新,促進開源生態建設與產業化處理程序,也推動了全球合作與交流,成為AI產業發展的關鍵加速器。 (智東西)