雖然被Manus強勢刷屏,很多人卻只能眼睜睜地看著,沒法親自上手體驗,只因一碼難求。
最新消息,就在剛剛,Manus AI的官方X帳號已被平台凍結。
不過就在此時,開源界以迅雷不及掩耳之勢上演了一波速度與激情——有這樣一個項目,僅憑三小時的程式碼量,就掀翻了AI的高牆。
昨天晚上,GitHub開源了一個無需邀請碼的OpenManus項目,剛剛開源不到一天,Star數就已經破千。
現在,所有開發者都可以實測了。
其中最亮眼的,莫過於這句「只需修改config.toml即可開玩」,直接對封閉生態公開打臉。
建立環境,克隆項目並CD到目錄,改一下config/config.toml裡的大模型資訊,再輸入一行命令,就可以愉快地在terminal裡體驗了。
conda create -n open_manus python=3.12conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.gitcd OpenManus
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# Global LLM configuration[llm]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..." # Replace with your actual API keymax_tokens = 4096temperature = 0.0
# Optional configuration for specific LLM models[llm.vision]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..." # Replace with your actual API key
python main.py沒有邀請碼,沒有壁壘,這支團隊用3小時的程式碼量,就把邀請碼機制掃進歷史垃圾堆,跟飢餓行銷徹底說拜拜!
OpenMunus的作者均為MetaGPT的核心貢獻者。
OpenManus的實現很簡單,使用到了computer use、基本的智能體和規劃。
就像在Manus中那樣,任何人都可以使用OpenManus,把自己的想法變為現實。
無論在手機上還是OS上,如果想做Deep Research,只要提交你的問題,它就可以幫你實現了。
比如,我們可以給OpenManus這樣一個任務:「對Karpathy的網站(https://karpathy.ai/)進行全面的SEO稽核,並提供詳細的最佳化報告,包括可執行的改進建議。」
OpenManus會展開思考,將自己的任務分解為如下幾步。
首先,檢查網站並收集基本資訊
然後,分析關鍵的SEO要素
第三,檢查技術性SEO方面的問題
最後,整理最佳化建議
明確任務細節後,OpenManus就打開Karpthy的網站,開始收集資訊、展開詳細分析。
整個思考過程,每一步都清晰可見。
最終,它生成了一份完整、詳實的Karpathy個人網站最佳化報告。
其中,它提出的高優先順序任務如下:Meta標籤最佳化(如最佳化頁面標題,使其包含相關關鍵詞)、技術設定(如建立並提交XML站點地圖)、內容最佳化(如為所有圖片加入alt文字、在個人網站上實施Schema標記等)。
OpenManus的核心,就是一個革命性的模組化Agent系統,由高度智能的專業團隊,組成了一個協作網路。
由此,開發者可以根據自身需要,自由組合不同的功能模組,創造出自己獨有的AI助手。
OpenManus無縫整合了包括Claude 3.5、Qwen VL Plus在內的多個頂級大模型,開發者能充分利用各個模型的優勢。
為何只用短短3小時,團隊就能打破Manus的高牆壟斷?
原因就在於,OpenManus其實源於MetaGPT的開源積累。
我們只是把瀏覽器工具鏈嫁接到過去程式碼上,配合沉澱的Agent工具包,核心系統1小時就完成了。
OpenManus的另一強大功能,就是它的即時反饋機制。
LLM思維鏈的過程,會被可視化地呈現出來。無論是任務執行進度的即時更新、思考過程日誌、檔案的即時通知等,都隨時可見。
此外,OpenManus還配備了一套強大的工具鏈,能處理各種複雜任務。
其中,這些工具都不是簡單的獨立模組,而是被精心設計的協同系統,在處理任務時能默契配合,高效完成任務。
OpenManus的開發者HKUST(GZ)博士生Jiayi Zhang上傳了一段實測視訊。
視訊中他給出了這樣一段提示:
深度調研和Manus這個Agent有關的資訊,自己整理資訊,然後寫一個新聞html頁面介紹它,你寫的html應該儘可能美觀。
接著OpenManus就開始幹活了。它將這個任務分步進行,首先使用GoogleSearch搜尋Manus Agent的相關資訊。
在這個過程中還不斷打出思考過程:「好的,讓我們繼續深入調研Manus,我會逐步訪問搜尋到的重要連結,收集資訊,然後建立一個精美的HTML網頁。」
它開始不斷呼叫工具「browser_use」,訪問不同的文章來蒐集資訊。
整理完資訊,OpenManus再次輸出:「現在讓我們使用正確的完整路徑來打開HTML檔案:」渲染完後,它就給出了網頁的連結。
打開後可以看到完整的報告。然而,OpenManus的能力還不止於此,在視訊中,它被人要求繼續完善這個頁面,加入更多具體的技術細節和實際應用案例。
接著它就又開始呼叫起「google_search」以及「browser_use」這些工具,很快就重新給出了一個新的頁面網址。
可以看出,OpenManus給出的這份關於Manus的報告,包括了Manus的誕生與發展、技術架構與創新以及實際應用案例與未來展望等。
雖然這份報告的結構看上去比較完整,但是細節還是有點乏善可陳。
在OpenManus項目中,很重要的一項功能就是Browser-use。
Browser-use是一種使AI智能體能夠操作瀏覽器的簡單方式。它在GitHub上開源,許多項目都使用了它的功能,目前已經獲得有超過35.8k個星星了。
它通過提取網站的互動元素(如按鈕、表單等),使AI能夠自動化執行瀏覽器操作,例如填寫表單、搜尋資訊或導航網頁。這對於開發AI驅動的網路代理非常有用。
比如,它可以將商品加入到你的購物車,並完成結帳。
甚至是閱讀你的簡歷,然後幫你找工作!中途如果有需要,還會遵從你的指示。
MetaGPT是一款開放原始碼的AI智能體框架,將多個AI模型整合在一起,模仿現實世界公司的運作,在模擬軟體開發流程方面表現出色。
當時一經開源,MetaGPT就火爆全網,如今在GitHub上已經收穫了49.1k stars。
向勁宇,研究方向為LLM智能體,強化學習和NLP,曾獲得阿里巴巴數學競賽AI賽道全球第二名。此前,他在西南交通大學獲得學士學位。
於兆洋,研究方向是LLM智能體及其推理,此前在中國人民大學高瓴人工智慧學院獲得學士學位。
洪思睿
洪思睿,研究興趣是LLM、NLP和多智能體系統。此前在暨南大學獲得學士學位,在香港科技大學獲得碩士學位。
這個名為OWL的項目,直接幹到開源界GAIA的性能天花板,達到57.7%,超越Hugging Face提出的Open Deep Research 55.15%的表現。
簡單來說,OWL是一個頂尖的多智能體協作框架,致力於突破任務自動化的界限。
在GAIA基準測試中,OWL取得了58.18的平均分,並在開源框架中排名第一。
在這個任務中,OWL智能體非常絲滑地完成了任務:調研總結GitHub倉庫裡都有什麼。
另外,它還能自動幫我們尋找今天在倫敦有什麼電影。
在這個過程中,CAMEL AI對Manus的技術路線做了一波逆向工程,啟動了深度復刻計畫。
首先,是把Manus的核心工作流拆成6步。
然後,所有Manus裡智能體用到的操作,團隊都會給OWL配齊。
啟動一個Ubuntu容器,OWL就能隨時隨地遠端辦公了。
在項目描述中, 團隊表達了對AI智能體的願景:
我們的願景是徹底改變AI智能體協作解決現實世界任務的方式。
通過利用動態的智能體互動,OWL能夠在多個領域中實現更自然、高效和穩健的任務自動化。
相信我們還將不斷見證各類復現項目,打破「邀請碼」的壟斷。 (新智元)