三人團隊打造的學術搜尋引擎,直接拿下SOTA!
號稱搜尋結果相關性平均比Google學術高5倍,能搜尋超1億個研究對象,還不依賴LLM。
更重要的是:免費,學生黨狂喜!
先來看一波使用效果,輸入搜尋關鍵詞,只需350毫秒,“啪”得一下高度相關文獻就列出來了:
還能再一鍵篩選出可查看PDF的檔案。
從年份、引用次數,到出版類型、具體期刊,都能設定一鍵過濾:
搜尋出來的論文,點選題目即可預覽,支援一鍵複製常見學術引用格式:
這個新搜尋引擎名叫Lumina,據說目前已處理了超30萬次查詢,支援24種語言。
為了和Google學術等傳統學術搜尋引擎做比較,開發團隊還專門搞了個基準測試,程式碼庫也已開源放了出來,測試結果Lumina搜尋結果的相關性拿下SOTA。
開發者發推文叫板Google:
我們三個人花幾個月就做出來了,比Google的好。
AI 3D模擬引擎Ego聯合創始人兼CTO、前Meta研究員看過後表示閉眼沖:
強烈推薦大家試一試。
還有不少學者表示好使:
如開頭所述,為了測試Lumina的性能,研究團隊開源了一個基準測試。
使用GPT-4作為“評判員”,重點比較了Lumina Base(基礎搜尋模式)、Lumina Recursive(遞迴搜尋模式)、Semantic Scholar和Google學術搜尋結果的相關性和精確度。
直接檢測評估了每個搜尋引擎的前10個搜尋結果,對比如下:
在基礎搜尋模式下(Lumina Base),Lumina搜尋結果的相關性比Google學術高4.8倍,比Semantic Scholar高8倍,評估基於生成的約2470個查詢資料集。
Lumina在遞迴搜尋模式下,搜尋結果相關性進一步提升,比Google學術高6.8倍,比Semantic Scholar高11.3倍,同樣基於2470個查詢資料集。
此外,Lumina在每次檢索中都能穩定提供2-3個高度相關結果,相比之下,Google學術只有50%的檢索能提供1個高度相關的結果,Semantic Scholar則僅有30%的檢索能達到這一標準。
換句話說,Lumina可以找到原本很難找到的研究成果。
團隊還表示,使用Lumina API和一個簡單的遞迴指令碼,可以使相關性比Google學術高11倍,Lumina API即將發佈。
除了基本的檢索,Lumina還提供AI概述功能。
比如用“機器學習”關鍵詞搜尋,它就會引用檢索出來的論文總結介紹機器學習:
點選AI概述中有下劃線的關鍵詞,就會觸發對該關鍵詞的進一步檢索:
AI概述下方還有對搜尋論文研究成果圖表的彙總:
Lumina背後是一個僅有三人的開發團隊,已獲YC投資。
聯合創始人兼CEO Mehul Chadda,本科畢業於美國威斯康星大學麥迪遜分校材料工程專業,前高精度科學儀器公司CAMECA製造工程師,負責過原子探針研發工作。
聯合創始人兼CTO Akhilesh Sharma,本科畢業於美國伊利諾伊大學香檳分校完成機械工程專業,之前是社交媒體平台Postpress的聯合創始人和技術主管,也曾擔任美國技術諮詢公司Neudesic雲技術相關顧問。
聯合創始人Ishaan Kapoor,加州大學洛杉磯分校統計學畢業,對深度學習、線性代數和大語言模型感興趣。
除了這次上新的學術搜尋引擎,之前團隊還做了一個AI論文解讀工具——Lumina-chat。
點選Lumina首頁右上角的“Legacy System”即可跳轉使用。
打開後是這樣嬸兒的,可以上傳PDF與AI互動進行論文解讀:
感興趣的童鞋可以試試~ (量子位)