你是否想過,有一天利用GPT-4 的決策在股市中進行量化投資?GPT-4 具有先進的自然語言理解能力,可以分析大量的金融數據、市場新聞和公司資訊。當它與傳統的量化投資方式結合,這意味著投資者可以藉助GPT-4 強大的NLP 能力,深入挖掘股票市場,全面了解公司績效、市場動態和宏觀經濟因素。
當AI 與量化投資技術組合起來,將會創造出什麼樣的投資決策呢?
近期有篇文章研究了這個問題,他們提出了MarketSenseAI,該平台整合了多種數據來源,包括實時市場動態、財經新聞、公司基本面和宏觀經濟指標,從而產生全面的投資建議,它充分利用先進的AGI 技術,重新定義了股票投資策略。實驗表明,在基於市值加權的表現方面,MarketSenseAI 的總回報達到驚人的40.27%
論文題目:
Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection
論文連結:
https://arxiv.org/abs/2401.03737
部落格網址:
https://www.marketsense-ai.com/
從本質上來說,股票選擇是一種價格發現機制,在股票投資中,市場參與者透過理解和使用各種資訊來做出決策。然而,自從08 年的金融危機後,資本市場的結構和功能發生了重大變化,對價格發現產生了持久的影響。因素共同擾亂了價格發現的正常運作,導致投資者減少準確評估風險和資產價值的動力。然而,相較於擁有專業團隊和全面分析工具的財富管理公司來說,由於分析資訊的能力有限、易受行為偏見的影響以及缺乏健全的風險管理技能,個人投資者通常難以分析股票。
而基於GPT-4 進行決策的MarketSenseAI 或許能破除這個困境,與傳統股票分析方法相比,MarketSenseAI 有以下優勢:
MarketSenseAI 的框架如圖1 所示,該架構整合了負責處理資料輸入四個核心元件,以及用於促進最終投資建議(即買入、持有或賣出)的第五個元件,該元件綜合了所有信息,並為相應的決策提供簡明扼要的解釋。其中每個元件都建立在GPT-4 的API 上,利用一次性提示和上下文學習來執行不同任務。
該框架可以模擬專業投資團隊的決策過程,旨在提供全面而深入的投資決策支持,涵蓋市場各個方面的資訊。具體而言,該框架透過多個核心組件來實現這一目標。
漸進式新聞摘要器負責新聞取得、壓縮和製作股票最具影響力新聞的漸進性摘要。如圖2 所示,取得與特定股票對應的每日新聞。
首先,對每日新聞進行預處理,剔除了與公司無關的文本,並確保其以適當的格式輸入系統。接著,透過API 存取GPT-4,系統有序地提供提示,以產生每日新聞的簡明摘要,並將其集中儲存。
為了彌補特定日期摘要的不足,引入了漸進式新聞摘要器,透過將最新的新聞摘要與先前的漸進摘要集成,確保全麵包含公司相關新聞內容,這對於在公司決策過程中仍具有重要意義的舊新聞(如併購或法律糾紛)尤其關鍵。
基本面摘要器的目標是提供公司財務狀況的事實性概覽,而非直接提供投資建議。
在預測性金融分析中,至關重要的基本數據能提供反映公司當前健康狀況和未來趨勢的關鍵量化指標。如圖3 所示,作者使用EODHD 的基本資料API 取得這些關鍵的季度資訊。為了方便對財務數據進行比較,作者在將數據輸入提示之前進行了預處理:採用數字縮寫技術,使用諸如“百萬”和“億”等單位來表示大數,並將來自不同季度的數據以表格形式合併。作者將最近兩個季度的財務報表輸入到GPT-4 中進行比較,深入研究了企業利潤能力、收入軌跡、債務指標和現金流動態。
股價動態摘要器在MarketSenseAI 中扮演關鍵角色,它對股票的價格趨勢和財務指標進行深入分析和上下文處理。如圖4 所示,該組件不僅關注目標股票本身,還透過與其他相似公司的比較,以及考慮整個市場的背景,提供了更全面的分析和情境化,以更好地理解目標股票在行業和市場整體中的表現。
辨識類似股票的方法如演算法1 概述,利用MPNet 語言模型產生Embedding 並計算相似性分數。
摘要器取得了目標股票、與其相似的其他股票以及S&P 500 指數的市場數據。接著,它對這些數據進行深入分析,專注於關鍵的財務指標,其中包括3、6 和12 個月的累積回報和夏普比率,並進行了波動性和最大回撤的計算。其中:
這種全面的分析使我們能夠深入了解目標股票相對於同業和更廣泛市場的表現,包括其在市場波動和風險方面的應對能力。
進行深入的宏觀經濟分析對於做出明智的投資決策和有效的資本配置至關重要,因為它提供了對整體經濟健康和績效的關鍵見解,這有助於投資者及時獲取關鍵信息,更好地理解當前經濟環境並做出明智的投資決策。
由此,MarketSenseAI 包含了一個名為市場摘要(MarketDigest)的組件,每兩週綜合一次投資報告和研究文章,提供複雜經濟數據和趨勢的簡明摘要。它透過蒐集各大銀行和投資機構的各種公開報告,從而確保了從多個權威來源獲取信息,而且能將多種觀點和分析融入連貫敘述中。具體地:
訊號產生器是MarketSenseAI 流程的最後一步,可整合分析多種金融資料(包括公司新聞、基本面、市場動態和宏觀經濟資訊),從而產生投資決策訊號(買入、賣出或持有),以及對這個選擇背後的推理的清晰、逐步的解釋。其中,GPT-4 採用思維鏈方法(CoT),透過多步驟分析引導模型做出關於下個月投資組合分配的決策,提示結構為:
圖6 展示了MarketSenseAI 內部的文本相似性分析,而表1 則提供了詳細說明,這表明模型的決策過程與不斷變化的輸入資訊相一致,對於產生每月的投資訊號至關重要。
自舉法(Bootstrapping)是一種統計學中的重抽樣方法,用於估計統計量的分佈或標準誤差。其基本概念是透過從原始樣本中有放回地抽取大量的隨機樣本,來近似得到原始樣本的分佈。
表2 顯示了實驗結果,該評估對比了MarketSenseAI 與各種自舉投資組合的有效性。對MarketSenseAI 在去趨勢化收益方面的表現進行評估,從而提供了對其訊號產生能力的精細分析。
實驗結果顯示MarketSenseAI 的交易訊號在各種訊號類別中的累積收益和命中率明顯優於隨機機會。即使在去趨勢化收益的評估中,相比於隨機信號生成方法,MarketSenseAI 的表現更出色,有力地證明了其交易信號明顯超出了單純偶然的預期,這表明它在辨別具有利潤潛力的投資機會方面具備較高能力。
對MarketSenseAI 的基本策略進行評估,從表3 和圖9 的結果來看,揭示了使用LLM 推動的投資策略的效果,總體而言,MarketSenseAI 的全部信號(MS)和僅考慮“買入”信號的長期版本(MS-L)的策略都顯示出相對良好的回報。
結果表明,MarketSenseAI 的基本策略在整體和風險調整回報方面明顯優於等權重的S&P 100 指數,相較於市場參與者通常採用的天真的趨勢跟隨策略,MarketSenseAI 在2023 年取得了更顯著的結果。
在基於市值加權的表現方面,MS-LCap 策略在夏普比率、Sortino 比率以及總回報方面均表現出色,總回報達到驚人的40.27%,這相較於S&P100 ETF 超過了約12.6%,如圖10 所示。
表4 和圖11 的研究重點放在了實際應用這些訊號的投資組合。結果表明,融入GPT-4 排名的策略在總回報和風險調整指標方面明顯優於其他變體。此外,MS-HighGPT 與MS-Low-GPT 策略之間存在顯著差異,突顯了MarketSenseAI 訊號附加解釋的價值,以及作為傳統風險/回報為基礎的股票排名方法的較好替代方法。
借鑒了GPT-4 對MarketSenseAI 訊號排名的洞察後,其買進訊號在評估期間具有很高的解釋品質。圖12 展示了每個月每隻股票的買入訊號頻率,並透過散點圖描繪了GPT-4 分配的評估分數,這些分數基於每個買入建議的解釋深度和相關性。從圖中可以觀察到,技術和人工智慧相關的股票得分較高,反映了這些領域在2023 年市場上的炒作。這不僅證明了MarketSenseAI 的買進訊號的相關性,還突顯了該模型在解釋中捕捉和傳達當前市場情緒和潛力的能力。
透過綜合多種來源、多種模態的訊息,MarketSenseAI 提供了對金融領域更全面的視角,帶來更明智且數據驅動的投資決策。這個以AI 為基礎的框架為個人和專業投資者提供了一種獨特工具,可處理和分析龐大的資料集,實現產生可擴展、可操作的投資訊號。該創新方法已經通過驗證,超越基準指數,這證明了在當今複雜的市場環境中的有效性。今後將可望實現:
目前為了防範資金風險,還需要進行持續研究和長期試驗,以確認MarketSenseAI 在不同市場週期和情境中的效率和靈活性。然而,相較於先前量化方案中簡單地用時間序列的相關網絡處理股票數據,MarketSenseAI 還綜合了股票市場的其他模態信息,進行了詳細而又全面地分析解讀,避免了單純地使用黑盒神經網路在股票資訊中尋找特徵。也許未來它能夠成為一名優秀的AI 基金經理,讓相對小白的投資人士也能透過全面的分析來讀懂市場。(夕小瑤科技說)