碾壓華爾街,GPT-4 選股收益超40%



你是否想過,有一天利用GPT-4 的決策在股市中進行量化投資?GPT-4 具有先進的自然語言理解能力,可以分析大量的金融數據、市場新聞和公司資訊。當它與傳統的量化投資方式結合,這意味著投資者可以藉助GPT-4 強大的NLP 能力,深入挖掘股票市場,全面了解公司績效、市場動態和宏觀經濟因素。

當AI 與量化投資技術組合起來,將會創造出什麼樣的投資決策呢?

近期有篇文章研究了這個問題,他們提出了MarketSenseAI,該平台整合了多種數據來源,包括實時市場動態、財經新聞、公司基本面和宏觀經濟指標,從而產生全面的投資建議,它充分利用先進的AGI 技術,重新定義了股票投資策略。實驗表明,在基於市值加權的表現方面,MarketSenseAI 的總回報達到驚人的40.27%

論文題目:
Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection

論文連結:
https://arxiv.org/abs/2401.03737

部落格網址:
https://www.marketsense-ai.com/


從本質上來說,股票選擇是一種價格發現機制,在股票投資中,市場參與者透過理解和使用各種資訊來做出決策。然而,自從08 年的金融危機後,資本市場的結構和功能發生了重大變化,對價格發現產生了持久的影響。因素共同擾亂了價格發現的正常運作,導致投資者減少準確評估風險和資產價值的動力。然而,相較於擁有專業團隊和全面分析工具的財富管理公司來說,由於分析資訊的能力有限、易受行為偏見的影響以及缺乏健全的風險管理技能,個人投資者通常難以分析股票。

而基於GPT-4 進行決策的MarketSenseAI 或許能破除這個困境,與傳統股票分析方法相比,MarketSenseAI 有以下優勢:

  • 分析全面性:能夠整合多種資料類型,包括公司新聞、基本面、市場動態和宏觀經濟訊息,為投資者提供全面的分析。
  • 基於AI 的決策:利用GPT-4 模型進行決策,具有更高的分析能力和更強的適應性。
  • 可解釋性:產生的投資建議附帶詳細解釋,幫助投資人更好地理解分析結果。
  • 靈活性:可廣泛應用於不同的金融資產,特別是在傳統分析較少的市場中,可能發揮更大的優勢。


MarketSenseAI

MarketSenseAI 的框架如圖1 所示,該架構整合了負責處理資料輸入四個核心元件,以及用於促進最終投資建議(即買入、持有或賣出)的第五個元件,該元件綜合了所有信息,並為相應的決策提供簡明扼要的解釋。其中每個元件都建立在GPT-4 的API 上,利用一次性提示和上下文學習來執行不同任務。

▲圖1 MarketSenseAI 的架構圖


該框架可以模擬專業投資團隊的決策過程,旨在提供全面而深入的投資決策支持,涵蓋市場各個方面的資訊。具體而言,該框架透過多個核心組件來實現這一目標。

  1. 新聞摘要器:追蹤公司或其部門的最新發展,以保持對市場動態的敏感度。
  2. 基本面摘要器:對公司的最新財務報表進行分析,以評估其財務健康狀況
  3. 宏觀和價格動態摘要器:結合了對價格行為動態的考慮,對當前環境進行宏觀經濟分析。

漸進式新聞摘要器

漸進式新聞摘要器負責新聞取得、壓縮和製作股票最具影響力新聞的漸進性摘要。如圖2 所示,取得與特定股票對應的每日新聞。

▲圖2 漸進新聞摘要器

首先,對每日新聞進行預處理,剔除了與公司無關的文本,並確保其以適當的格式輸入系統。接著,透過API 存取GPT-4,系統有序地提供提示,以產生每日新聞的簡明摘要,並將其集中儲存。

為了彌補特定日期摘要的不足,引入了漸進式新聞摘要器,透過將最新的新聞摘要與先前的漸進摘要集成,確保全麵包含公司相關新聞內容,這對於在公司決策過程中仍具有重要意義的舊新聞(如併購或法律糾紛)尤其關鍵。

基本面摘要器

基本面摘要器的目標是提供公司財務狀況的事實性概覽,而非直接提供投資建議。

在預測性金融分析中,至關重要的基本數據能提供反映公司當前健康狀況和未來趨勢的關鍵量化指標。如圖3 所示,作者使用EODHD 的基本資料API 取得這些關鍵的季度資訊。為了方便對財務數據進行比較,作者在將數據輸入提示之前進行了預處理:採用數字縮寫技術,使用諸如“百萬”和“億”等單位來表示大數,並將來自不同季度的數據以表格形式合併。作者將最近兩個季度的財務報表輸入到GPT-4 中進行比較,深入研究了企業利潤能力、收入軌跡、債務指標和現金流動態。

▲圖3 股票的基本面摘要

股價動態摘要器

股價動態摘要器在MarketSenseAI 中扮演關鍵角色,它對股票的價格趨勢和財務指標進行深入分析和上下文處理。如圖4 所示,該組件不僅關注目標股票本身,還透過與其他相似公司的比較,以及考慮整個市場的背景,提供了更全面的分析和情境化,以更好地理解目標股票在行業和市場整體中的表現。

▲圖4 股價動態摘要


辨識類似股票的方法如演算法1 概述,利用MPNet 語言模型產生Embedding 並計算相似性分數。

▲演算法1 相似股票辨識演算法


摘要器取得了目標股票、與其相似的其他股票以及S&P 500 指數的市場數據。接著,它對這些數據進行深入分析,專注於關鍵的財務指標,其中包括3、6 和12 個月的累積回報和夏普比率,並進行了波動性和最大回撤的計算。其中:

  • 夏普比率:提供了有關股票在市場下行期間的風險調整回報的資訊。
  • 最大回撤:反映了股票在某一時期內可能承受的最大損失。

這種全面的分析使我們能夠深入了解目標股票相對於同業和更廣泛市場的表現,包括其在市場波動和風險方面的應對能力。

宏觀經濟環境摘要器

進行深入的宏觀經濟分析對於做出明智的投資決策和有效的資本配置至關重要,因為它提供了對整體經濟健康和績效的關鍵見解,這有助於投資者及時獲取關鍵信息,更好地理解當前經濟環境並做出明智的投資決策。

由此,MarketSenseAI 包含了一個名為市場摘要(MarketDigest)的組件,每兩週綜合一次投資報告和研究文章,提供複雜經濟數據和趨勢的簡明摘要。它透過蒐集各大銀行和投資機構的各種公開報告,從而確保了從多個權威來源獲取信息,而且能將多種觀點和分析融入連貫敘述中。具體地:

  1. 將這些報告和文章轉化為文本形式,然後利用GPT-4 對每份報告進行摘要。
  2. 將這些個別摘要濃縮成一個全面的概述。


▲圖5 宏觀經濟環境摘要

訊號生成

訊號產生器是MarketSenseAI 流程的最後一步,可整合分析多種金融資料(包括公司新聞、基本面、市場動態和宏觀經濟資訊),從而產生投資決策訊號(買入、賣出或持有),以及對這個選擇背後的推理的清晰、逐步的解釋。其中,GPT-4 採用思維鏈方法(CoT),透過多步驟分析引導模型做出關於下個月投資組合分配的決策,提示結構為:

  • 新聞分析:評估與目標公司相關的最新新聞摘要,以評估它們對股票績效的潛在影響。
  • 價格動態分析:將股票的價格動態與相關股票和整體市場進行比較,提供相對績效的觀點。
  • 宏觀經濟環境分析:評估更廣泛的宏觀經濟格局及其對目標公司的影響,考慮全球經濟趨勢和事件。
  • 基本面分析:對公司基本的財務數據進行審查,分析其當前的財務狀況和未來前景。


▲圖6 MarketSenseAI 組件與訊號的文字相似性


圖6 展示了MarketSenseAI 內部的文本相似性分析,而表1 則提供了詳細說明,這表明模型的決策過程與不斷變化的輸入資訊相一致,對於產生每月的投資訊號至關重要。

▲表1 訊號與組件之間的文字相似性統計


  • 新聞和價格動態摘要有高相似性分數,顯示模型強調了這些快速變化的因素,以及它們對股價的即時影響。這對於短期、每月的預測至關重要,因為當前的發展和價格趨勢很大程度上可以影響市場行為。
  • 相反,基本面和宏觀組件的平均相似性分數較低,對模型每月決策的直接影響較小。基本面每季更新一次,提供了對公司財務健康的穩定但不經常變化的視角,而宏觀經濟數據則更為廣泛和通用,對短期投資決策的影響更小。

實驗

Bootstrapping 評估結果

自舉法(Bootstrapping)是一種統計學中的重抽樣方法,用於估計統計量的分佈或標準誤差。其基本概念是透過從原始樣本中有放回地抽取大量的隨機樣本,來近似得到原始樣本的分佈。

▲表2 MarketSenseAI vs 自舉投資組合


表2 顯示了實驗結果,該評估對比了MarketSenseAI 與各種自舉投資組合的有效性。對MarketSenseAI 在去趨勢化收益方面的表現進行評估,從而提供了對其訊號產生能力的精細分析。

實驗結果顯示MarketSenseAI 的交易訊號在各種訊號類別中的累積收益和命中率明顯優於隨機機會。即使在去趨勢化收益的評估中,相比於隨機信號生成方法,MarketSenseAI 的表現更出色,有力地證明了其交易信號明顯超出了單純偶然的預期,這表明它在辨別具有利潤潛力的投資機會方面具備較高能力。

市場表現評估結果

基本策略

▲表3 MarketSenseAI 基本策略的表現


對MarketSenseAI 的基本策略進行評估,從表3 和圖9 的結果來看,揭示了使用LLM 推動的投資策略的效果,總體而言,MarketSenseAI 的全部信號(MS)和僅考慮“買入”信號的長期版本(MS-L)的策略都顯示出相對良好的回報


▲圖9 等權重投資組合的表現


結果表明,MarketSenseAI 的基本策略在整體和風險調整回報方面明顯優於等權重的S&P 100 指數,相較於市場參與者通常採用的天真的趨勢跟隨策略,MarketSenseAI 在2023 年取得了更顯著的結果。

基於市值加權的表現方面,MS-LCap 策略在夏普比率、Sortino 比率以及總回報方面均表現出色,總回報達到驚人的40.27%,這相較於S&P100 ETF 超過了約12.6%,如圖10 所示。


▲圖10 基於市值加權的投資組合的表現

基於排名的策略

▲表4 MarketSenseAI 以排名為基礎的策略的表現


表4 和圖11 的研究重點放在了實際應用這些訊號的投資組合。結果表明,融入GPT-4 排名的策略在總回報和風險調整指標方面明顯優於其他變體。此外,MS-HighGPT 與MS-Low-GPT 策略之間存在顯著差異,突顯了MarketSenseAI 訊號附加解釋的價值,以及作為傳統風險/回報為基礎的股票排名方法的較好替代方法。


▲圖11 排名投資組合的表現

GPT 排名

借鑒了GPT-4 對MarketSenseAI 訊號排名的洞察後,其買進訊號在評估期間具有很高的解釋品質。圖12 展示了每個月每隻股票的買入訊號頻率,並透過散點圖描繪了GPT-4 分配的評估分數,這些分數基於每個買入建議的解釋深度和相關性。從圖中可以觀察到,技術和人工智慧相關的股票得分較高,反映了這些領域在2023 年市場上的炒作。這不僅證明了MarketSenseAI 的買進訊號的相關性,還突顯了該模型在解釋中捕捉和傳達當前市場情緒和潛力的能力

▲圖12 由GPT-4 排名的訊號

總結

透過綜合多種來源、多種模態的訊息,MarketSenseAI 提供了對金融領域更全面的視角,帶來更明智且數據驅動的投資決策。這個以AI 為基礎的框架為個人和專業投資者提供了一種獨特工具,可處理和分析龐大的資料集,實現產生可擴展、可操作的投資訊號。該創新方法已經通過驗證,超越基準指數,這證明了在當今複雜的市場環境中的有效性。今後將可望實現:

  • 分析股票:模擬頂尖投資團隊,能夠提供相對專業的資產洞察,為更明智的財務決策提供全面分析。
  • 投資訊號:提供可行、可解釋、透明的投資訊號。
  • 個人化投資組合:根據使用者獨特的投資目標和風險偏好,量身訂做投資組合策略。

目前為了防範資金風險,還需要進行持續研究和長期試驗,以確認MarketSenseAI 在不同市場週期和情境中的效率和靈活性。然而,相較於先前量化方案中簡單地用時間序列的相關網絡處理股票數據,MarketSenseAI 還綜合了股票市場的其他模態信息,進行了詳細而又全面地分析解讀,避免了單純地使用黑盒神經網路在股票資訊中尋找特徵。也許未來它能夠成為一名優秀的AI 基金經理,讓相對小白的投資人士也能透過全面的分析來讀懂市場。(夕小瑤科技說)