當今,晶片產業正經歷一系列深刻的變革:設計複雜性日益增加、向埃米時代的跨越、1000倍的功率目標減少、multi-die的挑戰,還有很重要的人才短缺問題。根據BCG ananlysis的分析,到2030年,據預測,美國的設計工作者需求將高達89,000人,相比現在預計將有接近50%的增長。但遺憾的是,到那時供應量預計只有66,000人,且這一數字每年僅增長不到1%。這意味著到2030年,設計業面臨的人才短缺達到23,000人,而這個數字預計每年還會以3,000人的速度持續成長,缺口高達35%。
「時間就是金錢」是半導體產業中的生動演繹。為了應對這一系列的挑戰,半導體產業必須不斷尋找新的方法來提高生產效率和品質。近些年,EDA「左移」策略在晶片設計中逐漸被廣大業界所採納。實體設計、測試與驗證等環節越來越多地被提前到RTL設計階段。值得關注的是,AI的逐漸參與,也成為一道亮麗風景線。現在,AI技術不僅滲透到了晶片設計、驗證和製造,還開始滲透到測試中,為測試這項傳統流程注入了前所未有的活力和精確性。
晶片測試複雜度攀升,亟需更先進的ATPG技術
隨著晶片不斷邁向先進製程節點技術及其設計規模的擴張,測試領域遭遇了前所未有的複雜度和挑戰。採用先進製程的設備導致了測試設備(ATE)成本的急劇上升,主要受到高引腳數、快速介面和深度模式記憶體對高效能測試硬體的需求影響。此外,隨著晶片的功能不斷擴展,也帶來了對更多邏輯的測試需求,進而需要更多的模式和測試器內存,導致測試成本的持續成長。
在晶片測試中,"pattern count" 是一個很重要的概念。它通常指的是測試向晶片應用的測試模式的數量。簡單地說,這些pattern是一系列的輸入訊號,用於檢查晶片上的各種功能和結構是否按預期工作。每一個pattern都會模擬一個特定的工作場景或操作條件,以確定晶片在該場景或條件下是否正常運作。
pattern count與測試成本直接相關。因為高pattern count可能意味著更詳盡和全面的測試,但也可能意味著更長的測試時間和更高的成本。相反,一個低的pattern count可能減少了測試的時間和成本,但可能遺漏某些關鍵的測試場景。所以,對於pattern count需要找到一個平衡,既能確保晶片在各種場景下都經過充分測試,又能保持效率。在晶片測試中,優化pattern的數量至關重要。
為了產生這些pattern count,自動測試模式產生(ATPG)流程應用而生。ATPG的主要目標是確保晶片或硬體系統的高品質、低成本、快速運作和高生產率。在品質方面,它需要檢測所有的有缺陷的部件,從而確保較低的DPPM(每百萬件的缺陷部件數),並支援先進的故障模型。從成本的角度考慮,ATPG要努力最小化測試pattern或測試週期,同時也減少測試的資料量。在運行時間方面,它強調快速的pattern生成和品質結果分析。為了提高生產率,ATPG工具需要有開箱即用的自動化功能。
典型的ATPG流程往往比較複雜,它包含多個相互依賴的參數,而且主要依賴手動迭代和微調測試配置來優化測試結果品質(QoR) ,但手動估計參數可能會導致不準確的結果或效率低下。工程師需投入大量時間進行迭代以確保測試品質。而且ATPG流程的不可預測性增加了管理難度,這可能需要經驗豐富的工程師來支援。這些問題可能會導致專案延誤和資源浪費,也延長了流片的專案時間線,增加矽片測試成本。
所以,現在的ATPG技術已經不足夠滿足當前的需求,工程師也不能再依賴這種方法來滿足最後期限或達到最佳結果。業界亟需更先進和高效的ATPG解決方案來滿足未來晶片在測試領域的挑戰。
新思科技TSO.ai工具為半導體測試注入AI動力
面對複雜的半導體測試挑戰,AI展現了其潛在的價值。與傳統的方法相比,AI能夠更快、更準確地產生測試pattern,確保高覆蓋率,同時也能大幅減少所需的時間和資源。
作為將AI引入EDA工具領域的先行者,新思科技的TSO.ai(測試空間優化AI)是業界首款用於半導體測試的自主人工智慧(AI) 應用程序,它有如下四大主要特點或優勢:
利用人工智慧技術,以更少的pattern實現更高的測試覆蓋率。
提供可重複且可預測的流程,以滿足設計進度的需求。
透過有效的迭代和並行運行加速週轉時間。
無需專門的工具知識,即可在大規模上實現專家級的生產力。
那麼,TSO.ai是如何借助AI的力量來實現這些優勢的呢?
為了提高效率,TSO.ai透過並行ATPG運作學習並確定這些因子之間的關聯性,根據學習結果智慧地調整設置,並透過連續的運作不斷減少搜尋空間,以達到最優值。TSO.ai工具會盡可能的產生最少數量的測試pattern,來降低測試的週期,並適應有限的測試器記憶體。雖然TSO.AI可以最小化pattern數量,但它是以最大化測試覆蓋率為目標。
具體到TSO.ai運作上,有兩種設定策略:包括冷啟動和熱啟動。沒有先前關於設計和參數的學習的初始TSO.ai運行稱為冷啟動。熱啟動利用從先前運行中學到的知識,用於在小型設計或ATPG修改後節省時間。為了減少TSO.ai的周轉時間,可以先對故障樣本進行冷啟動,然後對完整的故障集合進行熱啟動。
在這兩種啟動模式中,使用者可以自訂並行的TestMAX ATPG運行數量和學習迭代次數,這些並行運行被視為在多台機器上運行的「工作人員(Workers)」(如下圖所示),而每台機器上的迭代次數被稱為「乘數(multiplier)」。根據可用的計算資源,使用者可以選擇使用更多的工作人員與較低的乘數以快速得到結果,或者使用較少的工作人員與較高的乘數來在運行時進行權衡。
具體到實際操作,為了縮短TSO.ai的周轉時間,我們可以先對一個小的故障樣本執行冷啟動,配置為使用12個工作人員和3個乘數。接著,對完整的故障集合進行熱啟動,這時的配置可以調整為使用5個工作人員和1個乘數。
目前在早期客戶參與的結果中,TSO.ai在多個領域有持續的測試成本降低。在許多情況下,pattern數量平均減少了20-25%。其中在某些最佳案例中,有超過50%的pattern減少。具體可參見下圖。
新思科技建議的TSO.ai使用流程如下:
缺陷覆蓋率、pattern count以及運行時間是評估ATPG工具結果時需要考慮的三個關鍵指標。TSO.ai工具是未來晶片測試領域的寶藏。它不僅透過自動優化pattern數量降低了測試成本,還透過消除冗長且隨機的ATPG迭代大大縮短了測試時間。最令人印象深刻的是,無論是資深工程師還是初入行的新手,都能透過它實現專家級的工作效率。
AI驅動晶片設計的時代已經來臨
早在2020年,新思科技推出了全球首個用於晶片設計的AI應用程式DSO.ai;2021年該公司創下了一個世界生產力記錄,一個工程師完成了10個模組的設計,而且總功率降低了9%;2022年,DSO.ai取得了前所未有的採用記錄,半導體產業的TOP10中有9家公司採用了這項技術。與傳統設計方法相比,使用AI設計的晶片在性能上有了100%的提升,且DSO.ai已經使得超過100種商業產品通過了設計驗證。
2023年,新思科技推出了業界首個AI驅動的電子設計自動化(EDA)整體解決方案Synopsys.ai,該全流程解決方案涵蓋了設計、測試、驗證和製造等多個面向。它包括用於下一代設計的DSO.ai,用於驗證的VSO.ai以及本文所講的用於測試的TSO.ai。
可以說,AI已經滲透到晶片產業鏈的各個過程,從設計、製造到測試,都展現了巨大的潛力。這種滲透使得工程師能夠更專注於晶片的品質和差異化,而不是繁瑣的重複任務。未來,隨著AI和深度學習與EDA工具的深度磨合和優化,將進一步推動半導體技術的革新。(半導體產業觀察)