為促進文化資產數位化與智慧應用,某宗教文化機構近年積極推動數位典藏平台建置計畫,期望結合生成式人工智慧與大型語言模型,讓大量典籍、著作及研究文獻得以智慧檢索與互動化學習。此計畫不僅涵蓋典藏資料的數位重整,也延伸至語意理解、經典詮釋與知識問答等應用,藉由AI技術重現文化思想價值,打造可持續運作的智慧人文知識服務體系。
客戶背景與需求
- 知識資料龐雜且結構鬆散
長期以來,典藏文獻、研究論文及口述資料分散於不同媒介與格式,缺乏統一索引與結構化整理,導致知識檢索效率低。
- 傳統查詢模式侷限
使用者須以關鍵字比對進行搜尋,很難以語意或問題導向方式獲取答案,無法支援自然語言互動式學習。
- 資料詮釋缺乏現代語境
雖典藏內容豐富,但部分經典與思想詮釋文字艱澀,無法吸引年輕世代;需要藉由AI協助轉譯為淺顯易懂的語言。
- 維運與資料更新成本高
傳統數位化專案多以靜態展示為主,缺乏動態知識更新與AI導引機制,難以長期維持知識動能。
解決方案
透過精誠資訊AI團隊的協助之下,協助從以下幾點將典藏轉換為數位知識:
- 建立結構化知識資料庫:整合典籍、文獻、研究論文等資料,透過自動化文本切割、向量化與Metadata標註,建立可供語意搜尋的向量資料庫。
- 導入LLM語意理解與生成技術:以AWS Bedrock平台為核心,採用Titan Embeddings進行語意編碼,並以Claude 3 Opus與Claude Sonnet等模型進行生成式問答與內容摘要,支援多語對話及多輪互動。
- 設計多場景應用服務:依據使用族群與知識層面,歸納與設計不同的應用場景,包含全集知識應答、研究論文知識應答、主題展示互動、經典應答(大師觀點)、虛擬導師(修行指導)。各場景皆具獨立知識域與Prompt Template,可針對不同語境生成對應答案。
- 強化準確性機制避免誤導:建立「稽核軌跡」記錄模型輸入輸出內容,對生成內容加註資料來源(如「【來源:藏經名稱·章節】」);若模型知識不足時則自動回覆「請洽專業指導」,避免誤導資訊。
- 雲端與地端混合部署架構:系統後端採FastAPI與Angular前後分層架構,部分AI服務部署於AWS Bedrock雲端,並於地端建置Docker與VM 環境,以兼顧運算效能與資料安全。
創造價值
- 智慧化知識服務:使用者可透過自然語言與AI互動,即時獲得經典詮釋與思想引導,打破傳統資料檢索限制。
- 文化傳承與教育推廣:將艱深的佛教思想與文獻知識以現代語言呈現,促進大眾理解與青年族群接觸,加深文化教育成效。
- 資料資產長期可用:透過結構化知識庫與向量化儲存,建立可延伸維運的AI知識體系,後續能持續增補新資料與改版。
- 跨領域應用潛能:除宗教文化領域外,此AI知識平台模式亦可延伸應用於教育、博物館、典藏單位等多元知識應用情境。
- 提升決策與研究能量:研究者可利用系統進行文獻比對與思想脈絡分析,加速知識探索與學術研究進程。
