假如你是一位股市分析師,或撰寫市場趨勢報告的研究員,當你興高采烈的想使用生成式 AI 來蒐集資料,結果模型卻告訴你它的資料來源僅限於 2022 年以前的資訊,無法精準告訴你某支股票或是一間公司的近況,你利用 AI 工具協作的美夢立刻破碎。
但 OpenAI 在 10 月初更新的一項功能,卻打破這項瓶頸。Open AI 宣布,ChatGPT 如今能搜索、瀏覽到網路上的即時資訊,而不僅限於 2021 年 9 月前的資料。訂閱用戶與企業用戶,只要選擇 GPT-4 裡的「以 Bing 瀏覽」功能,即可得到模型依據最新消息所生成的答覆。
(編按:GPT 為 Generative Pre-trained Transformer 的縮寫,指生成式預訓練的 Transformer 模型。)
RAG 是什麼?比過往模型訓練方法都省時、省力
ChatGPT 的改良在大型語言模型業界,投下一枚震撼彈,因為背後標誌著 RAG 技術的大躍進。RAG(擷取增強生成,retrieval-augmented generation)
可說是現在 AI 市場中最火熱的名詞,IBM 的 AI 研究部門副總裁 Sriram Raghavan 指出,該技術約興起於 6 個月前,也就是在各家推出的大型語言模型襲捲市場後。
簡單來說 RAG 是種校正方法,能降低大型語言模型憑空杜撰答案、產生幻覺(Hallucination)的機率。而 RAG 比過去其他種校正技術都來得快速、有效。在理解 RAG 如何辦到這點之前,得先知道以往在訓練一項大型語言模型時,通常是在線下以大量資料庫、耗費大量運算資源訓練出來的。其後模型在使用時生成的回覆,只能基於訓練時的數據,模型無法參考任何外界產生的新資訊。
過去當訓練人員要校正、餵給模型最新資料好減少幻覺發生的機率時,通常有兩個方法。一個是微調(Fine-tuning),也就是重新餵養一批新的數據到模型中,這樣的做法不但需要大量的時間與運算資源,而新數據也會有過時的問題。
另一個方式則是利用近期火紅的高薪職位——提詞工程師(prompt engineers)。其任務是不斷透過範例提問、溝通訓練生成式 AI 模型的邏輯推理能力,並說出更貼近人性、符合現實情況的答覆。
掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊
校正方式像塞小抄!RAG 幫助答覆更加客製化
不過 RAG 有著更快更省事的調整效率,RAG 可能僅需一兩個完整的文本,而非上百上千筆新範例,就能讓模型給出參考過新資料而生成的答覆。背後的概念是提供模型一組從未接觸、使用過的新數據,要求其在回答前參考過這筆資料。
白話來說,如果把大型語言模型當成一位考生,RAG 就像是張臨時塞的小抄,模型能快速參考 RAG 外插的資料,但上面的資訊很快會在回答後被模型遺忘,並不會真的被內化、永存於模型中,就像考生只會在作答當下記得小抄內容,而非真正融會貫通。
但這仍對許多研究工作產生莫大幫助。想像你是正在撰寫論文的研究生,如果你想透過模型蒐集更多能支持研究的論據,只要插入你目前的論文及參考資料,模型將能更精準的替你搜查所需內容。
過去一個月內,不僅微軟、Google,連亞馬遜、IBM 也都積極開發能讓用戶使用的 RAG 產品。可想見在未來,無論企業或個人都能更嫻熟的使用聊天機器人生產出貼近需要的客製化內容。
關於生成式 AI,或許你想知道:
*本文開放夥伴轉載,參考資料:《Fortune》、《InfoWorld》、《Unite.AI》、《AINews》。首圖來源:Unsplash。
(責任編輯:廖紹伶)






