隨著人工智慧持續發展,如何為網頁瀏覽器整合 AI 功能,已經成為了各大軟體開發商積極思考的共同目標。即便是最為創新的開發團隊,例如曾推出 Arc 瀏覽器的 The Browser Company,近期也再度帶來更加令人驚豔,並且獲得科技圈高度關注的 AI 瀏覽器「Dia」。
帶用戶擺脫 Chrome 包袱,從頭打造 AI 瀏覽器
根據 The Browser Company 執行長 Josh Miller 的說法,跟過去為進階使用者所設計的 Arc 不同,全新瀏覽器 Dia 的開發重點,單純是把 AI 當成用戶瀏覽網路世界的中心。Josh Miller 表示,Dia 瀏覽器的核心功能為 AI 聊天工具,同時人工智慧將有能力檢視、存取使用者所瀏覽的每個網站,並且協助用戶尋找與整合資訊,完成許多複雜的工作。
矽谷投資者 M. G. Siegler 在親自嘗試過 Dia 後,認為它像是將 Google Crome 瀏覽器打掉重塑,接著導入人工智慧功能,並強調以 AI 體驗為優先的獨特、輕量化產品;尤其跟 Arc 相較,目前 Dia 的最大優點就是「簡潔」。科技媒體《The Verge》形容得更為直接,指出 Dia 瀏覽器就是「Chrome 加上 AI 聊天機器人」,因此整體操作邏輯十分容易理解,同時介面設計更加精緻,動畫細節等也更加有趣。
在維持簡潔的前提之下,Dia 並不像 Arc 瀏覽器一樣,意圖顛覆使用者現有的工作流程,即便完全不使用 AI 功能,Dia 仍可以被視為一個介面極度簡潔的 Chrome 瀏覽器,這也是為什麼它在推出之後,立刻獲得科技圈的大力關注。
減少切換、無縫接軌,再朝 AI 代理邁進
那麼 Dia 所擁有的 AI 功能,究竟能做些什麼事情呢?根據 M. G. Siegler 的說法,目前仍處於早期開發階段的 Dia,真正可以達成的任務非常有限,但卻已經徹底展現出 AI 聊天機器人深度融合網路瀏覽器之後,能夠帶給使用者的全新體驗。
舉例來說,由於 Dia 瀏覽器的 AI 聊天對話框始終位於畫面右側,所以當使用者想針對當前網頁內容提出問題時,就無需將複製連結並貼到 ChatGPT 或其他 AI 工具進行提問,相當於省下了一個步驟。
另一個更加強大的功能,在於使用者可以要求 Dia,一次查詢所有已開啟分頁的內容,讓 AI 整合各個網頁的資訊進行交叉參考;透過這種方式,Dia 會慢慢融入到使用者原先的工作流程之中,在不需要切換至額外程式或網頁的前提下,藉助 AI 力量達成真正的無縫接軌。
M. G. Siegler 認為,即便 Dia 目前尚未擁有足夠強大的 AI 代理應用相關能力,但 The Browser Company 顯然會朝這個方向投入開發。畢竟,日前由 OpenAI 所推出的自主 AI 應用 Operator 就是最佳體現,兩者之間的最大差異,僅在於該公司採用了深度客製化的 Chrome 瀏覽器,並讓 Operator 運行於 OpenAI 的雲端,而非使用者所擁有的電腦終端。
讓瀏覽器能夠隨時間推移更加個人化
若以更加技術的角度來看,Dia 瀏覽器之所以能在初期就收獲好評,莫過於開發團隊所專注的 3 項網路瀏覽核心行為,即「介面互動方式」、「多功能網址列」與「資料記憶」。
The Browser Company 技術長 Hursh Agrawal 解釋,在大多數的情況下,我們通常只要觀察一個人瀏覽網頁的行為,就能了解到很多關於那個人的資訊。
因此,Dia 開發團隊找到了一種新方法,允許瀏覽器主動儲存並快速查找網站上的重要資訊,同時讓 AI 學會辨識哪些網站內容跟使用者相關,哪些資訊其實並不重要,再將所有數據和歷史記錄回饋到 AI 聊天互動中,讓 Dia 瀏覽器可以隨著時間推移變得更加個人化。
多功能網址列搭配路由系統提高效率
其次,Dia 將網址列的多功能性看得非常重要。Hursh Agrawal 說,網址列是 AI 時代下最有價值的區域,因為它是使用者「表達意圖的唯一入口」,更是大部分人類最常接觸到的輸入框。
舉例來說,在 Dia 瀏覽器中每開啟一個新標籤頁或視窗,全都會預設顯示網址列;若使用者輸入網站名稱,Dia 將會直接跳轉至該網站;若輸入搜尋內容,那麼 Dia 就會調用傳統搜尋引擎,並且顯示網頁搜尋結果。
但若使用者選擇在網址列中,透過輸入提示詞的方式,要求 AI 處理某些事情,那麼 Dia 所具備的人工智慧就會介入,嘗試幫助使用者完成工作。
Hursh Agrawal 表示,開發團隊並沒有試圖打造像 Gemini 那樣的萬能 AI 聊天機器人,或者效仿 ChatGPT 讓使用者自由挑選 AI 模型以處理任務,而是轉向投入研發高效率的「路由系統」,透過判斷使用者所輸入的問題,讓 Dia 決定要調用的 AI 模型或工具。
舉例來說,當使用者要求 Dia 在網路上搜尋一件衣服時,內建的 AI 可能會啟動它的「購物技能」,結合使用者先前於亞馬遜或其他電商平台所瀏覽過的資訊,再給出相關的購物建議。
整合 AI 記憶能力衝擊傳統科技巨頭
至於在資料記憶方面,由於 Dia 會主動儲存使用者瀏覽每個網站時所接收到的 Cookie,因此未來 Dia 的 AI 將有能力「代表」使用者,跟網路上的各種服務進行互動,甚至是查看網站上的所有私人內容。
M. G. Siegler 就認為,Dia 藉助 Cookie 所擁有的資料記憶能力,可能會衝擊 Google、Meta 等,傳統科技巨頭運用使用者資料的方式。
The Browser Company 技術長 Hursh Agrawal 直言,儘管目前 Dia 仍是透過 Cookie,取得使用者儲存於網站上的個人資料,但在 AI 的幫助下,以後 Dia 可以做的事情將得到無限延伸。簡單來說,當 AI 代理能夠主動瀏覽網頁,並代表人類使用者執行操作時,未來瀏覽器將會成為一座強大的「指揮中心」,替用戶發起在網路上的一切行動。
「聊天」已開始出現在「搜尋」之前
當 AI 工具跟使用者之間的關係,開始變得深刻且無法避免,那麼圍繞著 AI 的操作邏輯,開發更加客製化的網頁瀏覽器,這件事顯然就十分合理。
The Browser Company 執行長 Josh Miller 指出,根據觀察,許多參與 Dia 瀏覽器測試的早期使用者,更喜歡在進行 Google 搜尋之前,就向 AI 提出問題或計畫;換句話說用戶的「聊天」行為,已經開始出現在「搜尋」之前。
在過去一年時間裡,就連 Josh Miller 自己也驚訝地發現,他更常在工作流程中仰賴 AI 聊天完成任務,而非採用傳統的關鍵字搜尋;或許有些對 AI 仍抱有謹慎心態的人,會覺得上述的情況很恐怖,但使用者趨勢卻不會說謊。
除了 The Browser Company 之外,AI 搜尋引擎 Perplexity 也正在打造自家的瀏覽器,而 OpenAI 更是早早就宣布投入相關應用的研發工作,至於 Google 亦忙著把 Gemini 整合到 Chrome 瀏覽器之中。
一場 AI 瀏覽器大戰的序幕
矽谷投資者 M. G. Siegler 就直言,Dia 彰顯了網頁瀏覽器未來的發展樣貌,尤其當人們逐漸習慣人工智慧之後,這股風潮將會從電腦,一路吹向行動裝置,例如讓手機或平板擁有相同的 AI 原生瀏覽體驗。
M. G. Siegler 也分析,在第三方 AI 瀏覽器的衝擊下,生態系相對較為封閉的蘋果,很有可能會因此落居劣勢。
M. G. Siegler 說,儘管蘋果一直都在半強迫使用者,於行動裝置上使用 Safari 瀏覽器或網頁框架,但未來 AI 的強勢介入很可能改變這種情況,蘋果也會試著透過自己的人工智慧,爭取奪回瀏覽器應用的主導權。
假設 The Browser Company 對人工智慧的發展方向判斷正確,那麼網頁瀏覽器未來將不再只是網頁瀏覽器,它可能會成為一款無處不在且最了解使用者,甚至能夠幫助用戶處理任何事情的應用程式。
若從上述觀點來看,橫空出世的 Dia 只不過是為一場 AI 瀏覽器戰爭,悄悄拉開了序幕。
【推薦閱讀】
◆ 「AI 將迅速接管金融體系。」《人類大歷史》作者哈拉瑞提醒 AI 本質是代理
◆ 英國政府推 GOV.UK 超級 App:可存取數千種政府服務,將融入 Anthropic 聊天機器人
◆ 每次使用 ChatGPT 時,都應該開一個新的聊天嗎?
*本文開放合作夥伴轉載,參考資料:《Spyglass》、《The Verge》,首圖來源:Dia
(責任編輯:鄒家彥)



