SearchGPT 發布剛過兩天,已有人灰度測試到了。今天,網友 Kesku 自制的 demo 全網刷屏,SearchGPT 結果輸出如此神速,讓所有人為之震驚。

但另一方面,OpenAI 當天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節」的問題時,SearchGPT 竟弄錯時間,出現了幻覺。
OpenAI 發言人 Kayla Wood 已經向《大西洋月刊》承認了這個錯誤,并表示「這僅是初始的原型,我們將不斷改進。」
這個錯誤讓人不禁想起 Bard 曾經造成的慘劇。
2023 年 2 月,谷歌推出了這個聊天機器人產品以對抗 ChatGPT,但首次亮相就出現了事實性錯誤,導致 Alphabet 股價當天暴跌 9%,市值瞬間蒸發 1000 億美元。
Bard 稱 James Webb 太空望遠鏡拍攝了系外行星的第一張照片,但實際上這個功績屬于歐洲南部天文臺的 VLT
但好在,OpenAI 沒有股價可跌,而且僅開放內測的做法也是相當謹慎。畢竟有谷歌的前車之鑒,可以預料到,LLM 這種錯誤幾乎是無法避免的。
即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺,但面對龐大的訪問量也是「杯水車薪」。
假設幻覺率僅為 1%(這個比率很難達到),按照谷歌的規模,也會導致每天產生數千萬個錯誤答案。
更何況,我們目前還沒有發現足夠可靠且有效的方法,來消除 LLM 的廢話和幻覺。
而且,Andrej Karpathy 大佬曾經在推特上表達過這樣的觀點:「幻覺并不是 bug,而是 LLM 最大的特點。」
Karpathy 將 LLM 比喻為「夢想機器」:我們用 prompt 引導模型「做夢」,再加上對訓練文檔的模糊記憶,就得到了生成結果。
雖然大多數時候生成結果是有用的,但既然是「夢境」就有可能失控。當 LLM 做夢進入有事實錯誤的領域時,我們就會給它貼上「幻覺」的標簽。
這看起來是個 bug,但 LLM 只是做了它一直在做的事情。
這種機制和傳統的搜索引擎完全不同。后者接收提示后僅僅是逐字返回數據庫中最相似的文檔,因此你可以說它有「創造性問題」,因為搜索引擎永遠不可能創造新的回應。
根據 Karpathy 的說法,我們就很難指望由當前 LLM 驅動的 AI 搜索能生成 100% 真實準確的結果。
那么這場搜索引擎的變革會怎樣展開?LLM 的「夢境創意」和傳統搜索引擎的真實可靠,究竟是共存下去,還是會「你死我亡」?
原創文章,作者:科技探索者,如若轉載,請注明出處:http://www.bdzhitong.com/article/670198.html