日韩欧美亚洲一区,亚洲一区二区精品,在线观看国精产品一区,蜜臀99久久精品久久久久小说

OpenAI SearchGPT 官方演示大翻車,源代碼竟暴露搜索機制

SearchGPT 發布剛過兩天,已有人灰度測試到了。今天,網友 Kesku 自制的 demo 全網刷屏,SearchGPT 結果輸出如此神速,讓所有人為之震驚。

SearchGPT 發布剛過兩天,已有人灰度測試到了。今天,網友 Kesku 自制的 demo 全網刷屏,SearchGPT 結果輸出如此神速,讓所有人為之震驚。

OpenAI SearchGPT 官方演示大翻車,源代碼竟暴露搜索機制

但另一方面,OpenAI 當天放出的官方演示,被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節」的問題時,SearchGPT 竟弄錯時間,出現了幻覺。

OpenAI 發言人 Kayla Wood 已經向《大西洋月刊》承認了這個錯誤,并表示「這僅是初始的原型,我們將不斷改進。」

這個錯誤讓人不禁想起 Bard 曾經造成的慘劇。

2023 年 2 月,谷歌推出了這個聊天機器人產品以對抗 ChatGPT,但首次亮相就出現了事實性錯誤,導致 Alphabet 股價當天暴跌 9%,市值瞬間蒸發 1000 億美元。

Bard 稱 James Webb 太空望遠鏡拍攝了系外行星的第一張照片,但實際上這個功績屬于歐洲南部天文臺的 VLT

但好在,OpenAI 沒有股價可跌,而且僅開放內測的做法也是相當謹慎。畢竟有谷歌的前車之鑒,可以預料到,LLM 這種錯誤幾乎是無法避免的。

即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺,但面對龐大的訪問量也是「杯水車薪」。

假設幻覺率僅為 1%(這個比率很難達到),按照谷歌的規模,也會導致每天產生數千萬個錯誤答案。

更何況,我們目前還沒有發現足夠可靠且有效的方法,來消除 LLM 的廢話和幻覺。

而且,Andrej Karpathy 大佬曾經在推特上表達過這樣的觀點:「幻覺并不是 bug,而是 LLM 最大的特點。」

Karpathy 將 LLM 比喻為「夢想機器」:我們用 prompt 引導模型「做夢」,再加上對訓練文檔的模糊記憶,就得到了生成結果。

雖然大多數時候生成結果是有用的,但既然是「夢境」就有可能失控。當 LLM 做夢進入有事實錯誤的領域時,我們就會給它貼上「幻覺」的標簽。

這看起來是個 bug,但 LLM 只是做了它一直在做的事情。

這種機制和傳統的搜索引擎完全不同。后者接收提示后僅僅是逐字返回數據庫中最相似的文檔,因此你可以說它有「創造性問題」,因為搜索引擎永遠不可能創造新的回應。

根據 Karpathy 的說法,我們就很難指望由當前 LLM 驅動的 AI 搜索能生成 100% 真實準確的結果。

那么這場搜索引擎的變革會怎樣展開?LLM 的「夢境創意」和傳統搜索引擎的真實可靠,究竟是共存下去,還是會「你死我亡」?

原創文章,作者:科技探索者,如若轉載,請注明出處:http://www.bdzhitong.com/article/670198.html

科技探索者的頭像科技探索者管理團隊

相關推薦

發表回復

登錄后才能評論
主站蜘蛛池模板: 塔河县| 平凉市| 花莲市| 三亚市| 寻乌县| 巨鹿县| 灵石县| 原平市| 新源县| 綦江县| 闻喜县| 巴青县| 新宾| 克什克腾旗| 武义县| 南陵县| 罗定市| 通山县| 乐都县| 溧水县| 沂水县| 洛阳市| 泊头市| 四川省| 池州市| 万安县| 辛集市| 怀化市| 木兰县| 临洮县| 孟村| 定边县| 巴楚县| 金昌市| 德清县| 普宁市| 福建省| 鄂温| 莆田市| 山东| 资源县|