OpenAI SearchGPT 官方演示大翻車，源代碼竟暴露搜索機制

科技探索者 ? 2024年7月29日 12:19:00 ? AI

SearchGPT 發布剛過兩天，已有人灰度測試到了。今天，網友 Kesku 自制的 demo 全網刷屏，SearchGPT 結果輸出如此神速，讓所有人為之震驚。

但另一方面，OpenAI 當天放出的官方演示，被外媒《大西洋月刊》曝出其中的問題。在回答「8 月在北卡羅來納 Boone 舉辦的音樂節」的問題時，SearchGPT 竟弄錯時間，出現了幻覺。

OpenAI 發言人 Kayla Wood 已經向《大西洋月刊》承認了這個錯誤，并表示「這僅是初始的原型，我們將不斷改進。」

這個錯誤讓人不禁想起 Bard 曾經造成的慘劇。

2023 年 2 月，谷歌推出了這個聊天機器人產品以對抗 ChatGPT，但首次亮相就出現了事實性錯誤，導致 Alphabet 股價當天暴跌 9%，市值瞬間蒸發 1000 億美元。

Bard 稱 James Webb 太空望遠鏡拍攝了系外行星的第一張照片，但實際上這個功績屬于歐洲南部天文臺的 VLT

但好在，OpenAI 沒有股價可跌，而且僅開放內測的做法也是相當謹慎。畢竟有谷歌的前車之鑒，可以預料到，LLM 這種錯誤幾乎是無法避免的。

即使 OpenAI 能夠找到方法大幅減少 SearchGPT 的幻覺，但面對龐大的訪問量也是「杯水車薪」。

假設幻覺率僅為 1%（這個比率很難達到），按照谷歌的規模，也會導致每天產生數千萬個錯誤答案。

更何況，我們目前還沒有發現足夠可靠且有效的方法，來消除 LLM 的廢話和幻覺。

而且，Andrej Karpathy 大佬曾經在推特上表達過這樣的觀點：「幻覺并不是 bug，而是 LLM 最大的特點。」

Karpathy 將 LLM 比喻為「夢想機器」：我們用 prompt 引導模型「做夢」，再加上對訓練文檔的模糊記憶，就得到了生成結果。

雖然大多數時候生成結果是有用的，但既然是「夢境」就有可能失控。當 LLM 做夢進入有事實錯誤的領域時，我們就會給它貼上「幻覺」的標簽。

這看起來是個 bug，但 LLM 只是做了它一直在做的事情。

這種機制和傳統的搜索引擎完全不同。后者接收提示后僅僅是逐字返回數據庫中最相似的文檔，因此你可以說它有「創造性問題」，因為搜索引擎永遠不可能創造新的回應。

根據 Karpathy 的說法，我們就很難指望由當前 LLM 驅動的 AI 搜索能生成 100% 真實準確的結果。

那么這場搜索引擎的變革會怎樣展開？LLM 的「夢境創意」和傳統搜索引擎的真實可靠，究竟是共存下去，還是會「你死我亡」？

原創文章，作者：科技探索者，如若轉載，請注明出處：http://www.bdzhitong.com/article/670198.html

OpenAI SearchGPT

科技探索者管理團隊

0 0

AI

ChatGPT vs Grok：誰更懂你的需求？

隨著人工智能技術的迅速發展，市場上涌現出多個智能對話應用，其中ChatGPT 和 Grok 是大家重點關注的兩款AI聊天工具。前者由OpenAI開發，后者則是馬斯克的xAI公司推出…

AI
3天前
AI

OpenAI?GPT-4.5發布時間曝光，GPT-5五月下旬有望發布

有消息稱，微軟近日正緊鑼密鼓地為OpenAI的最新模型做準備，關于GPT-4.5發布時間也被曝光。據了解，GPT-4.5預計最快將于下周與公眾見面。據可靠消息透露，微軟不僅即將推…

AI
4天前
AI

?馬斯克Grok應用登頂美國App Store免費榜，超越ChatGPT

據外媒報道，馬斯克旗下的人工智能公司xAI推出的Grok應用，成功登頂美國區App Store免費應用排行榜，將此前占據榜首的OpenAI的ChatGPT應用擠至其后?。據悉，x…

AI
4天前
AI

?OpenAI周活躍用戶突破4億大關，企業業務迅猛增長

據外媒報道，截至本月，OpenAI周活躍用戶數量已激增至4億，相比去年12月的3億用戶，增長了33%?。這一里程碑式的成就標志著OpenAI旗下明星產品ChatGPT的廣泛認可和迅…

AI
4天前
新聞

OpenAI將放大招 GPT-5免費無限使用

今日，OpenAI首席執行官薩姆·奧爾特曼公布了一個令人震驚的消息：OpenAI將在未來幾個月內推出GPT-5模型，并免費無限使用。在之前將先發布GPT-4.5模型，代號為“Ori…

AI
2025年2月13日
商業

DeepSeek估值飆升，或達OpenAI估值一半

近日，據彭博社報道，一家名為DeepSeek的初創公司，其估值在短時間內出現了驚人的增長，最高或已達到1500億美元，這一數字幾乎達到了另一AI巨頭OpenAI估值的一半。此消息一…

商業頭條
2025年2月12日
AI

OpenAI CEO阿爾特曼：AI成本驟降，每年成本降至十分之一

近日，OpenAI的首席執行官山姆·阿爾特曼（Sam Altman）在一篇博文中，揭示了人工智能發展的迅猛勢頭及其對社會經濟的深遠影響。阿爾特曼指出，AI模型的智能程度與其訓練和…

AI
2025年2月12日
AI

奧特曼盛贊DeepSeek：AI實力可媲美ChatGPT

近日，美國開放人工智能研究中心（OpenAI）的首席執行官奧特曼在啟程前往巴黎人工智能行動峰會前，對一家中國AI初創公司——深度求索（DeepSeek）給予了高度評價。據德新社11…

AI
2025年2月12日
新聞

OpenAI、谷歌等巨頭聯手成立ROOST，為AI時代兒童安全保駕護航

近日，Roblox、Discord、OpenAI和谷歌四大科技巨頭宣布聯合成立一個名為ROOST的非營利組織，旨在構建一個可擴展且互聯互通的在線安全基礎設施，以應對AI時代帶來的挑…

net
2025年2月11日
新聞

傳聞馬斯克豪擲974億美元欲購OpenAI，阿爾特曼婉拒并反提收購推特

近日，據外媒從多方消息源處獲悉，科技巨頭埃隆·馬斯克向人工智能領域的重要力量OpenAI拋出了橄欖枝，提出以高達974億美元（約合7118.43億元人民幣）的價格收購其運營資產。 …

NEWS
2025年2月11日
新聞

OpenAI超級碗首秀廣告，約1.3億人觀看

在第59屆美國超級碗比賽期間，人工智能公司OpenAI迎來了其電視廣告的首次亮相。這支耗資1400萬美元的60秒廣告，成功吸引了約1.3億觀眾的眼球。超級碗作為美國國家橄欖球聯盟…

李森
2025年2月10日
新聞

阿爾特曼談DeepSeek：開源模型貢獻巨大，期待AGI與GPT-5

近日，在柏林工業大學的一場對話中，OpenAI的CEO阿爾特曼再次談及了DeepSeek，并對開源模型對世界的貢獻給予了高度評價。他表示，AI在科研中的價值在于節省時間，幫助人們思…

net
2025年2月9日
新聞

OpenAI將首登超級碗廣告，發力營銷新征程

今日，據華爾街日報援引知情人士消息，人工智能公司 OpenAI 預計將在周日的美國超級碗比賽期間播出首個電視廣告。 OpenAI 成立于 2015 年，2022 年底推出廣受歡迎的…

AI
2025年2月6日
新聞

OpenAI放大招:免費開放ChatGPT搜索

今天凌晨 3 點，OpenAI 宣布向所有用戶開放ChatGPT搜索功能，無需注冊。與傳統搜索引擎相比，它抓取網絡信息更快，能實現分鐘級解析，對股票、體育、財經等急需即時新聞的行業…

若安丶
2025年2月6日
新聞

三星李在镕、OpenAI 阿爾特曼、軟銀孫正義首爾會晤，謀劃AI合作新篇

據外媒報道，本周二，三星電子副董事長李在镕、OpenAI 首席執行官薩姆?阿爾特曼和軟銀首席執行官孫正義在韓國首爾舉行三方會晤，聚焦人工智能領域的潛在合作。消息人士稱，阿爾特曼原…

小丸子
2025年2月5日
出海

OpenAI奧爾特曼：無意起訴中國AI初創公司DeepSeek

據外媒報道，美國開放人工智能研究中心（OpenAI）首席執行官奧爾特曼于2月3日作出重要表態。他明確表示，OpenAI 沒有計劃起訴中國 AI 初創公司杭州深度求索人工智能基礎技術…

NEWS
2025年2月5日
AI

OpenAI發布o3-mini模型，成本效益高刷新基準測試

近日，OpenAI正式發布了其推理系列中的最新成員——o3-mini模型。該模型已在ChatGPT和API中開放使用，據稱在數學代碼等基準測試中刷新了SOTA記錄，展現了卓越的性能…

AI
2025年2月2日
AI

Meta將繼續大力投資AI 扎克伯格已宣布今年資本支出將超過600億美元

Meta、谷歌等加大AI投入，Meta去年初采購35萬塊GPU花費超100億美元，CEO扎克伯格宣布今年資本支出600-650億美元，大幅擴大AI團隊，計劃上線1GW算力，年底擁有超130萬塊GPU。

科技探索者
2025年1月26日
AI

OpenAI即將推出智能體能控制計算機并獨立執行任務

OpenAI將發布AI智能體Operator，可在瀏覽器中代用戶執行任務，提供旅游、餐飲等建議。存在濫用風險。Operator利用多模態技術，多家AI公司正推自主AI代理，面臨變現壓力。

蘋果派
2025年1月23日
AI

OpenAI CFO 回應馬斯克訴訟：這是競爭手段，AI 太燒錢非營利模式難以為繼

OpenAI CFO稱馬斯克阻止其轉型為營利公司是競爭手段，強調開發AI需巨資，考慮IPO但擔憂短期利益影響。OpenAI進入“智能代理”領域，技術正滲透到經濟各領域。

潮玩君
2025年1月22日

發表回復

登錄后才能評論

OpenAI SearchGPT 官方演示大翻車，源代碼竟暴露搜索機制

相關推薦

發表回復