国产综合久久久久久鬼色,亚洲最大中文字幕,丰满的人妻hd高清日本

北京時間8月9日，據彭博社報道，幾個月來，OpenAI CEO薩姆·奧特曼(Sam Altman)一直在大力宣傳GPT-5的性能，把它的發布描繪成了公司歷史上的關鍵時刻。但是在GPT-5發布后的24小時內，這款新模型收到了褒貶不一的評價。

在周四的發布會上，OpenAI聲稱GPT-5在編程和處理復雜問題的推理能力方面更勝一籌，并表示它已先進到足以讓聊天機器人ChatGPT達到“博士級專家”的水平。

令人失望

雖然一些早期使用者稱贊了該模型，但也保留了意見。開發者西蒙·威利森(Simon Willison)在博客文章中寫道，“它是我目前最喜歡的新模型”，稱其“性能出眾”，“偶爾令人驚艷”，“但與之前的版本相比并沒有重大飛躍”。

在各大社交媒體平臺上，ChatGPT用戶對GPT-5持續存在編造信息、搞錯基礎數學和拼寫問題的情況表示失望。本特利大學數學系副教授諾亞·詹西拉庫薩(Noah Giansiracusa)認為，這次升級“令人失望”。他指出，雖然GPT-5“確實有些改進”，但“改進幅度比我期望的要小得多”。

奧特曼

部分用戶的負面反應，或許源于他們對技術底層運作機制的誤解。與OpenAI此前發布的模型不同，GPT-5會根據查詢內容自動切換不同復雜程度的模型。這種設計雖然能優化公司的計算資源配置，但也意味著用戶并不總能調用到最強大的技術版本。

例如，在一次測試中，當被問及單詞“blueberry”中字母“b”出現了多少次時，GPT-5最初給出了“三次”的錯誤答案。但當被提示“仔細想一想”后，GPT-5似乎切換到了更高級的推理模型，給出了正確答案。

奧特曼：系統出故障

周五，奧特曼對部分用戶反饋作出恢復，承認系統存在技術故障。“從今天開始，GPT-5會顯得更聰明些，”他表示，“昨天自動切換器出現故障，大半天都無法正常工作，導致GPT-5表現得異常遲鈍。”

此次升級對OpenAI至關重要。OpenAI正在努力保持領先地位，應對來自美國和中國競爭對手日益激烈的競爭。同時，它還要說服企業用戶和個人用戶為其付費服務買單，以抵消其在人才、芯片和數據中心等方面的巨額投入，維持AI研發。

隨著AI系統的不斷進步，想要明確評判各類服務的優劣變得越來越困難。截至周五中午，GPT-5已在LMArena(基于用戶評分的熱門AI模型排行榜)上登頂多個類別的榜首。但另一個基準測試ARC-AGI-2則顯示，GPT-5落后于埃隆·馬斯克(Elon Musk)旗下xAI的最新版Grok。

一些用戶認為GPT-5寫作更差

在缺乏更明確評估標準的情況下，模型之爭有時更多靠感覺來判斷。如今每周有近7億人使用ChatGPT，難免會有人對模型的表現感受不一。要評估一個新AI系統對個人生活與工作的價值，短短一天時間遠遠不夠。

賓夕法尼亞大學沃頓商學院教授伊桑·莫利克(Ethan Mollick)經常試用各類AI模型，他對GPT-5的研究能力、機智的文字應答以及編程簡化功能(即便是對新手)贊嘆不已。

“GPT-5會自主完成各種任務，常常是超凡的任務，有時是奇怪的任務，有時則是非常AI式的任務，”他在博客中寫道，“而這正是它最迷人的地方。”

然而，在社交論壇Reddit上，用戶的反應卻截然不同。在周五的“有問必答”活動中，奧特曼面對了一些用戶的質疑。這些用戶對自己無法掌控和了解具體由哪個模型響應查詢感到不滿。奧特曼表示，OpenAI將采取措施解決這些抱怨，包括提高系統的“透明度”。

在活動中，奧特曼曾回應一位Reddit用戶的問題。他指出，OpenAI認為GPT-5的某個版本在“寫作質量”上優于GPT-4.5。隨后他問道：“你覺得它更差嗎？”接著，用戶們立刻接二連三地回答說：“是的。”

“最強模型”GPT-5發布后評價褒貶不一，奧特曼回應