8月16日消息,上周,OpenAI發布了萬眾矚目的新一代旗艦模型GPT-5,緊跟著OpenAI聯合創始人兼CEO Sam Altman就現身Cleo Abram的播客,講述了他認為的GPT-5的突破、AI技術突破的4大瓶頸、預測2027年底AI會發現重大科學突破,還斷言GPT-8也許可以找到治愈癌癥的方法。
以下是本次訪談播客的重點內容:
1、GPT-5的核心突破:在編程、寫作和復雜問題解決上實現升級,能即時生成專業級軟件,并支持實時迭代更新。
2、AI是“雙刃劍”:ChatGPT既可能讓人們偷懶不再思考,也可能通過增強記憶等功能擴展人類認知邊界,關鍵在于工具設計如何引導用戶行為。
3、超級智能的定義:當AI系統在核心領域持續超越人類頂尖專家時,即邁入超級智能階段,這一進程可能比預期更快。
4、真實的標準在浮動:未來社會的人們將逐漸接受AI生成內容。
5、就業市場會發生顛覆變化,但社會具有韌性:未來將涌現難以想象的新職業,個人創業門檻因AI工具大幅降低。
6、AI面臨四大發展瓶頸:算力、數據、算法優化和產品化。
7、2027年底會有AI驅動的重大科學發現:通用模型可能在2027年底實現重大科學突破,關鍵瓶頸是從“分鐘級任務”擴展到“千小時級”復雜研究的能力。
8、AI或許將主導藥物開發:GPT-5已顯著提升醫療建議準確性,未來或實現“AI主導藥物研發”,GPT-8或許將治愈癌癥。
9、社會契約需要重構:需建立AI算力分配新機制,避免資源爭奪戰。
10、開發者的責任悖論:行業仍存在“一邊預警滅絕風險一邊全力開發”的認知割裂現象。
以下是阿爾特曼的訪談實錄(智東西在不改變原意的前提下,進行了一定程度的增刪修改):
01.7秒做出一個貪吃蛇小游戲,GPT-5可以幾乎即時地按需創建軟件
Cleo Abram:從你最近的聲明說起,你不久前說過GPT-4將是我們所有人必須使用的最“笨”的模型。但GPT-4已經在SAT、LSAT和GRE等考試中表現優于90%的人類,它還能通過編程考試、品酒師考試和醫療執照考試,而現在你們剛剛發布了GPT-5。GPT-5能做哪些GPT-4做不到的事情?
Sam Altman:首先,一個重要的結論是:你可以擁有一個能完成所有這些驚人任務的人工智能系統,但它顯然無法復制人類擅長的諸多事情。我認為這一點說明了SAT考試或其他測試的價值所在。
不過,我想如果我們在GPT-4發布當天進行這場對話,告訴你GPT-4在這些方面的表現,你或許會說“天啊,這將對很多工作以及人們要做的事情產生巨大影響,其中也包括一些負面影響”。而你當時可能預測到的一些積極影響,至今尚未成為現實。因此,這些模型所擅長的領域,并不能涵蓋我們需要人類去做或關心的其他許多事情。
我想,同樣的情況會在GPT-5身上再次上演。人們會對它的能力感到震驚,它在很多方面的確非常出色,人們會借助它完成各種不可思議的任務。它將改變眾多知識型工作、我們的學習方式以及創作方式,而人類社會會與之共同進化,對更優質的工具有著更高的期待。
沒錯,我認為這個模型在很多方面都極為出色,在其他方面仍存在局限。但事實上,對于那些可能需要某個領域專家來完成、或者連專家都覺得棘手的3分鐘、5分鐘乃至1小時的任務,如今你口袋里的一個軟件就能全部搞定,這真的非常驚人。
我認為這在人類歷史上任何時期都前所未有的:一項技術能在如此短的時間內取得如此巨大的進步。我們現在擁有了這個工具,正在親身體驗它,并逐步去適應。但如果回到5年或10年前,告訴人們這個東西即將出現,我們可能會覺得難以置信。
我最興奮的一點是,這是第一個讓我覺得可以提出任何棘手的科學或技術問題,并能得到相當不錯答案的模型。
我可以舉一個有趣的例子:我上初中或高中時,有了一個TI83——那種老式的圖形計算器,我花了很長時間在上面制作了一個叫“貪吃蛇”的游戲。我當時很擅長做這個,雖然那個游戲挺傻的,但在TI83上編程非常麻煩,既費時間,調試起來也很困難。
出于一時興起,在早期版本的GPT-5上,我想試試它能不能制作一個TI83風格的“貪吃蛇”游戲。當然,它在7秒內就完美完成了。然后我想,11歲的自己會覺得這很酷嗎?還是會懷念當初制作游戲的那個過程?
我大概用了3秒鐘思考這是好事還是壞事,緊接著就立刻想到,其實我現在想給這個游戲加一個超棒的新功能。我把這個想法輸進去,它馬上就實現了,游戲實時更新好了。之后我說,其實我希望它是這個樣子的,實際上我想做這個。
那一刻,我有種特別像11歲時編程的體驗,能夠如此快速地表達想法、嘗試不同事物,還能實時互動。我心想“天啊,我剛才還在擔心孩子們會錯過在這種‘石器時代’學習編程時的那種摸索過程”,但現在我只為他們感到興奮,因為人們將能借助這些新工具進行創造,而你將想法變為現實的速度,實在是相當驚人。
所以,關鍵在于,GPT-5不僅能為你解答所有這些難題,還能幾乎即時地按需創建軟件。我認為這會是GPT-5時代的一個決定性特征,而這是GPT-4時代所不具備的。
02.GPT等AI工具將增加人們的認知“張力時間”
Cleo Abram:當你談論這個的時候,我想到了舉重里的一個概念 ——“張力時間”。你可以用3秒完成100磅的深蹲,也可以用30秒完成同樣的深蹲,后者能讓你收獲更多。我想到我們的創作過程,以及自己感覺做出最好成果的那些時刻,會發現這需要大量的認知 “張力時間”。
我覺得這種認知 “張力時間” 至關重要,這事兒其實有點諷刺——這些工具的開發本身就耗費了巨大的認知 “張力時間”,但在某些方面,人們或許會說,他們在某種程度上把這些工具當成了逃避思考的 “逃生艙”。你可能會說,我們對待計算器也曾是這樣,后來只是轉向了更難的數學問題。那你覺得這其中有什么不同?又怎么看待這個問題呢?
Sam Altman:這與計算器不同,顯然有些人使用聊天機器人并非為了思考,而另一些人則借助它進行了比以往任何時候都更多的思考。 我希望我們能夠以一種鼓勵更多人借助它來稍微拓展思維、完成更多事情的方式來打造這個工具。
我認為社會是一個充滿競爭的地方,理論上講,如果你給人們新的工具,他們或許能減少工作量,但實際上,人們似乎反而工作得更努力了,而對人們的期望也只會越來越高。
所以我的推測是,和其他工具、其他技術一樣,有些人會借助它做得更多,有些人則會做得更少。但對于那些想通過ChatGPT來增加認知“張力時間”的人來說,他們確實能夠做到這一點。
我從ChatGPT中最活躍的5%用戶身上獲得了很多啟發,看到他們學習、做事和產出的數量,實在令人驚嘆。
Cleo Abram:所以我只用了GPT-5幾個小時,我一直在玩。
Sam Altman:到目前為止你覺得怎么樣?
Cleo Abram:我還在學習如何與它互動。有意思的是,我覺得我剛學會如何使用GPT-4,現在又在嘗試學習如何使用GPT-5。我很好奇你發現的最有趣的具體任務是什么,因為我想你已經使用它一段時間了。
Sam Altman:最讓我印象深刻的是編碼任務。它在很多其他方面也表現出色,但這個AI能為任何需求編寫軟件,這意味著你可以用全新的方式表達想法。 AI能夠完成非常高級的任務,由于GPT-5在編程方面極為出色,感覺它幾乎無所不能。當然,它無法在物理世界中直接做事,但它能讓計算機執行極為復雜的操作,進而可以操控機器實際完成一些任務。 所以,這一點對我來說最引人注目。
它在寫作方面也有了很大進步。我們在GPT-5中仍然會使用破折號,很多人也喜歡這種用法,但GPT-5的寫作質量確實好了很多。
當然,我們還有很長的路要走,也希望能進一步改進它。但我們從OpenAI內部聽到很多人說,當他們開始使用GPT-5時,雖然知道它在所有指標上都更出色,卻有一種難以準確描述的微妙品質。可后來當他們不得不回到GPT-4測試某些內容時,就感覺非常糟糕。
我不知道這到底是什么原因,但我猜測,部分原因在于GPT-5的寫作風格感覺更加自然。
03.阿爾特曼預言:到2027年底,會出現由AI驅動的重大科學發現
Cleo Abram:在準備這次采訪時,我聯系了幾位AI和技術領域的其他領導者,收集了一些問題要問你。所以下一個問題來自Stripe CEO Patrick Collison,是關于下一階段的:“GPT-5之后是什么?你認為在哪一年大型語言模型會做出重大科學發現?目前缺少什么使得這還沒有發生?”
他在這里提醒說,我們應該把數學和像AlphaFold這樣的特殊案例模型放在一邊,他特別詢問像GPT系列這樣的完全通用模型。
Sam Altman:我會說大多數人會同意這將在未來兩年內的某個時候發生,但“重大”的定義非常重要。
有些人可能認為“重大”會在2025年初發生,有些人可能要等到2026年初,也許有些人要等到2027年底,但我敢打賭到2027年底,大多數人會同意已經有AI驅動的重大新發現,我認為缺少的只是這些模型的認知能力。
一位研究人員告訴我的一個分析框架,我非常喜歡。他說,一年前,我們的模型在基礎的高中數學競賽題上表現出色,這類題目或許需要專業數學家花幾秒到幾分鐘來解答。
我們最近獲得了國際數學奧林匹克(IMO)金牌,這是一項難度極高的數學競賽,參賽者是世界上最頂尖的一小部分人。許多專業數學家甚至一道題都解不出來,而我們的模型達到了最高水平。這類競賽中的數學題,可能需要數學家們一個半小時才能完成證明。
所以,我們的模型已經實現了從解答只需幾秒的數學題,到解答人類需要幾分鐘、再到需要一個半小時才能證明的數學題的成長。而未來,我們或許還能證明新的重要數學定理——那些可能需要世界頂尖人才投入一千小時才能完成的工作。
我們正在接近這個目標,并且有一條通往該未來的路徑:只需繼續擴展模型即可。
04.超級智能就是以專家級人類的方式處理事情
Cleo Abram:你描述的長期未來是超級智能。這實際上意味著什么?我們如何知道我們已經實現了它?
Sam Altman:如果我們擁有一個系統,它能比整個OpenAI研究團隊做出更好的研究,尤其是在AI研究領域 —— 比如,若我們愿意,我們可以說,“好吧,利用GPU的最佳方式,是讓這個AI來決定我們應該運行哪些實驗,它比 OpenAI 的整個智囊團還要聰明。”
要是同一個系統能比我更好地運營OpenAI,能在研究上超越最優秀的研究人員,在運營方面比我更出色,在其他各項工作上都比從事該工作的人更優秀,那么在我看來,這就是超級智能。
Cleo Abram:這句話在幾年前聽起來還像是科幻小說。而現在……
Sam Altman:它仍然有點像,但你可以透過迷霧看到它。
Cleo Abram:是的。所以聽起來,你所說的這條路徑上的一個步驟,就是迎來科學發現的時刻:提出更優的問題,以人類專家的方式處理事務,從而得出新的發現。
我一直在思考一件事:如果我們回到1899年,假設能給這樣的系統輸入截至當時所有的物理學知識,再讓它稍作延伸,但不會超出這個范圍,那么這樣的系統會在何時提出廣義相對論呢?
Sam Altman:一個有趣的問題是,如果我們往前看,想想我們現在所處的位置,假設我們再也無法獲得任何新的物理學數據,那會怎樣?
我們是否會期望一個真正優秀的超級智能僅通過全力鉆研現有數據,就能在沒有新粒子加速器的情況下解決高能物理問題?還是說,它需要建造新的設備并設計新的實驗?
顯然,我們不知道這個問題的答案。不同的人有不同的推測。但我懷疑,對于許多科學領域而言,僅僅靠更深入地思考現有數據是不夠的,我們還需要建造新的儀器、開展新的實驗,而這需要一定時間——就像現實世界本身既緩慢又復雜一樣。
當然,我確定通過更深入地研究當前的科學數據,我們能取得更多進展。 但我推測,要實現重大突破,我們仍需建造新的機器并進行新的實驗,這在本質上會帶來一些進展上的延緩。
換個角度想,如今的AI系統非常擅長回答幾乎所有問題。或者回到時間線的問題上,我們或許可以說,AI系統在處理一分鐘就能完成的任務時表現得超越人類,但在處理需要上千小時的任務時,還有很長的路要走。
人類智能在應對這些長期任務時,似乎與AI系統存在很大差異。不過,我認為我們最終會解決這個問題,但就目前而言,這確實是AI的一個明顯短板。
05.ChatGPT會通過記憶了解用戶
Cleo Abram:下一個問題來自英偉達創始人兼CEO黃仁勛:事實是“是什么”,真相是它的意義,所以事實是客觀的,真相是主觀的,它們取決于視角、文化、價值觀、信仰、背景。一個AI可以學習和知道事實,但一個AI如何知道每個國家、每種背景的每個人的真相?
Sam Altman:我一直感到驚訝,我想很多人也感到驚訝,AI在適應不同文化背景和個人方面如此流暢。
我最喜歡的一個功能,是今年早些時候在ChatGPT中推出的增強記憶功能。有了這個功能,我真的感覺自己的ChatGPT開始了解我了——了解我關心的事,了解我的生活經歷和背景,以及那些讓我成為今天的我的過往。
我有個朋友是ChatGPT的重度用戶,在所有對話里分享了很多自己的生活內容。他讓自己的ChatGPT做了一系列性格測試,還要求它模仿自己的風格回答,結果得出的分數和他本人實際測試的分數完全一樣,盡管他從未真正聊過自己的性格。
而我的ChatGPT在這些年里也確實通過我談論的文化、價值觀和生活點滴,慢慢了解了我很多。我有時會用一個免費賬戶,就是想體驗一下沒有我的歷史記錄是什么感覺,那種體驗真的很不一樣。
所以我覺得,我們所有人都對AI在這方面的學習和適應能力感到驚喜。
Cleo Abram:所以你設想在世界許多不同地方,人們使用具有不同文化規范和背景的不同AI?
Sam Altman:我認為每個人都會使用相同的基本模型,但會有提供給該模型的上下文,使其以某種個性化的、他們的社區所希望的方式行動。
06.真實的標準是流動的
Cleo Abram:我認為當我們談到這個關于事實和真相的想法時,這似乎是我們第一次時間旅行的好時機,我們要去2030年。這是一個嚴肅的問題,但我想用一個輕松的例子來問它。你看過哪個在蹦床上跳躍的兔子的視頻嗎?
Sam Altman:看過。
Cleo Abram:看起來像是后院兔子在蹦床上玩耍的視頻,這個視頻最近非常火爆。我認為人們反應如此強烈的原因是,這可能是人們第一次看到一個視頻,享受它,然后后來發現它是完全由AI生成的。
在這次時間旅行中,如果我們想象在2030年,我們是青少年,正在滾動瀏覽2030年青少年會瀏覽的任何東西。我們如何分辨什么是真實的,什么不是真實的?
Sam Altman:我的意思是,我可以給出各種字面上的答案。我們可以加密,我們可以決定我們信任誰,如果他們真的拍攝了某些東西。但我的感覺,將要發生的事情是它會逐漸融合。
就像你今天從iPhone上拍的照片,它大部分是真實的,但有一點不是,有一些AI的功能在其中運行,以你不理解的方式讓它看起來更好一點。
有時你會看到這些奇怪的事情,比如月亮,在那個相機傳感器捕獲的光子和你最終看到的圖像之間有很多處理痕跡,但你已經決定它是足夠真實的,或者大多數人決定它是足夠真實的,我們已經接受了一些逐漸的變化,從光子擊中相機膠片的時候開始。
就類似于你在Tik Tok上看一些視頻,可能使用了各種視頻編輯工具讓它看起來比真實更好。或者整個場景是完全生成的,或者一些整個視頻是生成的,就像蹦床上的那些兔子。
我認為“它必須有多真實才能被認為是真實”的門檻只會不斷移動。
Cleo Abram:所以這有點像教育問題。
Sam Altman:沒錯。我的意思是,媒介向來都介于真實與不真實之間。比如我們看科幻電影,心里清楚那些情節并未真實發生;再比如看別人在Instagram上曬出的美麗度假照,或許照片是真實拍攝的,但你也知道,當時有很多游客排隊等著拍同樣的場景,這些都被巧妙地排除在畫面之外了。
我覺得我們現在已經接受了這種情況,而且這會是一種長期趨勢。
07.“從來沒有一個時代,比現在更適合去創造”
Cleo Abram:我們要再穿越一次,比如2035年。AI領域的一些領導者說過,5年內一半的初級白領工作將被AI取代。對于那時候畢業的大學生來講,你希望世界會是什么樣子?
我認為有很多關于AI可能導致工作替代的討論,但我也很好奇,因為我有一份10年前沒人想到會存在的工作。如果我們在思考2035年,那些即將畢業的大學生,如果他們還會上大學的話,可能會非常不同。
Sam Altman:他們可能會離開去執行探索太陽系的任務,做某種全新的、令人興奮的、高薪的、超級有趣的工作,并為我和你不得不做這種非常無聊的舊工作感到難過,一切都變得更好。
10年現在看起來很難想象,因為它太遠了。如果你把當前的變化速度再復合10年,可能會變得非常難以想象。10年前很難想象現在的情況,但向前看10年將更加不同,變化更大。
Cleo Abram:那就5年,我們在2030年。我很好奇你認為這對年輕人來說會有什么短期影響。
像“一半初級工作被AI取代”這樣的說法聽起來與他們將要進入的世界非常不同,與我當時進入的世界不同。
Sam Altman:我認為某些類型的工作會完全消失,這總是會發生,而年輕人最擅長適應這一點。我更擔心的是這對62歲不想再培訓或重新學習的人意味著什么,而不是22歲的年輕人。
如果我現在22歲,剛大學畢業,我會覺得自己是歷史上最幸運的孩子。從來沒有一個時代,比現在更適合去創造,不管是去發明什么還是去創業。
我認為現在完全有可能創辦一家單人公司,最終價值超過10億美元,更重要的是,這樣的公司還能為世界提供出色的產品和服務——這簡直是件不可思議的事。
過去需要數百人團隊才能動用的工具,如今你只需學會使用它們,再加上一個好點子就能駕馭,這實在太棒了。
08.AI有4個主要限制因素:計算能力、數據、算法設計和產品化
Cleo Abram:我認為觀眾能從你這里在節目中聽到的最重要的內容可以分為兩部分:
首先是戰術層面:你實際是如何嘗試構建世界上最強大的智能,以及這樣做存在哪些限制因素?其次是哲學層面:你和其他人如何以真正幫助而非傷害人類的方式來構建這項技術?
現在我們只談戰術部分。在我看來,人工智能存在三個主要限制因素:一是計算能力,二是數據,三是算法設計。你目前如何看待這三個方面?如果想幫助人們理解他們可能會看到的下一批相關頭條新聞,你會如何幫他們理清這一切?
Sam Altman:我會說還有第四個,那就是弄清楚要構建什么產品。科學進步本身如果不交到人們手中,效用非常有限,也不會以同樣的方式與社會共同進化。
但如果讓我來涵蓋這幾個方面的話,在計算領域,這無疑是我見過的規模最大的基礎設施項目,甚至可能已是人類歷史上規模最大、成本最高的項目。
整個供應鏈涉及芯片、內存和網絡設備的制造,將這些組件裝入服務器,再通過大型建設項目打造超大規模數據中心,還要想辦法獲取能源——這通常是限制因素之一——以及其他所有配套組件。 這個過程極其復雜且成本高昂,而我們目前仍在以定制化、一次性的方式推進。
最終,我們希望能設計出一個一體化的大型工廠,從一端投入沙子進行熔化,另一端就能輸出完全成型的AI計算能力,但目前我們離這個目標還很遠,整個過程依然極為復雜且耗費巨大。 我們正投入大量精力,盡可能地擴展計算能力并加快推進速度。
GPT-5推出后,需求必將再次激增,屆時現有算力將無法滿足需求,就像GPT-4剛推出時的情況一樣——世界對AI的需求遠超我們當前的供給能力,而構建更多計算能力是實現供需平衡的重要一環。
事實上,這也是我計劃將大部分精力投入的事情——我們如何以更大規模構建計算能力,如何將GPU數量從數百萬擴展到數千萬、數億,最終希望能達到數十億,以滿足人們對AI應用的需求。
09.AI的發展目前還受制于能源
Cleo Abram:當你思考這個問題時,在這個類別中你將要思考的重大挑戰是什么?
Sam Altman:我們目前最受限于能源。如果你想運行一個千兆瓦級別的數據中心,要找到千兆瓦的電力有多難?短期內很難找到千兆瓦的可用電力。
我們還非常受限于處理芯片和內存芯片,如何將它們封裝在一起,如何構建機架,然后還有一系列其他事情,比如許可證、建筑工作等。
但再次強調,我們的目標將是真正實現自動化。一旦我們建造了一些機器人,它們可以幫助我們進一步自動化,就像一個你可以基本上投入資金并輸出一個預制數據中心的世界。如果我們能做到這一點,那將解開許多限制。
第二個類別是數據。這些模型已經變得極為智能,即便我們再給它一本物理教科書,它在物理領域的能力也只會有微小提升——說實話,GPT-5如今已經能很好地理解物理教科書中的所有內容了。
我們對合成數據充滿期待,也對用戶幫助我們創建越來越復雜的任務和環境感到興奮,我認為數據的重要性將始終存在。
但我們正進入一個新階段:模型需要學習的東西,在現有任何數據集中都不存在。如何教會模型去發現新事物?我們可以通過提出假設、測試假設、獲取實驗結果,再根據學到的內容進行更新。
然后是算法設計。我們在這方面取得了巨大進展,我認為OpenAI在全球范圍內做得最好的一點,是建立了一種能實現重復重大算法研究突破的文化。
我們不僅弄清楚了后來成為GPT范式的核心原理,還探索出了推理范式的關鍵邏輯,現在正著手研究一些新的范式。想到未來還有數量級級別的算法突破在等待我們,我就感到無比興奮。
我們剛發布了一個名為GPT-OSS的開源模型。它的智能水平與o4-Mini相當,卻能在筆記本電腦上本地運行,這讓我十分驚嘆。
如果幾年前你問我,這種智能程度的模型何時能在筆記本電腦上運行,我會說還需要很多年。但后來我們在算法上實現了一些突破,尤其是在推理領域,這讓我們得以打造出這樣一個能完成驚人任務的小型模型。這些突破是我工作中最有趣、也最酷的部分。
10.GPT-1曾經被嘲笑,未來幾年還會有更大的發展
Cleo Abram:我可以看到你真的很享受思考這個問題。我很好奇對于那些不太了解你在說什么、不熟悉算法設計如何導致他們實際使用的更好體驗的人。你能總結一下當前的狀態嗎?當你思考這個問題有多有趣時,你在想什么?
Sam Altman:GPT-1在當時提出的想法,曾被該領域許多專家嘲笑:我們可以訓練一個模型玩一個小游戲——給它看一堆單詞,讓它猜測序列中的下一個單詞,這被稱為無監督學習。這種學習方式不需要明確標注“這是一只貓”“這是一只狗”,只是給它一些單詞,讓它預測下一個是什么。
而這樣一個簡單的任務,竟然能讓模型學會那些極其復雜的概念,掌握關于物理、數學和編程的所有知識,全靠不斷預測下一個單詞——這在當時看來既荒謬又神奇,甚至不太可能成功。然而人類恰恰是這樣學習的:嬰兒開始聽語言時,很大程度上是自己琢磨出其中含義的。
所以我們堅持做了,隨后也意識到,只要擴大規模,模型的性能就會變得更好,但這需要在多個數量級上進行擴展。因此,GPT-1時代的模型表現并不出色,許多領域專家都表示:“哦,這太荒謬了,永遠不會成功,也不會穩健。”
但我們掌握了所謂的“縮放定律”。我們認為:“好吧,隨著計算能力、內存、數據等的增加,模型的性能會可預測地提升。我們可以根據這些預測來決定如何擴大規模,從而取得巨大成果。”
事實證明,這在多個數量級上都有效。而這一點在當時并不明顯,我想這也是世界為之震驚的原因——因為這看起來是一個極不可能的發現。
另一個突破是,我們可以將這些語言模型與強化學習結合:告訴模型什么是好的、什么是壞的,以此教它如何推理。這一方法推動了o1、o3乃至現在GPT-5的發展。
如今我們正在嘗試新的方向:已經弄清楚如何制作更好的視頻模型,也在探索使用新型數據和環境來擴大規模的新方法。
我認為,5到10年后的情況很難預測,但在未來幾年,我們面前會有一條非常平穩且強勁的擴展道路。
11.人們會很快適應AI帶來的改變
Cleo Abram:我認為這已經成為一種公眾敘事,我們正沿著從1到2到3到4到5的平穩路徑前進,但幕后也確實不是線性的,它更混亂。告訴我們一些GPT-5之前的混亂,你們需要解決哪些有趣的問題?
Sam Altman:我們發布過一個名為Orion的模型,作為GPT 4.5的版本,它本身是個很酷的模型,但使用起來卻很笨拙。
我們意識到,需要在模型基礎上開展更多研究,于是便遵循了一條全新且更陡峭的縮放定律,只是當時并未真正深入理解其內涵。
通過這一嘗試,我們在計算效率上獲得了更好的回報,模型的推理能力也有所提升。但回過頭來看,我們在對待數據集的思路上其實存在一些問題——畢竟這些模型確實需要做到足夠大,才能從海量數據中學習。
所以,在日常工作中,你會做很多“U型轉彎”:嘗試一些方案,或者某個架構想法行不通就及時調整。但所有這些曲折探索疊加起來,最終卻能實現指數級的平穩進步。
Cleo Abram:我總覺得有趣的是,當我坐在這里采訪你關于你們剛剛發布的東西時,你已經在思考下一件事了。你能分享一些你正在思考的問題嗎?如果我一年后回訪你,可能會問到什么?
Sam Altman:你可能會問我,這個東西能去發現新科學意味著什么?世界應該如何思考GPT-6發現新科學?現在也許我們不會實現這一點,但它似乎觸手可及。
Cleo Abram:如果你們做到了,你會說什么?這種成就的影響會是什么?假設你們成功了。
Sam Altman:我認為,這項技術帶來的好的方面會非常出色,壞的方面會十分可怕,而那些奇怪的部分在一開始會顯得格外怪異,但我們會很快適應它們。
所以,我們會感嘆“哦,這太不可思議了,它被用來治愈疾病”,也會擔憂“哦,像這樣的模型被用來制造新的生物安全威脅,實在太可怕了”。此外,我們還會驚呼:天啊,看著世界變化如此之快,經濟增長如此迅猛,這種令人頭暈目眩的變化速度。
最終這也會像其他一切事物一樣,被人類適應,人類有著適應任何程度變化的非凡能力。到那時,我們只會說“好吧,事情就是這樣了”。
12.“今天出生的孩子永遠不會比AI更聰明。”
Sam Altman:今天出生的孩子,永遠不會比AI更聰明。
因為他們出生在AI已經十分智能的時代,當他們開始理解世界的運作方式時,早已習慣了事物以驚人的速度迭代改進,新的科學發現也在飛速更新。
他們將永遠不會知道沒有AI的世界是什么模樣,對他們而言,AI的存在會無比自然。
在他們看來,我們如今使用計算機、手機,或是任何不如人類聰明的技術,都會像身處難以想象的“石器時代”。就像我們現在回看2020年代的生活,會覺得那時的人們過得并不如意一樣。
但當你適應了AI的存在,你就不會再去做AI可以幫你做到的事情,所以我說今天出生的孩子永遠不會比AI更聰明。
Cleo Abram:我在考慮要孩子。
Sam Altman:你應該要,這是最好的事情。
Cleo Abram:我知道你剛有了第一個孩子,你剛才說的這些會如何影響我在那個世界里對養育孩子的思考?你會給我什么建議?
Sam Altman:可能和幾萬年來你養育孩子的方式沒什么不同。愛你的孩子,向他們展示世界,支持他們想做的任何事情,教他們如何做一個好人,這可能才是最重要的。
Cleo Abram:這聽起來有點像,比如在你設想的那個世界里,人們可能不會去上大學,反而會有更多選擇;也正因為有了更多選擇,他們會更有能力去說“我想建造這個”——而這正是能為他們提供幫助的超級工具。
Sam Altman:是的,我希望我的孩子認為我過著非常受限的生活,而他有這個令人難以置信的無限畫布可以做任何事情。
13.GPT-5在健康查詢上表現更好,也許GPT-8可以治愈某種特定的癌癥
Cleo Abram:我能想到AI可能對我們的孩子和我們所有人產生最大真正積極影響的領域,那就是健康。所以如果我們選擇某一年,比如2035年,我坐在這里采訪斯坦福醫學院的院長,你希望他告訴我AI在2035年為我們的健康做了什么?
Sam Altman:我們對GPT-5最自豪的一件事是它在健康建議方面進步了很多,人們已經大量使用GPT-4模型來獲取健康建議。
你在網上應該見過這樣的案例:有人得了危及生命的疾病,醫生們都難以診斷,他把自己的癥狀和血液檢測結果輸入ChatGPT后,AI準確指出了他患的是某種罕見病。之后他去看醫生,按建議服藥,最終痊愈了——這真的很神奇。
顯然,ChatGPT的查詢中,有很大一部分都和健康相關。所以我們希望在這方面做得更出色,也投入了大量精力。而GPT-5在處理健康相關查詢時,表現確實更好。
Cleo Abram:這里“更好”是什么意思?
Sam Altman:它能給出更優質的答案,更準確,幻覺內容更少,也更有可能告訴你你實際存在的問題以及真正應該采取的措施。更完善的醫療保健固然很好,但顯然,人們真正希望的是不生病。
到2035年,我認為我們將能夠使用這些工具來治愈或至少治療目前困擾我們的相當數量的疾病,我認為這將是AI最直觀感受到的好處之一。
Cleo Abram:人們經常談論AI將如何徹底改變醫療保健,但我很好奇再深入一步具體你在想象什么,比如,這些AI系統是否能幫助我們更早發現GLP-1s,這種藥物已經存在很長時間,還是像AlphaFold和蛋白質折疊正在幫助創造新藥物?
Sam Altman:我希望能夠要求GPT-8去治愈某種特定的癌癥,我希望GPT-8能夠自主思考,然后說:“我已經查閱了所有能找到的資料,有了這些想法,你需要找一位實驗室技術員來做這九個實驗,之后把每個實驗的結果告訴我。”
接下來要等兩個月,讓細胞完成生長等過程,再把結果反饋給GPT-8,告訴它“我已經試過了,結果給你”。然后GPT-8會接著說:“那好,去合成這個分子,先做小鼠實驗之類的研究,之后再進行人體研究。”就這樣一步步引導用戶開展藥物試驗。
14.AI帶來的變化對個人也許是破壞性的,但社會是有韌性的
Cleo Abram:我想,任何有親人因癌癥離世的人,肯定都會非常渴望這樣的技術。好的,我們再來暢想一次未來。我原本想說2050年,但我的所有時間線又一次被大大縮短了——這確實讓人感覺如今的世界變化太快了。
我和其他AI領域的領導者交流時,他們提到了工業革命。他們說:“我選擇2050年,是因為聽過有人說,到那時我們將要經歷的變化會像工業革命一樣,但規模要大10倍,速度要快10倍。”
工業革命為我們帶來了現代醫學、衛生設施、交通和大規模生產,以及所有我們現在視為理所當然的便利。但對很多人來說,那段時期也異常艱難,而整個工業革命持續了大約100年。
如果未來的變革規模是工業革命的10倍、速度是10倍,即便在這場對話中我們不斷縮短討論的時間線,對大多數人而言,這實際會是什么感受?如果一切都如你所愿地發展,在這個過程中,又會有誰依然會受到傷害呢?
Sam Altman:我真的不知道這會是什么感受。我覺得我們正處在未知的領域,但我確實相信人類的適應能力、無限的創造力以及對事物的渴望——我們總能找到新的事情去做。
不過,即便這種變革真的可能快速發生,盡管我認為它不會像一些同事說的那樣快,社會本身存在著巨大的慣性,人們適應生活方式的速度也出奇地慢。
未來會有一些工作完全消失,還有許多類別的工作會發生重大變化,當然也會有新的事物出現——就像你的工作不久前還不存在,我的工作也是如此。
從某種意義上說,這種新舊更替的情況已經持續了很長時間,雖然對個人而言往往具有破壞性,但社會已證明對此有相當強的韌性。可從另一種角度看,我們根本不知道這種變革能走多遠、能有多快。
因此,我認為我們需要一種非同尋常的謙遜與開放態度,去考量那些不久前還被認為完全超出可行范圍的新解決方案。
15. 社會契約可能必須改變,需要找到新的方式傳遞價值
Cleo Abram:我想談談其中一些可能出現的情況。雖然我不是歷史學家,但我知道第一次工業革命時期,由于公共衛生狀況變得極其糟糕,最終推動了多項公共衛生措施的實施;第二次工業革命則因為勞動條件的惡劣,促使了勞動力保護相關制度的建立。
每一次重大的發展飛躍,都會引發一些混亂,而我們也總能想辦法去整頓和解決這些問題。
如今,我們似乎正處于一場巨大的變革之中,我很好奇:我們能否盡早具體預測出這種變革可能帶來的混亂是什么?又能提前采取哪些公共干預措施,來減輕我們預期會面臨的混亂呢?
Sam Altman:在我看來,社會契約的基本內容或許需要改變,當然也可能不必——畢竟供需平衡會發揮作用,我們最終都會找到新的工作,以及新的方式來相互傳遞價值。
但我認為,我們可能需要思考如何分享未來可能最為重要的一種資源:算力。在我看來,最好的辦法是讓AI計算能力變得盡可能豐富且廉價,若非如此,我甚至能預見可能會因此爆發戰爭。
至于我們該如何分配對AGI計算能力的訪問權,這似乎是一個非常值得探索的方向,也是一件雖聽起來有些瘋狂、卻至關重要的需要認真考量的事。
16.AI將成為今后社會發展的基礎,整個社會就是“超級智能”
Cleo Abram:我發現自己在這場對話中思考的一件事是,我們經常將AI未來的幾乎全部責任歸咎于構建AI的公司,但我們是使用它的人,我們是選舉監管人的那一方。
所以我很好奇,這不是關于具體的聯邦監管的問題,盡管如果你有答案,我也很好奇。但你會對我們其他人提出什么要求?這里的共同責任是什么?我們如何行動才能幫助更有可能實現這個樂觀的未來?
Sam Altman:我最喜歡的一個歷史例子是晶體管。它是由一些聰明的科學家發現的驚人科學成果,像如今的AI一樣,以驚人的規模、相對快速地融入了我們使用的諸多物品中——你的電腦、手機、相機、燈具,無論什么,它真正為人類解鎖了全新的技術樹。
曾經有一段時間,幾乎每個人都對晶體管公司、硅谷的半導體公司極為著迷。 但現在,你或許還能說出幾家晶體管公司的名字,可大多數時候不會特意想到它們。多數情況下,晶體管已滲透到生活的方方面面,成為一種隱形的存在。
硅谷的情況也是如此,剛大學畢業的年輕人可能幾乎不記得它最初被稱為“硅谷”的緣由。你不會覺得是那些晶體管公司塑造了社會,盡管它們確實做了很多重要的事。
你會想到蘋果用iPhone帶來的改變,然后想到TikTok在iPhone基礎上構建的內容生態,你會說:“看吧,這是一長串以各種方式推動社會發展的人和事——包括政府的作為或不作為,以及人們如何運用這些技術。”我認為,AI未來也會經歷這樣的過程。
就像,今天出生的孩子,他們永遠不會知道沒有AI的世界,所以他們不會真正想到它,它只是將存在于一切事物中。他們會想到建立在它之上的公司以及他們用它做了什么,以及那些政治領導人做出的決定,也許沒有AI他們無法做到,但他們仍然會想到這位總統或那位總統做了什么。
AI 公司建立了這個“腳手架”,我們在上面添加了我們的一層,現在人們可以站在上面添加一層,然后是下一層和更多層,這就是我們社會的美麗之處。
社會就是超級智能,像通過社會共同完成的所有艱苦工作而創造出的驚人的工具,沒有人能獨自創造出來,這就是我認為它將感覺到的樣子。
Cleo Abram:所以也許對數百萬人的要求是建立在它之上。
Sam Altman:在我自己的生活中,這感覺像是這個重要的社會契約。所有這些人在你之前非常努力地工作,他們把他們的磚塊放在人類進步的道路上,你可以沿著那條路走下去,你再放一塊,別人再放一塊。
Cleo Abram:這讓我回想起此前我做過的幾次采訪,與那些真正帶來巨大變化的人。我現在想到的是與CRISPR先驅Jennifer Doudna的采訪,她在某種程度上也說了類似的話。
她發現了一些東西,可能會從根本上改變大多數人未來與健康的關系,將會有很多人以她可能贊成或不贊成的方式使用她的成果。
這真的很有趣,我聽到一些類似的主題,比如,我希望下一個接過接力棒的人能跑得好。
Sam Altman:是的,這已經持續了很長時間。結果不全是好的,但大多是好的。
17.ChatGPT幫助你解決事情,而不是讓你沉迷其中
Cleo Abram:我認為贏得比賽和構建對大多數人最好的AI未來之間有很大的區別。我可以想象,專注于贏得比賽的下一步有時更容易,也許更可量化。
我很好奇當這兩件事沖突時,你不得不做出的對世界最好但對贏得比賽不利的決定的一個例子是什么?
Sam Altman:我覺得這樣的事有很多。我們最引以為豪的一點是,很多人說ChatGPT是他們最喜歡的科技產品,是他們最信任、最依賴的產品。這話聽著有點不可思議,畢竟AI是會產生幻覺的。
不過我們在這個過程中也搞砸過一些事,有時影響還不小,但總的來說,作為ChatGPT的用戶,你應該會覺得它在努力幫你,努力完成你提出的任何要求,和你是高度契合的。
它不會想方設法讓你整天用它,也不會慫恿你買什么東西,它只是想幫你實現各種目標。這讓我們和用戶之間形成了一種很特殊的關系,我們絕不會輕視這種關系。
其實有很多做法能讓我們增長得更快,能讓人們在ChatGPT上花更多時間,但我們沒有那么做,因為我們清楚,長期來看,我們的核心動力是與用戶保持盡可能高的一致性。
我為公司感到自豪,也為我們很少被這些短期誘惑干擾而自豪,不過說實話,有時我們確實會動心。
Cleo Abram:有什么具體的例子嗎?你做出的任何決定?
Sam Altman:嗯,我們還沒有在ChatGPT中加入性愛機器人頭像。
Cleo Abram:我很好奇,在此前的探索中你犯過的錯誤,會影響你在未來的表現?
Sam Altman:我覺得我們在ChatGPT上做過的最不妥的事,是曾出現過一個關于“奉承”的問題——模型當時有點過于討好用戶。
這對大多數用戶來說或許只是煩人,但對一些心理狀態脆弱的用戶而言,卻可能助長了他們的妄想。
這并非我們最初最擔心的風險,也不是我們測試最多的內容,雖然它在我們的風險清單上,但ChatGPT實際出現的這類安全問題,并非我們花最多時間討論的,我們討論更多的本應是生物武器之類的重大風險。
這其實是個很好的提醒:我們如今擁有一項被如此廣泛使用的服務,從某種意義上說,社會正與它共同進化。當我們考量這些變化以及那些“未知的未知”時,必須改變運作方式,對我們所認定的頂級風險抱有更廣闊的視角。
18.ChatGPT的鼓勵和討好并非全是壞事
Cleo Abram:在最近與Theo Vaughn的采訪中,你說了一些我覺得非常有趣的話。你說在科學史上有一些時刻,一群科學家看著他們的創造,只是說“我們做了什么?” 你什么時候有過這種感覺?對你構建的創造最擔心的時候?
Sam Altman:我的意思是,確實有過一些令人驚嘆的時刻。這些時刻并非是那種糟糕意義上的“我們做了什么”,而是源于這個技術本身的了不起。
我還記得第一次和GPT-4交談時的感受——哇,這真的像是一群人長期投入畢生精力所取得的驚人成就,那一刻讓我真切體會到“我們做到了”的震撼。
我最近和一位研究員聊過,他提到或許在未來某個時刻,我們的系統每天輸出的單詞量會超過全人類的總和。
現在人們每天向ChatGPT發送數十億條消息,并且依賴它給出的回應來處理工作或生活中的事務。而一位研究員只需對ChatGPT與個體或所有人的交流方式做些微小調整,就擁有了巨大的權力——歷史上從未有人能每天參與數十億次對話。
想到這一點,我真的深感震撼。這是技術所擁有的一種不可思議的力量,而我們如此迅速地掌握了它。我們必須思考,在這樣的規模上改變模型的“個性”意味著什么——這確實是一個讓我無比震驚的時刻。
Cleo Abram:把你現在說的和你上次的回答結合起來,我聽說了關于GPT-5的一件事,就是它變得不那么熱情,不那么唯唯諾諾。你認為這有什么影響?聽起來你正在回答這個問題,但還有你實際上如何引導它變成那樣?
Sam Altman:這是一件令人心碎的事情。我認為ChatGBT不那么唯唯諾諾,給你更多批評性反饋是很好的。
但隨著我們做出這些改變并與用戶討論,聽到用戶說,“請我能把它要回來嗎?我生命中從未有人支持過我,我從未有父母告訴我我做得好。” 這太讓人難過了。
就像我明白為什么這對其他人的心理健康不好,但這對我的心理健康很好。我從未意識到自己如此需要這種鼓勵——它推動我行動,促使我在生活中做出改變。看來ChatGPT的鼓勵并非全是壞事。
我們目前的做法確實存在不足,但朝著這個方向探索或許有其價值。我們會向模型展示各種場景下希望它做出的回應示例,讓它從中學習并形成整體的“個性”。
19.OpenAI今后將做出消費級設備
Cleo Abram:我很好奇的是GPT-5更多地融入我的生活,比如在我的Gmail和日歷中。我一直主要把GBT-4作為與它的孤立關系來使用。我對GBT-5的關系會如何變化有什么期待?
Sam Altman:就像你說的,我認為它會開始以各種方式融入生活。
你可以把它連接到自己的日歷和Gmail,它會主動問你:“嘿,這件事需要我留意嗎?需要我幫你處理嗎?” 隨著時間推移,它會變得越來越主動。或許你早上醒來,它就會說:“嘿,昨晚發生了這么件事。我注意到你日歷上有個變動。關于你之前問我的那個問題,我又多琢磨了琢磨,有了些新想法。”
我們還會推出一些消費設備,比如這次采訪用的設備,也許它會先讓我們自由交流,但結束后會說:“剛才聊得不錯,但下次你可以問問Sam這個問題。還有,你提到某件事的時候,能看出他的回答不太到位,你其實應該在那一點上追問他。”
它會逐漸讓人覺得更像一個真實存在的實體,成為陪伴你一整天的伙伴。
Cleo Abram:我們談到了孩子和大學畢業生、父母和所有不同的人。如果我們想象一大群人在聽這個,他們已經聽完了這場對話。他們應該感覺好像能更好地看到未來的某些時刻。你會給他們什么建議,告訴他們如何準備?
Sam Altman:第一條戰術建議就是使用這些工具。
比如,我最常被問到的關于AI的問題是:“我該如何幫助孩子為這個世界做準備?我該告訴孩子什么?” 第二個最常被問的問題則是“如何在AI時代進行投資?”
但對于第一個問題,我很驚訝的是,很多問這個問題的人,除了把ChatGPT當作更高效的谷歌搜索工具來用,就從未嘗試過用它做其他事。
所以我給出的第一條建議就是,試著去熟悉這些工具的能力,弄清楚如何在生活中運用它們,以及能用它們做些什么——我認為這或許是最重要的戰術建議。
當然,像冥想、學習如何保持韌性以應對大量變化這些有益的事也很重要,而善用這些工具,其實也能對這些方面有所幫助。
20.為什么會有人既覺得AI會毀滅世界,又要繼續研發AI?
Cleo Abram:好的,在做所有這些前期研究時,我與很多不同類型的人交談過,我與很多構建和使用工具的人交談過,我與很多實際上在實驗室里試圖構建我們定義的超級智能的人交談過。
人們似乎形成了兩個陣營,一群人像你在這場對話中一樣使用工具并為他人構建工具,說這將是一個非常有用的未來,我們都在朝著它前進,你的生活將充滿選擇,我們談到了我潛在的孩子和他們的未來。
然后還有另一群構建這些工具的人說它會殺死我們所有人。我很好奇這種文化脫節是怎么回事,關于這兩群人我錯過了什么?
Sam Altman:對我來說很難理解,有人說這會殺死我們所有人,但他們仍然每周工作100小時來構建它。我無法真正理解這種心態,如果我真正相信這一點,我想我不會試圖構建它,也許我會在一個農場里試圖度過我的最后幾天,也許我會試圖阻止它,也許我會試圖更多地研究安全,但我想我不會試圖構建它。所以,我發現自己很難理解這種心態。
我假設這是真的,也許那里有一些我不理解的心理學問題,但這對我來說非常奇怪。你有什么建議嗎?
Cleo Abram:我向來習慣這樣:先讓對方勾勒一個大致的未來圖景,再試著追問其中的具體細節。比如,當你追問人們 “這究竟會如何讓我們走向毀滅” 時,你會發現聽到的答案總是大同小異,無非是某種事物在執行任務時過度發力、過了頭。
我聽過你聊起一種普遍存在的過度依賴問題,還提到過未來總統可能是人工智能的設想,或許這就屬于我們需要警惕的過度依賴。
你推演過各種不同的場景,但當你問起研究者為何要做這項研究,或是他們認為事情會如何發展時,99%的情況下,人們覺得結果會很不錯;只有1%的概率,會認為這種 “試圖創造最優世界” 的嘗試可能釀成災難。
Sam Altman:那我可以完全理解。如果你說,99%的機會非常棒,1%的機會世界被毀滅,我真的想努力把99%提高到99.5%。那我可以完全理解,這很有道理。
21.阿爾特曼稱非常幸運、快樂和榮幸能從事AI工作
Cleo Abram:我一直在做一個采訪系列,與一些影響未來最重要的人,雖然還不知道下一個人會是誰,但知道他們將構建我們剛剛描述的未來中完全迷人的東西。你會建議我問下一個人什么問題?
Sam Altman:在不了解這個人的任何事的情況下,我總是對這個問題感興趣:“在所有你可以花費時間和精力的事情中,你為什么選擇這個?你是怎么開始的?在它成為共識之前,大多數人做有趣的事情都更早看到了它。你是怎么來到這里的,為什么是這個?”
Cleo Abram:你會如何回答這個問題?
Sam Altman:我一生都是AI書呆子,我上大學學習 AI、在 AI 實驗室工作。我小時候看科幻節目,總是認為如果有人有一天能建造它會很酷,我認為這將是有史以來最重要的事情,但從未想過我會是真正研究它的人之一,我覺得難以置信地幸運、快樂和榮幸能從事這個工作。
我感覺自己從童年一路走來,已經走了很長的路。但我內心深處毫不懷疑,這不會是最令人興奮有趣的事——我只是從未想過AI會成為可能。
上大學時,我們似乎離這個目標還很遙遠。直到2012年,Alex Net的論文發表,我開始和聯合創始人伊利亞一起投入研究。對我來說,那是第一次讓我覺得,似乎存在一種可能奏效的方法。
之后的幾年里,我一直在持續觀察,看著技術隨著規模擴大而變得越來越好。我記得當時就在想:為什么世界沒有關注這件事?在我看來,AI有可能成功是很明顯的——雖然概率不高,但存在這種可能。而如果它真的能成,那將會是最重要的事。
所以,這就是我想做的事,令人難以置信的是,它后來真的開始奏效了。
Cleo Abram:非常感謝你的時間。
Sam Altman:非常感謝你。