北京公司網(wǎng)站建設(shè)一條龍全包(chatgpt)chatgpt官網(wǎng),
過去的一年,ChatGPT成為維基百科上受訪最多的詞條,是獲取上億用戶最快的消費者產(chǎn)品它開啟了人工智能的新時代,產(chǎn)品功能快速迭代升級,一步一步都具有標(biāo)志性意義那么,在OpenAI內(nèi)部,是一個什么樣的團隊在建造這個產(chǎn)品?什么樣的文化,讓ChatGPT團隊能在如此激烈的競爭中保持領(lǐng)先?。
像OpenAI所有的員工一樣,Evan Morikawa在Linkedin上的頭銜是OpenAI的技術(shù)員工成員(Member of Technical Staff),他實際上負(fù)責(zé)的應(yīng)用工程(Applied Engineering)
團隊,構(gòu)建了ChatGPT產(chǎn)品需要了解的是,ChatGPT只是OpenAI的產(chǎn)品之一——OpenAI還推出了諸如DALL·E 3(圖像生成)、GPT-4(大型語言模型)和OpenAI API(供開發(fā)者和公司將AI整合到業(yè)務(wù)中使用)。
等產(chǎn)品打造和擴展這些產(chǎn)品的工程、產(chǎn)品和設(shè)計部門被稱為“Applied”研究訓(xùn)練大型模型,然后Applied在這些模型上構(gòu)建產(chǎn)品,如ChatGPT和APIApplied小組在公司內(nèi)成立較晚OpenAI成立于2015年,而Applied則始于2020年夏季。
當(dāng)時OpenAI剛剛完成對GPT-3的訓(xùn)練,成立這個團隊是為了構(gòu)建和擴展GPT-3的API就在OpenAI發(fā)動董事會“政變”事件的前夕,他接受了科技博主 Gergely Orosz 的采訪,介紹了OpenAI的文化。
下面是經(jīng)過整理的他的自述:我于2020年10月加入OpenAI那時OpenAI總共有大約150名員工,而Applied團隊只有幾個人當(dāng)時幾乎每個在OpenAI工作的人都是研究員我沒有機器學(xué)習(xí)博士學(xué)位,但對于OpenAI正在構(gòu)建API和工程團隊感到興奮。
在OpenAI,我最初單獨為GPT-3 API編寫代碼幾個月后,也就是2021年1月,我開始管理Applied Engineering團隊那時,我的團隊大約有6個人時至今日,兩年半過去了,Applied Engineering團隊已經(jīng)發(fā)展到了130名工程師,我管理其中的一半左右。
還有20個人是項目經(jīng)理和設(shè)計師,整個Applied團隊大約有150人從2020年10月起,OpenAI的規(guī)模已經(jīng)從大約150人增長到今天的約700人(最近達(dá)到了近800人——編者)而且我們還在繼續(xù)招聘OpenAI是如何以如此之快的速度推出新功能的呢?我感覺每隔幾個月就會推出一個重大的新功能。
對于一個外部人來說,僅僅跟上就已經(jīng)很難了!一方面,這絕對是我職業(yè)生涯中速度最快的地方;另一方面,這并不是魔法我認(rèn)為關(guān)鍵有如下幾點:將ChatGPT設(shè)置為像一個小型獨立創(chuàng)業(yè)公司一樣運營與研究的緊密集成長期的產(chǎn)品和研究思考
解耦和漸進的發(fā)布高人才密度好習(xí)慣的日積月累像小型獨立創(chuàng)業(yè)公司一樣運營ChatGPT看起來、感覺起來,以及行為上都像僅一年的初創(chuàng)公司,但OpenAI本身已經(jīng)成立了將近8年OpenAI內(nèi)的Applied組成立了3年。
ChatGPT是Applied內(nèi)的一個產(chǎn)品團隊,大約一年前開始的我和其他Applied領(lǐng)導(dǎo)層希望,ChatGPT團隊感覺就像是他們自己的獨立創(chuàng)業(yè)公司在實踐中,這個目標(biāo)隨著團隊的成長而發(fā)生變化在2022年夏季,我們開始開發(fā)后來成為ChatGPT的產(chǎn)品。
那時,Applied有大約30名工程師,幾個PM和設(shè)計師,并在運營如下產(chǎn)品:GPT-3和Codex的API模型的微調(diào)嵌入式APIDALL·E 2所有這些產(chǎn)品都使用相同的代碼庫,運行在相同的計算集群上,并使用相同的構(gòu)建管道。
在Applied內(nèi),我們按功能組建,工程師是一個統(tǒng)一的團隊這些都隨著ChatGPT而改變一些Applied的工程師、設(shè)計師、研究人員和布洛克曼(OpenAI總裁)一起找了一個房間,開始迅速迭代產(chǎn)品想法我們?yōu)檫@個初創(chuàng)的ChatGPT小組提供了一個獨立的代碼庫和一個新的算力集群。
開發(fā)環(huán)境看起來像創(chuàng)業(yè)公司或個人項目的初期階段我們給予這個小小的ChatGPT子團隊的目標(biāo)是創(chuàng)造一個處于早期階段的氛圍,朝著產(chǎn)品適應(yīng)市場(PMF)不斷迭代我們需要形成節(jié)奏、速度和自主性團隊的每個成員都在現(xiàn)場工作,我們重新安排了座位,讓人們相互靠近。
隨著ChatGPT團隊的壯大,我們確保其垂直整合這意味著工程、產(chǎn)品、設(shè)計和關(guān)鍵研究人員始終緊密合作在2023年5月,Peter Deng加入,領(lǐng)導(dǎo)ChatGPT工程、產(chǎn)品和設(shè)計,形成了一個緊密的團隊我們之所以知道要這樣設(shè)置ChatGPT團隊,是因為在Applied團隊開始開發(fā)第一個OpenAI API版本時,我們已經(jīng)創(chuàng)建了類似的結(jié)構(gòu)。
三年前,我們也是從一小撮工程師開始,有一個全新的代碼庫、新的集群和綠地開發(fā)我們也像初創(chuàng)公司一樣運作,尋找產(chǎn)品市場適應(yīng)這種“分形創(chuàng)業(yè)公司”的方法,感覺對任何新產(chǎn)品類別都是個好模式我預(yù)計對我們正在考慮的新的想法,將繼續(xù)用這一模式應(yīng)迅速迭代。
與研究的緊密集成在大多數(shù)科技公司中,工程團隊的經(jīng)典三駕馬車通常被稱為EPD:工程產(chǎn)品設(shè)計這些團隊通常彼此密切合作,跨功能團隊通常包括工程、產(chǎn)品和設(shè)計的成員研究與產(chǎn)品團隊的集成至關(guān)重要與“EPD”相比,我更喜歡將我們在工程中緊密合作的團隊稱為“DERP”:。
設(shè)計工程研究產(chǎn)品在OpenAI,許多產(chǎn)品問題實際上是研究問題例如,考慮這些問題,它們可能被視為功能請求:ChatGPT如何生成更簡潔的輸出?ChatGPT如何提供更準(zhǔn)確的答案?ChatGPT如何連接到其他數(shù)據(jù)源?。
盡管這些問題可能感覺像是產(chǎn)品問題,但實際上它們在很大程度上依賴于研究例如:如何調(diào)整或微調(diào)底層模型以實現(xiàn)期望的目標(biāo),我們可以采取哪些其他方法來實現(xiàn)這些結(jié)果?研究人員與產(chǎn)品工程的整合并非總是顯而易見的在OpenAI,研究和應(yīng)用是獨立的組織結(jié)構(gòu)。
在研究組織內(nèi),有各種不同的研究團隊,例如:預(yù)訓(xùn)練團隊:該團隊訓(xùn)練GPT-4模型;后訓(xùn)練團隊:他們對GPT-4進行微調(diào);超級對齊團隊:對齊GPT-4;多模態(tài)團隊:使GPT-4能夠看、聽和說;……還有其他幾個。
研究人員往往具有重要的學(xué)術(shù)或行業(yè)背景他們閱讀大量學(xué)術(shù)論文以保持前沿狀態(tài)他們還采用各種想法并運行大量實驗來改進我們的模型他們都是親自動手的;研究人員完成大量工程工作并編寫大量代碼!我們本可以選擇一種方法,把模型被“扔過墻”,即研究訓(xùn)練一個模型,然后交給Applied部門推廣。
然而,我們總是希望避免一種文化,即研究僅專注于進行實驗,而產(chǎn)品則只想商業(yè)化和賺錢為了防止這種情況發(fā)生,像ChatGPT這樣的產(chǎn)品團隊由軟件工程師、設(shè)計師、產(chǎn)品經(jīng)理和研究人員共同工作在ChatGPT的情況下,大多數(shù)研究人員來自我們稱之為Post Training。
(訓(xùn)練后)的研究團隊這些研究人員是最新微調(diào)技術(shù)和強化學(xué)習(xí)(RL)方法(如Proximal Policy OptimizationOpenAI提出的一種強化學(xué)習(xí)算法——編者)的專家這些技術(shù)對于不斷改進ChatGPT中的底層模型是必不可少的。
由于這些研究人員是產(chǎn)品團隊的一部分,并且正在進行自己的A/B實驗,因此研究與工程之間的反饋循環(huán)非常緊密與研究的緊密結(jié)合,是我們?yōu)槭裁茨軌蛉绱丝焖俚赝瞥鲂孪敕ǖ脑蛭覀兪侨绾卧谌绱硕痰臅r間內(nèi)推出瀏覽、代碼執(zhí)行、插件等ChatGPT功能的呢?這是因為緊密的整合!所有這些都始于研究思想,并且由于進行研究的團隊與工程團隊緊密結(jié)合,它們迅速部署到生產(chǎn)環(huán)境!此外,在研究和應(yīng)用中都有一種擺弄和原型設(shè)計的文化。
許多這些原型非常迅速地進入了實際產(chǎn)品中長期產(chǎn)品和研究思維OpenAI的使命是確保通用人工智能(AGI)使全人類受益我們所說的AGI,指的是在大多數(shù)經(jīng)濟上有價值的工作中超越人類的高度自治系統(tǒng)這一使命在OpenAI章程文件中有所體現(xiàn)。
章程文件更詳細(xì)地反映了OpenAI的戰(zhàn)略,例如詳細(xì)說明了對長期安全性的關(guān)注我們的章程和使命幾乎在每次全員會議上都會被提及在具體產(chǎn)品討論中,我們總是善于用這種說法提出我們的使命,“這些選項中哪一個感覺更接近AGI”。
它不僅有助于決定要構(gòu)建什么,也決定了很多不構(gòu)建的東西,因為專注于使命清晰的焦點總是推動速度的因素我確信我們的使命有助于保持這種關(guān)注,并為許多新想法鋪平了道路另一件非常有用的事情,是我們組織研究倡議:并行的研究計劃有助于我們更快地推出產(chǎn)品。
研究團隊不斷思考創(chuàng)建更強大模型的統(tǒng)一方式例如,多模態(tài)一直是一個與文本模型并行的研究研究還要確保各種并行的工作不是零和的,也不是與其他研究無關(guān)的我們不希望構(gòu)建大量的小模型;我們希望朝著通用人工智能邁進并行的多個研究計劃加速了我們的推進。
例如,我們能夠在相對短的時間內(nèi)推出了GPT-4、GPT-4V、文本到語音和語音到文本這在很大程度上要歸功于研究團隊內(nèi)部的并行努力非耦合和漸進式發(fā)布我們盡力避免采用“一次性全部”的發(fā)布模式這不僅因為早期和經(jīng)常發(fā)布是一種經(jīng)過驗證的產(chǎn)品策略,也是因為漸進式發(fā)布是我們安全策略的基本原則之一。
在公司內(nèi)部,AI安全是一個重要話題安全問題在我們的工作中非常核心,以至于安全顧慮可以超越發(fā)布和增長目標(biāo)我們的核心原則之一是逐漸從現(xiàn)實世界中學(xué)習(xí)關(guān)于這個主題,我們在《我們的AI安全方法》中有更多的文檔我們在安全方面采取了多種方法,比如:
紅隊測試:由一組安全專家組成的“紅隊”扮演攻擊者的角色,測試和評估安全措施的有效性;對齊研究:研究和開發(fā)確保AI系統(tǒng)以符合人類價值觀行事,不會不經(jīng)意地造成傷害的技術(shù);政策工作:加強AI技術(shù)和服務(wù)的安全性和信任性,總結(jié)治理實踐,與全球各地的政策制定者合作。
除了這些工作,我們還觀察到,漸進地、有控制地與現(xiàn)實世界接觸是識別和解決安全問題的最重要方法之一我們的產(chǎn)品逐漸推出,并進行監(jiān)控我們的產(chǎn)品發(fā)布必須經(jīng)過這樣一個階段,與精選的API客戶進行監(jiān)控試驗,然后進行漸進式的推廣。
也許有趣的是,盡管外界看到ChatGPT突然爆紅,但在OpenAI內(nèi)部,我們花了多年時間在更受控制的環(huán)境中熟悉這些模型!ChatGPT的發(fā)布本意是收集有關(guān)對話模型的反饋,沒想到這一版本引爆了一輪病毒性的媒體傳播。
高人才密度OpenAI的CEO Sam Altman一直非常注重高才密度所謂的“高才密度”是指平均技能水平和績效遠(yuǎn)遠(yuǎn)超過大多數(shù)公司的標(biāo)準(zhǔn),因此在OpenAI,卓越就是工作的標(biāo)準(zhǔn)高級團隊可以非??焖俚赝瞥霎a(chǎn)品。
由于專注于高才密度,我們在Applied內(nèi)部招聘時故意偏向招聘資深的工程師我們還盡量保持團隊的規(guī)模較小事實證明,小規(guī)模的高級團隊可以非常快速地推出產(chǎn)品!這樣就更容易授權(quán)和信任他們作出正確的決策我對自發(fā)決策很有信心,通常認(rèn)為它們會基本指向正確的方向。
我們進行內(nèi)部審查并記錄我們的想法,但并非是一種強制性的方式在招聘Applied團隊時,將Y Combinator創(chuàng)始人類型與在大型科技公司大型項目開發(fā)經(jīng)驗的人融合在一起非常成功我們需要同時滿足兩個方面的需求:。
在ChatGPT中進行敏捷的早期迭代前Y Combinator創(chuàng)始人在最早期階段很善于折騰,在這方面表現(xiàn)出色大規(guī)模擴展我們復(fù)雜分布式系統(tǒng)的工程技能曾經(jīng)深入?yún)⑴c大規(guī)模系統(tǒng)擴展的工程師在這方面經(jīng)驗豐富我們并不害怕“買”而不是“造”。
了解創(chuàng)業(yè)生態(tài)系統(tǒng)最新工具的人是必不可少的,但也要了解在我們的用例中這些工具何時可能失效在可能的情況下,購買這些工具而不是自己建造它們,有助于保持團隊的規(guī)模小而靈活然而,我們不能總是依賴購買或使用現(xiàn)有工具。
我們認(rèn)為對業(yè)務(wù)至關(guān)重要的任何事情,我們都會投資自己此外,隨著規(guī)模的擴大,我們可能會超越一些工具,有些人經(jīng)歷過這些痛苦,這些經(jīng)驗對我們來說至關(guān)重要謙卑感是我們普遍使用“技術(shù)人員成員”(member of technical staff)
頭銜的主要原因之一在OpenAI,每個人都有“技術(shù)人員成員”的頭銜,不管他們的經(jīng)驗或?qū)I(yè)知識如何這有幾個原因我們這里沒有空間容忍不善于團隊合作的“獨行俠”,我們也不想吸引那些追求構(gòu)建不必要復(fù)雜的東西來獲得下一個花哨頭銜的人。
我們希望每個人都能良好溝通,為我們的使命作出最好的決策只要我們能夠堅守這一點,我們將保持更高的專注度和更快的推進速度我們將安全性置于速度之上在招聘時,我們會非常重視對AI安全性的思考深度我們不希望速度把安全性置于次要地位。
在使命的背景下,對正念的重視非常重要日常習(xí)慣的累積效應(yīng)關(guān)于為什么我們能夠如此快速地推出產(chǎn)品,還有一個小節(jié)需要注意:我們的工作風(fēng)格中有一個長尾的小事項,所有這些小事項都會積累起來:星期一至星期三在辦公室工作。
每個人都在星期一、星期二、星期三來我們舊金山總部上班這種面對面的方式有助于我們遇到意想不到的情況時仍能執(zhí)行下去我記得在ChatGPT的早期,我們構(gòu)建的東西每天都在發(fā)生變化例如,我們正在構(gòu)建的模型是不斷調(diào)整的結(jié)果,因為我們的研究人員不斷地對其進行微調(diào)。
令人驚訝的是,大量的進展是在肩膀上的即興輕拍或參與聽到的談話中取得的當(dāng)然,我們定期進行同步會議,我們也能在計劃的協(xié)作點之上取得即興進展我們還進行了大量的即興白板討論我們會在午餐桌上獲得很多想法——真的!即興社交互動在我們的團隊迅速擴張時,成為了主要的入職機會。
如果沒有即興的面對面互動,過去兩年內(nèi)入職大約120人將會更加困難星期四和星期五是一些員工的無會議日在這些日子里,辦公室的人員較少很多人決定在這些日子里不開會,而是更專注于工作協(xié)調(diào)這些日子對我們的生產(chǎn)力至關(guān)重要。
通過這種協(xié)調(diào),我們團隊每周的辦公室的時間,在前三天就達(dá)到了關(guān)鍵的份量 (critical mass)這種節(jié)奏相當(dāng)緊張使命、產(chǎn)品的影響力和技術(shù)推動人們努力工作但我應(yīng)該指出,這并不一定意味著工作時間非常長這不是一個在守著辦公桌直到凌晨2點的地方。
每個人都相互支持,我們對過度勞累保持警惕我們偏向于聘請更高級別的人,正如我之前提到的這也意味著有很多帶孩子的父母每個人都非常認(rèn)真地花時間和家人在一起這些額外的承諾確實迫使人們保持高度的專注,優(yōu)先考慮和時間的靈活性,包括我自己!。
未來之路我們面臨著許多挑戰(zhàn),以保持我們的速度,比如:壯大的團隊更大的團隊將增加溝通開銷和協(xié)調(diào)難度;更成熟的產(chǎn)品我們構(gòu)建的產(chǎn)品正在變得更加成熟,這種演變使得進行全面的產(chǎn)品更改更加困難;AI安全挑戰(zhàn)這些挑戰(zhàn)將變得更加嚴(yán)峻,不僅對我們而言,對整個行業(yè)也是如此。
我們可能需要調(diào)整我們的部署策略以適應(yīng)這些挑戰(zhàn)我們期望盡量保持我們目前的原則堅定的使命、整合的研究團隊和高人才密度應(yīng)該始終有助于我們對于我的團隊、公司和人工智能的潛力,我持謹(jǐn)慎樂觀的態(tài)度我們自己工具的力量會讓生產(chǎn)力得到提升,感受到這一點非常重要。
我認(rèn)為迄今為止我們所看到的只是可能性的冰山一角參考:https://newsletter.pragmaticengineer.com/p/inside-openai-how-does-chatgpt-ship
本文來自微信公眾號:未盡研究 (ID:Weijin_Research),作者:未盡研究