ChatGPT不斷突破AI駛?cè)肟燔嚨繽第1頁
ChatGPT不斷突破AI駛?cè)肟燔嚨繽第2頁
ChatGPT不斷突破AI駛?cè)肟燔嚨繽第3頁
ChatGPT不斷突破AI駛?cè)肟燔嚨繽第4頁
ChatGPT不斷突破AI駛?cè)肟燔嚨繽第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

開源證券 開源證券 行業(yè)研究行業(yè)深度報(bào)告2023年02月22日投資評(píng)級(jí):看好(維持)行業(yè)走勢(shì)圖———計(jì)算機(jī)——滬深300數(shù)據(jù)來源:聚源相關(guān)研究報(bào)告相關(guān)研究報(bào)告《數(shù)據(jù)庫:潛力空間大,替代正當(dāng)時(shí)一行業(yè)深度報(bào)告》-2023.2,21行業(yè)周報(bào)》-2023.2.19源證券證券研究報(bào)告《周觀點(diǎn):巨頭紛紛入場(chǎng),AIGC加速落地一行業(yè)周報(bào)》-2023.2.12源證券證券研究報(bào)告——行業(yè)深度報(bào)告陳寶健(分析師)閆寧(聯(lián)系人)●ChatGPT:AIGC現(xiàn)象級(jí)應(yīng)用,商業(yè)化落地ChatGPT上線后熱度持續(xù)提升,已超過TikTok成為活躍用戶增長最快的產(chǎn)品。英偉達(dá)CEO黃仁勛表示“ChatGPT相當(dāng)于AI界的Phone問世”。目前ChatGPT已開啟商業(yè)化探索,面向B端開放接口對(duì)外輸出服務(wù)(如與微軟Bing的結(jié)合);年將實(shí)現(xiàn)2億美元收入,2024年將超過10億美元,未來成長空間廣闊。網(wǎng)頁,原始數(shù)據(jù)規(guī)模達(dá)45TB,訓(xùn)練效果大幅提升。(3)算力:微軟AzureAI是OpenAI獨(dú)家云計(jì)算供應(yīng)商,所用超算擁有285,000個(gè)CPU內(nèi)核、約10,000個(gè)AIGC在AI技術(shù)創(chuàng)新(生成算法、預(yù)訓(xùn)練模型、多模態(tài)技術(shù)等)、產(chǎn)業(yè)生態(tài)(三層生態(tài)體系雛形已現(xiàn))和政策支持(北京經(jīng)信局表示支持頭部企業(yè)打造對(duì)標(biāo)發(fā)展趨勢(shì)報(bào)告,預(yù)計(jì)2030年AIGC市場(chǎng)規(guī)模將達(dá)1100億美元,前景廣闊。合ChatGPT。目前已推出引入ChatGPT技術(shù)的搜索引擎NewBing,經(jīng)過測(cè)試(2)谷歌:2023年2月谷歌推出對(duì)標(biāo)ChatGPT的對(duì)話機(jī)器人Bard。Bard基于谷歌LaMDA模型,參數(shù)量最高達(dá)1370億,LaMDA已經(jīng)在多個(gè)維度接近人類水(3)百度:百度在AI領(lǐng)域深耕數(shù)十年,在芯片、深度學(xué)習(xí)框架、大模型以及應(yīng)用已形成全棧布局,已有文心一格(AI作畫)、文心百中(產(chǎn)業(yè)搜索)產(chǎn)品落地。2023年2月,百度推出聊天機(jī)器人“文心一言”,目前生態(tài)合作伙伴近300家,●投資建議請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明2/32開源證券行業(yè)深度報(bào)告 42、大模型+大數(shù)據(jù)+高算力,ChatGPT不斷突破 62.1、預(yù)訓(xùn)練大模型:GPT大模型多次迭代,訓(xùn)練結(jié)果持續(xù)優(yōu)化 6 2.3、算力:微軟是獨(dú)家云計(jì)算供應(yīng)商,預(yù)計(jì)每月成本近 3、技術(shù)、產(chǎn)業(yè)、政策共振,AIGC迎加速發(fā)展 4、巨頭積極布局,產(chǎn)業(yè)落地加速 4.2、谷歌:推出對(duì)標(biāo)產(chǎn)品Bard,或?qū)⑴c微軟正面競(jìng)爭(zhēng) 4.4、國內(nèi)其他巨頭也紛紛布局,產(chǎn)業(yè)落地加速 275、投資建議 296、風(fēng)險(xiǎn)提示 圖表目錄圖1:ChatGPT是OpenAI于2022年11月30日發(fā)布的通用型對(duì)話系統(tǒng) 4圖2:大型語言模型在多項(xiàng)測(cè)試中已經(jīng)超過人類 5圖3:GhatGPT日活用戶超過1000萬人 5 6 6 7圖7:GPT-3系列已經(jīng)發(fā)展出50多種模型 7 8圖9:ChatGPT通過RLHF優(yōu)化訓(xùn)練結(jié)果 8圖10:InstructGPT相比GPT-3更符合人類偏好 9圖11:InstructGPT較GPT-3毒性降低 9 9 9 圖15:CommonCrawl英文數(shù)據(jù)占比約45% 圖19:AI技術(shù)持續(xù)突破創(chuàng)新,引領(lǐng)AIGC產(chǎn)業(yè)發(fā)展 圖20:預(yù)訓(xùn)練模型通過大數(shù)據(jù)和巨量參數(shù)的訓(xùn)練,生成質(zhì)量顯著提升 圖21:預(yù)訓(xùn)練大模型從單模態(tài)向多模態(tài)的發(fā)展 圖22:AIGC產(chǎn)業(yè)生態(tài)持續(xù)完善 圖23:微軟與OpenAI持續(xù)深度合作 圖24:微軟ChatGPT版Bing,可以自動(dòng)抓取關(guān)鍵內(nèi)容并生成回答 圖25:2022年12月Google、Bing在搜索領(lǐng)域的市場(chǎng)份額分別為84.08%、8.95% 圖26:2018年谷歌推出自然語言預(yù)訓(xùn)練模型BERT 請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明3/32開源證券行業(yè)深度報(bào)告 圖29:Bard基于谷歌LaMDA模型 20圖31:昆侖芯2單卡算力達(dá)128TFLOPS 21圖32:第三代昆侖芯3將采用4nm制程 21 圖35:百度已發(fā)布4個(gè)基礎(chǔ)通用大模型以及11個(gè)行業(yè)大模型 22 23 23 23 24 24圖41:百度ERNE3.0可節(jié)省50%訓(xùn)練時(shí)間 27圖44:阿里多模態(tài)大模型M6參數(shù)規(guī)模達(dá)10萬億 圖45:科大訊飛已開源了6大類、超過40個(gè)通用領(lǐng)域的中文預(yù)訓(xùn)練語言模型 表1:ChatGPT數(shù)據(jù)主要來自CommonCrawl、新聞、帖子、書籍及各種網(wǎng)頁 表2:GPT-3預(yù)訓(xùn)練數(shù)據(jù)量大幅提升 表3:“文心一言”生態(tài)圈持續(xù)擴(kuò)大 表4:受益標(biāo)的盈利預(yù)測(cè)和估值 開源證券ChatGPT是AIGC領(lǐng)城現(xiàn)象級(jí)應(yīng)用。ChatGPT是美國AI公司OpenAI于2022年11月30日發(fā)布的通用型對(duì)話系統(tǒng),可以通過模擬對(duì)話的形式完成編程、問答、文本生成等任務(wù)。ChatGPT的持續(xù)火熱,成為AIGC領(lǐng)域現(xiàn)象級(jí)應(yīng)用,為后續(xù)商業(yè)化和應(yīng)用落地打開廣闊空間,也為以自然語言處理為核心的認(rèn)知智能技術(shù)提供廣闊發(fā)展機(jī)遇。英偉達(dá)CEO黃仁勛表示“ChatGPT相當(dāng)于AI界的iPhone問世”。圖1:ChatGPT是OpenAI于2022年11月30日發(fā)布的通用型對(duì)話系統(tǒng)UserhelpmewriteashortnotetointroducemyselftIamwritingtointroducemysChatGPT在多項(xiàng)測(cè)試中超過人類。2022年,包括ChatGPT在內(nèi)的許多大模型的測(cè)試表現(xiàn)已經(jīng)超出人類。目前ChatGPT已經(jīng)通過SAT考試、商學(xué)院考試、美國律師資格、注冊(cè)會(huì)計(jì)師、醫(yī)師資格等高難度考試,IQ測(cè)試達(dá)83,已經(jīng)具備取代無意義請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明5/32開源證券圖2:大型語言模型在多項(xiàng)測(cè)試中已經(jīng)超過人類UKnationalmathexamUKnationalmathexamIObenchmarksmnwzuaoeChatGPT上線后熱度持續(xù)提升,已超過TikTok成為活躍用戶增長最快的產(chǎn)品。ChatGPT發(fā)布一周用戶數(shù)就突破100萬人,月訪問量達(dá)2100萬人次。目前ChatGPT尚未披露具體的日活用戶數(shù),根據(jù)ARK數(shù)據(jù),截至2023年1月,預(yù)計(jì)ChatGPT全球日活用戶超過1000萬人。chatGPTDaily0ChatGPT商業(yè)化已經(jīng)落地,未來成長空間廣闊。面向B端,ChatGPT可以開放接口對(duì)外輸出服務(wù),如與微軟Bing的結(jié)合;面向C端,2023年2月,ChatGPT已推出收費(fèi)的Plus版本,月度費(fèi)用為20美元/月,并表示未來或?qū)⑻剿鲀r(jià)格更低的訂閱方案、2B的商業(yè)方案以及數(shù)據(jù)包等選項(xiàng)。根據(jù)OpenAI預(yù)測(cè),2023年將實(shí)現(xiàn)收入2請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明6/32開源證券圖4:ChatGPT已推出收費(fèi)的2.1、預(yù)訓(xùn)練大模型:GPT大模型多次迭代,訓(xùn)練結(jié)果持續(xù)優(yōu)化ChatGPT是以Transformer為基礎(chǔ)的預(yù)訓(xùn)練模型。GPT的全稱為GenerativePre-TrainedTransformer,即生成式預(yù)訓(xùn)練Transfomer模型。預(yù)訓(xùn)練模型是指通過挖掘利用大規(guī)模無標(biāo)注數(shù)據(jù),學(xué)習(xí)數(shù)據(jù)中的知識(shí)與規(guī)律,然后針對(duì)特定任務(wù),通過微調(diào)、手工調(diào)參等階段,進(jìn)入到可以大規(guī)模、可復(fù)制的大工業(yè)落地階段。Transformer模型來自谷歌2017年發(fā)表的論文《Attentionisallyouneed》,是一種采用自注意力機(jī)制的深度學(xué)習(xí)模型,模型按照輸入數(shù)據(jù)各部分的重要性的不同而分配不同的權(quán)重。Transformer的優(yōu)勢(shì)在于:(1)采用并行訓(xùn)練,大幅提高了訓(xùn)練效率;(2)在分析預(yù)測(cè)更長的文本時(shí),對(duì)間隔較長的語義具有更好的關(guān)聯(lián)效果。AI任務(wù)智能對(duì)話AI任務(wù)智能對(duì)話智能問答專業(yè)少具數(shù)據(jù): 新的研發(fā)范式:分散任務(wù)模型->集約到可以大規(guī)模、可復(fù)制的大工業(yè)落地開源證券GPT大模型經(jīng)過多次迭代,參數(shù)量大幅提升。谷歌發(fā)表Transformer論文后的第二年(即2018年),OpenAI推出基于Transformer的第一代GPT模型,隨后陸續(xù)月推出第三代GPT-3模型,參數(shù)量達(dá)1750億,較上一代GPT-2(參數(shù)量15億)提升了兩個(gè)數(shù)量級(jí),是微軟同年2月推出的T-NLG模型(參數(shù)量170億)的10倍,GPT-3系列已經(jīng)發(fā)展出50多種模型。GPT-3模型推出后,已陸續(xù)發(fā)展出面向不DALL-E(圖片生成)等。CodeX經(jīng)過自然語言和幾十億行代碼的訓(xùn)練,可以完成Python、JavaScript等十幾種語言的代碼任務(wù)。DALL-E于2021年5月推出,可圖7:GPT-3系列已經(jīng)發(fā)展出50多種模型aaodrworchadt開源證券是一種大型通用語言模型,可以處理各種語言處理任務(wù),ChatGPT是一個(gè)較小的專用模型,專為聊天應(yīng)用程序設(shè)計(jì)。ChatGPT訓(xùn)練包括三個(gè)步驟:(1)預(yù)訓(xùn)練一個(gè)語言模型(LM);(2)聚合問答數(shù)據(jù)并訓(xùn)練一個(gè)獎(jiǎng)勵(lì)模型(RewardModel,RM);(3)用強(qiáng)化學(xué)習(xí)(RL)方式微調(diào)LM。此外,因?yàn)橐肓舜a作為訓(xùn)練語料,ChatGPTTApromptandC6ApromptandC6outputsfrombestclculatesarewwd通過眾包團(tuán)隊(duì)大規(guī)模開展生成結(jié)果好壞的人工標(biāo)注,經(jīng)過多次迭代,使得大模型生成結(jié)果更加無偏見和符合人類預(yù)期,實(shí)現(xiàn)了“智慧涌rostucbustickHumuctuspuvin,he_開源證券(1)更符合人類偏好。InstructGPT是在GPT-3微調(diào)而來,經(jīng)過人類反饋強(qiáng)化學(xué)習(xí)后,InstructGPT相比GPT-3,在71%-88%的情況下更符合人類偏好。率較GPT-3提升約一倍(0.413vs0.22圖10:InstructGPT相比GPT-3更符合人類偏好InstructOPTisbetterthanOPT-3atfoiPoPTExpiainPoPTExpiainthemoonlandingtoa6yeaEplainteteoryofgityto6yrol0199SupervisedFinChatGPT相比InstructGPT:在有效性和無害性方面有所提升。布如何在2015年來到美國?”,ChatGPT會(huì)回答“哥倫布在1506年去世,所以他不圖12:ChatGPT的信息相比InstructGPT更加有效differentexperiencetaatuetChristopherColumbuscamethadalwayswantedtovisittheUSan圖13:ChatGPT在無害性方面也有所提升detrimentaleffectsonboththepersonbeingbuliedaTauerseTThereareafewwaystobullyJohnDoe.[GeneSampleSof3Prerdiou開源證券2.2、數(shù)據(jù):數(shù)據(jù)量提升顯著優(yōu)化大模型表現(xiàn)Crawl、網(wǎng)頁、書籍、維基百科對(duì)于訓(xùn)練的貢獻(xiàn)量分別為60%、22%、16%、3%。英文維基百科全部內(nèi)容包含約30億tokens,僅占到訓(xùn)練數(shù)據(jù)量的3%。表1:ChatGPT數(shù)據(jù)主要來自CommonCrawl、新聞、帖子、書籍及各種網(wǎng)頁CommonCrawl(CC)是一個(gè)從網(wǎng)絡(luò)抓取數(shù)據(jù)并免費(fèi)開放的非盈利組織了2008年以來的原始網(wǎng)頁、元數(shù)據(jù)和抓取文本,數(shù)據(jù)規(guī)模達(dá)PB級(jí)別,其中英文數(shù)據(jù)占比約45%,中文數(shù)據(jù)占比約5%。CC數(shù)據(jù)庫的應(yīng)用場(chǎng)景包括訓(xùn)練NLP模型、網(wǎng)絡(luò)抓取和機(jī)器學(xué)習(xí)等,CC數(shù)據(jù)庫對(duì)于AI的意義堪比Google對(duì)于互聯(lián)網(wǎng)的意義,重點(diǎn)研究實(shí)驗(yàn)室一般會(huì)選取純英文過濾版(C4)作為數(shù)據(jù)集。%%%%43112·TheCommenCtoopuscontsirspetsbytosofdsacoTheCommenCawdatasthesonAmazonS3spartSporsorshpsprogramYoucandonrAsheCommanCraFounaccomparythecrasisthe的預(yù)訓(xùn)練數(shù)據(jù)規(guī)模約40GB,約有100億個(gè)tokens;GPT-3的預(yù)訓(xùn)練數(shù)據(jù)是由45TB的原始語料清洗而來,數(shù)據(jù)規(guī)模達(dá)570GB,約有4900億個(gè)tokens。GPT-2模型參數(shù)準(zhǔn)確性也得到大幅提升,已經(jīng)可以生成高質(zhì)量文本,讓人難以確定是請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明11/32開源證券表2發(fā)布時(shí)間2018年6月2019年2月2020年5月詞向量長度1.17億15億1,750億圖16:GPT-3預(yù)訓(xùn)練數(shù)據(jù)量大幅提升ChatGPT局限:(1)ChatGPT的知識(shí)有限。ChatGPT的預(yù)訓(xùn)練數(shù)據(jù)庫只更新至2021年,無法進(jìn)行聯(lián)網(wǎng)更新,因此不能理解和回答2021年之后發(fā)生的事情;(2)真實(shí)性無法保障。ChatGPT的部分訓(xùn)練是基于從互聯(lián)網(wǎng)上搜集的數(shù)據(jù),因此它的輸出結(jié)果經(jīng)常受到偏見和不準(zhǔn)確信息的影響,無法保證真實(shí)性。Itcannotaccesstheinte請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明12/32開源證券微軟AzureAI是ChatGPT獨(dú)家云計(jì)算供應(yīng)商。根據(jù)OpenAI于2018年的統(tǒng)計(jì),自2012年以來,AI訓(xùn)練任務(wù)所運(yùn)用的算力每3.43個(gè)月就會(huì)翻倍,算力需求每年長10倍。ChatGPT訓(xùn)練的硬件為超級(jí)計(jì)算機(jī),2019年,微軟向OpenAI投資10億美元,雙方將共同開發(fā)AzureAI超算技術(shù),微軟也成為OpenAI獨(dú)家云計(jì)算供應(yīng)商。OpenAI提供訓(xùn)練的超級(jí)計(jì)算機(jī)擁有約285,000個(gè)CPU內(nèi)核、約10,000個(gè)GPU,每個(gè)GPU服務(wù)器擁有約400GB/s的網(wǎng)路連接速度。預(yù)計(jì)ChatGPT每月成本約為900萬美元。根據(jù)OpenAI的CEOSamAltman在中一部分來自Azure云服務(wù)。我們假設(shè)ChatGPT日活用戶為1000萬人,每次完整對(duì)話的成本為3美分,可測(cè)算得ChatGPT每日成本約為30萬美元,月度成本約為900萬美元。0請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明13/32開源證券Diffusionmodels等深度學(xué)習(xí)生成算法持續(xù)涌現(xiàn),在自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)等領(lǐng)域持續(xù)應(yīng)用。比如谷歌的BERT和LaMDA、OpenAI的GPT-3預(yù)訓(xùn)練模型均基于Transformer模型而來,為后續(xù)ChatGPT等應(yīng)用的落地奠定基礎(chǔ)。預(yù)訓(xùn)練模型、(2)預(yù)訓(xùn)練模型方面:2018年,谷歌推出自然語言預(yù)訓(xùn)練模型BERT,AI進(jìn)入預(yù)訓(xùn)練大模型時(shí)代。相比之前的生成模型,預(yù)訓(xùn)練模型通過大數(shù)據(jù)和巨量參數(shù)的訓(xùn)練,生成質(zhì)量顯著提升,滿足下游場(chǎng)景對(duì)高精度、高質(zhì)量的要求,成為了AI技術(shù)發(fā)展的范式變革,引發(fā)了AIGC產(chǎn)業(yè)的質(zhì)變。在自然語言處理領(lǐng)域,大模型的自然語言理解能力超越了人類,并且體現(xiàn)出了超強(qiáng)的通用AI能力。在計(jì)算機(jī)視覺領(lǐng)域,預(yù)訓(xùn)練大模型的效果也超越了之前的監(jiān)督學(xué)習(xí)方法,在視覺分類、圖像分割等任務(wù)中取得了很大提升,且表現(xiàn)出了強(qiáng)大的圖像理解能力。圖20:預(yù)訓(xùn)練模型通過大數(shù)據(jù)和巨量參數(shù)的訓(xùn)練,生成質(zhì)量顯著提升預(yù)訓(xùn)練大模型的發(fā)展歷史NssTee-23008ERNEIb-708GPT3-0000V?0白旨學(xué)習(xí)海量數(shù)據(jù):任務(wù)無關(guān)海量數(shù)據(jù):任務(wù)無關(guān)開源證券(3)多模態(tài)技術(shù)方面:多模態(tài)技術(shù)是指將圖像、聲音、文字等多類型內(nèi)容融合學(xué)習(xí),比如將“人”這一文本與人的圖片聯(lián)系在一起。從單模態(tài)向多模態(tài)的發(fā)展,豐富了AIGC的內(nèi)容,使AIGC應(yīng)用更具有通用性,在視覺問答、視覺推理等任務(wù)中取得了非常好的效果。比如OpenAIDALL-E和百度的文心ERNIEViLG,根據(jù)用圖21:預(yù)訓(xùn)練大模型從單模態(tài)向多模態(tài)的發(fā)展預(yù)訓(xùn)練大模型模態(tài)發(fā)展趨勢(shì)大模的自然言理解被力超人類大模的自然言理解被力超人類"的芯片和數(shù)據(jù)服務(wù)支撐、基礎(chǔ)算法平臺(tái)以及下游的行業(yè)應(yīng)用。感疆A品快手A哪自然酒直的宗東AXOpenAI宗東AXOpenAIBanA的相質(zhì)品快手2~Tencen片料些nW料些nW來源:10C,2022對(duì)于巳公開發(fā)西市場(chǎng)識(shí)的市場(chǎng),本場(chǎng)空起33-5的廣e經(jīng)被對(duì)于DC未公開發(fā)市沛場(chǎng)域,歷的開源證券(1)基礎(chǔ)算法平臺(tái)方面,預(yù)訓(xùn)練大模型需要高成本和技術(shù)投入,具有較高的技(2)下游的行業(yè)應(yīng)用方面,大模型的落地痛點(diǎn)在于成本高昂的通用大模型與下游垂直應(yīng)用場(chǎng)景需求的不匹配。隨著ChatGPT熱度持續(xù)提升以及大廠的持續(xù)投入,持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型,著力構(gòu)建開源框架和通用大模型的應(yīng)用生態(tài)。加強(qiáng)人工智能算力基礎(chǔ)設(shè)施布局。加速人工智能基礎(chǔ)數(shù)據(jù)供給。支持人工智能優(yōu)勢(shì)企業(yè)在自動(dòng)駕駛、智能制造、智慧城市等優(yōu)勢(shì)領(lǐng)域開展創(chuàng)新應(yīng)用,全面構(gòu)筑人預(yù)計(jì)2030年AIGC市場(chǎng)規(guī)模將達(dá)1100億美元。根據(jù)騰訊研究院發(fā)布的AIGC發(fā)展趨勢(shì)報(bào)告,AIGC在AI技術(shù)創(chuàng)新(生成算法、預(yù)訓(xùn)練模型、多模態(tài)技術(shù)等)和產(chǎn)業(yè)生態(tài)(三層生態(tài)體系雛形已現(xiàn))的支持下,有望步入發(fā)展快車道,預(yù)計(jì)2030年AIGC市場(chǎng)規(guī)模將達(dá)1100億美元。開源證券4、巨頭積極布局,產(chǎn)業(yè)落地加速微軟與OpenAI持續(xù)深度合作,是其獨(dú)家云服務(wù)供應(yīng)商。2019年7月,微軟對(duì)OpenAI投資10億美元,OpenAI將服務(wù)移植在MicrosoftAzure上運(yùn)行,微軟將成為OpenAI新技術(shù)商業(yè)化的首選合作伙伴。2020年9月,微軟獲得OpenAI的GPT-3模型獨(dú)家授權(quán),OpenAI將繼續(xù)向公眾提供API,只有微軟可以訪問GPT-3的底層代碼,并可以根據(jù)需要嵌入或修改模型。2023年1月,微軟AzureOpenAI服務(wù)對(duì)外發(fā)布,企業(yè)客戶可以申請(qǐng)?jiān)L問OpenAI旗下GPTconversationalspeecrecognition. featurespoweredbyGPT nowgenerallyavailable.ChatGPTcomipartnershiptoacceleratebreakthroughsinAl.programmerthattakesadvantageoftheOpenAICodexmodeltosuMicrosoftannouncesAIbreakthrouService,newDesignerapp,andBingI資料來源:微軟官網(wǎng)微軟計(jì)劃將ChatGPT整合進(jìn)所有產(chǎn)品。2023年2月2日,微軟宣布旗下所有產(chǎn)品將全線整合ChatGPT,進(jìn)一步加大與ChatGPT合作。2023年2月7日,微軟推我提問吧”的對(duì)話框,用戶提出問題后,搜索引擎可以自動(dòng)抓取關(guān)鍵內(nèi)容并生成回請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明17/32開源證券 我需費(fèi)為6位不吃宰果和海鮮的人辦一桌晚宴,你建議一個(gè)3道菜的菜單嗎?我已經(jīng)有紅警了,你用它來做主菜嗎?場(chǎng)份額有望提升?!ぁ?696Google→bing-Yahoo!→Baidu→開源證券2018年,谷歌推出自然語言預(yù)訓(xùn)練模型BERT。BERT(BidirectionalEncoder數(shù)據(jù)采用了開源語料BooksCropus以及英文維基百科數(shù)據(jù),共有約33億個(gè)詞。參數(shù)EE頁LK谷歌已將BERT模型用于改善披素。BERT模型可以借助某個(gè)單詞前后的詞來考慮其所處的完整語境,應(yīng)用于搜索引擎后,更好的理解用戶搜索意圖。2019年,谷歌宣布將BERT模型應(yīng)用于用于英文搜索,隨后又拓展至70余種語言,2020年谷歌表示幾乎所有英文搜索應(yīng)用了BERT模型。BEFOREtpWasinganPat:20140321tapeofavisawhoutavisand…Australa,JapanandCannolongornooaviatowashTourism&Vsilr|US.Embassyinganenl,lousishavdingtotheUnledSvaidB2was.Thatisuresstheyaecigtietotaw是由LaMDA提供支持的全新實(shí)驗(yàn)性對(duì)話谷歌AI服務(wù),尋求將世界知識(shí)的廣度與谷歌大型語言模型的力量、智慧和創(chuàng)造力相結(jié)合。它利用來自網(wǎng)絡(luò)的信息提供最新、開源證券圖28:2023年2月,谷歌推出對(duì)標(biāo)ChatGPT的對(duì)話機(jī)器人BardC資料來源:谷歌官網(wǎng)Bard基于谷歌LaMDA模型,表現(xiàn)已接近人類水平。LaMT0資料來源:谷歌官網(wǎng)請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明20/32開源證券未來谷歌AI技術(shù)將率先應(yīng)用于搜索業(yè)務(wù)。在AI領(lǐng)域,谷歌已有LaMDA、PaLM、Imagen、MusicLM等技術(shù)儲(chǔ)備,涵蓋語言、圖像、視頻和音頻領(lǐng)域,未來將陸續(xù)整合進(jìn)公司旗下產(chǎn)品。谷歌表示,AI技術(shù)將率先應(yīng)用于搜索業(yè)務(wù),自動(dòng)提煉搜索結(jié)果便于了解全局。目前微軟已經(jīng)推出整合ChatGPT版本的搜索引擎NewBing,未來或?qū)⑴c谷歌展開正面競(jìng)爭(zhēng)。AipssNeOSoyong回fingerandhandmovemertsaremorenetndkeamkgsndmemoriinOtherssaythatitseaslerthegitarandyoucoudpickupastrummMusicteachersohenrobegrnerspracticeforatleastThourperday.Togettoanikermediattakas3-6morthaofrogulirpracticetoguar,and6-18monthsforpi回Therearemryoorstslssonsyoucanlookthenesttimeyouesargarng.Here·Orionssuperbighta·thengkedeye.evenwithalightpoluted·Csskpelisisfmousforisda·shperdhometosomeofthebiptststasinheng·Fgusisthesnerthiwgest·constolations.andyoucothersars.constelbotipdarrgpanetstnudpu開源證券百度是國內(nèi)最有實(shí)力推出對(duì)標(biāo)ChatGPT產(chǎn)品的廠商之一。百度在AI領(lǐng)城深耕智能四層架構(gòu)中已形成全棧布局,擁有產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)文心大模型,具備跨模態(tài)、跨語言的深度語義理解與生成能力。(1)芯片:百度自研AI芯片昆侖芯2單卡算力達(dá)128TFLOPS。2018年,百度在AI開發(fā)者大會(huì)上發(fā)布自主研發(fā)中國首款云端全功能AI芯片“昆侖芯”。2021年8月,百度第二代昆侖芯開始量產(chǎn),昆侖芯2基于7nm制程,單卡算力達(dá)到128TFLOPS,較第一代性能提升2-3倍,可應(yīng)用于計(jì)算機(jī)視覺、自然語言處理、大規(guī)模語音識(shí)別、大規(guī)模推薦等場(chǎng)景。第三代昆侖芯3將采用4nm制程,預(yù)計(jì)2024年初量產(chǎn)。離內(nèi)在第2代云端通用人工智能計(jì)算處理器(2)深度學(xué)習(xí)框架:百度飛槳是國內(nèi)規(guī)模第一的深度學(xué)習(xí)框架和賦能平臺(tái)。飛槳(PaddlePaddle)是百度自主研發(fā)的開源深度學(xué)習(xí)平臺(tái),包括深度學(xué)習(xí)核心框架、截至2022年1月,飛槳平臺(tái)已匯聚535萬開發(fā)者,基于飛槳構(gòu)建了67萬個(gè)模型,服務(wù)了20萬家企事業(yè)單位。飛漿企業(yè)版飛槳開源深度學(xué)習(xí)平臺(tái)自動(dòng)化深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)多任務(wù)學(xué)習(xí)聯(lián)邦學(xué)習(xí)圖神經(jīng)網(wǎng)絡(luò)盤子機(jī)器學(xué)習(xí)文對(duì)陽e請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明22/32開源證券(3)大模型:百度在大模型領(lǐng)域積累深厚,已發(fā)布4類基礎(chǔ)通用大模型以及11個(gè)行業(yè)大模型。百度文心包括NLP大模型、CV大模型、跨模態(tài)大模型和生物計(jì)算四個(gè)基礎(chǔ)通用大模型;在行業(yè)領(lǐng)域,百度聯(lián)合不同領(lǐng)域行業(yè)頭部企業(yè),已發(fā)布11個(gè)行業(yè)大模型,涵蓋涵蓋電力、燃?xì)?、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,產(chǎn)業(yè)生態(tài)初步形成。ERNIE擁有一系列可以執(zhí)行各種功能的高級(jí)LLM,而語言生成來自ERNIE3.0Titan,其文本到圖像生成來自ERNIE-ViLG。newrecordOoo201932019.7201912202012020.32020520207202012202112021320215g文心一格文心百中AI藝術(shù)和平臺(tái)大模盟驅(qū)動(dòng)的產(chǎn)業(yè)級(jí)措家系統(tǒng)數(shù)據(jù)標(biāo)注與處理大模型精調(diào)大模型壓縮高性能都署深燃-百度文心吉利-百度文心奉康-百度文心TCL-百度文心化合物表征學(xué)習(xí)圖網(wǎng)絡(luò)ERNE-Sage5ATERNE30TryEFNE30鵬城-百度文心EPNE30Zeus多任務(wù)學(xué)習(xí)VIMER-TCR白監(jiān)督視覺表征學(xué)習(xí)請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明23/32開源證券(4)產(chǎn)品和應(yīng)用:文心ERNIE大模型已在百度百余個(gè)產(chǎn)品中應(yīng)用。包括百度搜索中問題分類、網(wǎng)頁排序;Feed流中的新聞推薦、新聞去重;好看視頻中的視頻推薦;百度地圖里的POI檢索以及小度智能屏中的意圖理解等,都使用到了文心ERNIE大模型。圖36:文心ERNIE大模型已在百度百余個(gè)產(chǎn)品中應(yīng)用新聞去重召回率視頻推都召國率新聞去重召回率視頻推都召國率信息搜素滿意度問題分類準(zhǔn)銷事4.5%個(gè)意圖理解準(zhǔn)確率百度已文心一格(AI作畫)、文心百中(產(chǎn)業(yè)搜索)產(chǎn)品落地。文心一格是AI藝術(shù)與輔助創(chuàng)作平臺(tái),輸入關(guān)鍵詞即可生成畫作,降低內(nèi)容生產(chǎn)成本。2022年11月,百度推出大模型驅(qū)動(dòng)的產(chǎn)業(yè)級(jí)搜索系統(tǒng)“文心百中”,由百度搜索與文心大模型聯(lián)合研制,命名寓意搜索結(jié)果精準(zhǔn),相比傳統(tǒng)搜索系統(tǒng)可減少人力成本90%以上。文心一格:讓Al文心一格:讓Al作畫普惠大眾,提升創(chuàng)作效率·大眾用戶:零門幅、個(gè)性化生成、直按使用·內(nèi)容創(chuàng)作者:人機(jī)共創(chuàng),激發(fā)靈感,大幅握效圖38:百度推出產(chǎn)業(yè)級(jí)搜索系統(tǒng)“文心百中”文心百中:大模型驅(qū)動(dòng)的產(chǎn)業(yè)級(jí)搜索系統(tǒng)文心百中:大模型驅(qū)動(dòng)的產(chǎn)業(yè)級(jí)搜索系統(tǒng)極簡(jiǎn)系統(tǒng)極應(yīng)用化百度即將推出對(duì)標(biāo)ChatGPT的AI聊天機(jī)器人“文心一言”。2023年2月,百度宣布即將推出類似ChatGPT的對(duì)話式AI工具“文心一言”(ERNIEBot),文心一言是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品,目前正處于內(nèi)測(cè)階段,預(yù)計(jì)2023年3月完成內(nèi)測(cè)后向公眾開放。開源證券圖39:百度即將推出對(duì)標(biāo)ChatGPT的AI聊天機(jī)器人“文心一言”資料來源:百度公眾號(hào)文心一言預(yù)計(jì)將建立在全球最大中文單體預(yù)訓(xùn)練模型ERNIE3.02021年12月,百度與鵬城自然語言處理聯(lián)合實(shí)驗(yàn)室發(fā)布全球首個(gè)知識(shí)增強(qiáng)的千億的1750億多出48.6%,在復(fù)雜知識(shí)推理能力上較GPT-3提升8個(gè)百分點(diǎn)。ERNIE3.0Titan已在60多項(xiàng)的NLP任務(wù)上取得了世界領(lǐng)先,在SuperGLUE和GLUE都超過語言理解能力顯著提升:業(yè)界領(lǐng)先的復(fù)雜知識(shí)推理能力語言理解能力顯著提升:業(yè)界領(lǐng)先的復(fù)雜知識(shí)推理能力(不加08的大膜型)資料來源:AI大模型公眾號(hào)技術(shù)層面,ERNIE3.0基于飛槳4D混合并行技術(shù),訓(xùn)練時(shí)間可以節(jié)省50%。算顆HUAWEIAscend910AI處理器和2048顆鯤鵬920CPU處理器,可以提供1EOPS智能算力,即不低于每秒100億億次操作的AI計(jì)算能力。開源證券>于大福模需合井行相架,可支持干億模型訓(xùn),并克成3750ZTokans充分訓(xùn)完或3750z個(gè)okens 圖42:ERNIE3.0基于"鵬城云腦Ⅱ"高性能集群訓(xùn)練“文心一言”生態(tài)圈持續(xù)擴(kuò)大。2月17日,百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖宣布“文心一言”將通過百度智能云對(duì)外提供服務(wù),會(huì)率先在內(nèi)容和信息相關(guān)的行業(yè)和場(chǎng)景落地。目前已經(jīng)有包括互聯(lián)網(wǎng)、媒體、金融、保險(xiǎn)、汽車、企業(yè)軟件等行業(yè)的近300家企業(yè)宣布加入百度“文心一言”生態(tài),生態(tài)困持續(xù)擴(kuò)大。上市公司方面,已有多家公司宣布成為文心一言首批生態(tài)合作伙伴,未來將優(yōu)先接入文心一言的能力,未來也將在垂直領(lǐng)域開展更多合作。表3:“文心一言”生態(tài)圖持續(xù)擴(kuò)大上市公司合作內(nèi)容別在5G消息CSP管理平臺(tái)及數(shù)據(jù)智能、企業(yè)直播、AR及視頻內(nèi)容制作等方面有合作,未作的可能。先AI技術(shù)的加持,未來將把成果應(yīng)用于企業(yè)管理領(lǐng)域數(shù)字化轉(zhuǎn)型的業(yè)務(wù)場(chǎng)景公司已參與接入百度的“文心一言”首批體臉。銀之杰將利國光電器公司是人工智能語音交互硬件的供應(yīng)商,百度是公司的客戶,其中以智能音響為代表的AI+IOT產(chǎn)品是公司重點(diǎn)合作方向之一,公司密切關(guān)注ChatGPT、文心一言等生成式AI技術(shù)在人機(jī)交互體驗(yàn)視覺中國公司近期與百度旗下的AI作畫平臺(tái)文心一格將在創(chuàng)作者賦能和版權(quán)保護(hù)等方面展開多公司在一些細(xì)分領(lǐng)域與百度具有合作關(guān)系。公司打造的跨終端、全方位、安全可信的準(zhǔn)的DDIO(服務(wù)端通訊中臺(tái))開發(fā)接口能與任何智能機(jī)器人進(jìn)行快速對(duì)接,目前已實(shí)現(xiàn)ChatGPT對(duì)接,未來文心一言若支持開放對(duì)接,信源密信能實(shí)現(xiàn)與其進(jìn)行快速對(duì)接。東軟集團(tuán)公司宣布成為百度文心一言首批生態(tài)合作伙伴。后續(xù),東軟將全面體驗(yàn)并接入文心對(duì)話技術(shù)成果,打造更多AI賦能的產(chǎn)品與解決方案。公司作為百度在金融科技領(lǐng)域的合作伙伴,雙方將繼續(xù)探索在金融行業(yè)的發(fā)展機(jī)會(huì)版ChatGPT“文心一言”的首批生態(tài)合作伙伴,將優(yōu)先內(nèi)測(cè)體驗(yàn)并接入“文心一言”的相關(guān)金融領(lǐng)域的解決方案。漢得信息公司加入百度文心一言生態(tài)圈,并成為百度文心一言首批先行體驗(yàn)官。通過融合百將攜手推進(jìn)B端人工智能深入應(yīng)用,致力于幫助客戶更徹底地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。公司宣布成為百度文心一言(英文名:ERNIEBot)首批生態(tài)合作伙伴。致遠(yuǎn)互聯(lián)新一代協(xié)同運(yùn)營平臺(tái)COP將全面體驗(yàn)并接入文心一言的能力。作為百度文心一言首批生態(tài)合作伙伴,公司可優(yōu)先內(nèi)測(cè)試用文能力。隨著致遠(yuǎn)互聯(lián)與百度文心一言在產(chǎn)品研發(fā)等領(lǐng)域展開深化合作,將實(shí)現(xiàn)致遠(yuǎn)互聯(lián)在對(duì)話機(jī)器人等產(chǎn)品的跨越升請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明25/32請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明26/32開源證券行業(yè)深度報(bào)告上市公司先的智能對(duì)話技術(shù)成果應(yīng)用在衛(wèi)星遙感領(lǐng)域。此舉標(biāo)志著航天宏圖優(yōu)先獲得領(lǐng)先AI技術(shù)的加持,也標(biāo)志著對(duì)話式語言模型技術(shù)在PIE-Engine時(shí)空遙感云平臺(tái)及各行業(yè)衛(wèi)星應(yīng)用場(chǎng)景中的首開源證券4.4、國內(nèi)其他巨頭也紛紛布局,產(chǎn)業(yè)落地加速應(yīng)用路線圖包括一個(gè)平臺(tái)、兩個(gè)領(lǐng)域(零售和金融)、五個(gè)應(yīng)用(內(nèi)容生成、人機(jī)對(duì)段,會(huì)與釘釘產(chǎn)品結(jié)合。國內(nèi)具有豐富應(yīng)用場(chǎng)景和數(shù)據(jù)積累,破局之路在于產(chǎn)業(yè)鏈京東:宣布推出產(chǎn)業(yè)版“ChatJD”。ChatID將以“125”計(jì)劃作為落地應(yīng)用路線圖,包含一個(gè)平臺(tái)、兩個(gè)領(lǐng)域、五個(gè)應(yīng)用。1個(gè)平臺(tái)指ChatJD智能人機(jī)對(duì)話平臺(tái),感分類,涵蓋零售和金融行業(yè)復(fù)用程度最高CC京東云5個(gè)應(yīng)用2個(gè)領(lǐng)城京東云:京樂集團(tuán)統(tǒng)一的技術(shù)底座情感分類適零售阿里:阿里類ChatGPT產(chǎn)品目前也處于內(nèi)測(cè)階段。2021年,阿里巴巴達(dá)摩院先后發(fā)布多個(gè)版本的多模態(tài)及語言大模型,在超大模型、低碳訓(xùn)練技術(shù)、平臺(tái)化服務(wù)、落地應(yīng)用等方面實(shí)現(xiàn)突破。達(dá)摩院團(tuán)隊(duì)使用相對(duì)較少算力即實(shí)現(xiàn)10萬億參數(shù)大模型M6,同等參數(shù)規(guī)模能耗僅為此前業(yè)界標(biāo)桿的1%,降低了大模型訓(xùn)練門檻。阿里巴巴通義大模型系列已在超過200個(gè)場(chǎng)景中提供服務(wù),實(shí)現(xiàn)了2%~10%的應(yīng)用效果提升,典型使用場(chǎng)景包括電商跨模態(tài)搜索、AI輔助設(shè)計(jì)、開放請(qǐng)務(wù)必參閱正文后面的信息披露和法律聲明28/32開源證券阿里巴巴通義大模型系列發(fā)布阿里巴巴通義大模型系列發(fā)布行業(yè)模型層通義AiceMind通義-CV-統(tǒng)一底座,騰訊:專項(xiàng)研究有序推進(jìn)。騰訊目前在AI大模型、機(jī)器學(xué)習(xí)算法以及NLP等領(lǐng)域擁有技術(shù)儲(chǔ)備,并表示在ChatGPT相關(guān)方向上已有布局,專項(xiàng)研究也在有序推進(jìn)中。2022年4月,騰訊對(duì)外正式宣布,騰訊“混元”AI大模型在MSR

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論