人工智能-國內(nèi)大模型8月份回顧:實時交互能力提升應(yīng)用端持續(xù)更新_第1頁
人工智能-國內(nèi)大模型8月份回顧:實時交互能力提升應(yīng)用端持續(xù)更新_第2頁
人工智能-國內(nèi)大模型8月份回顧:實時交互能力提升應(yīng)用端持續(xù)更新_第3頁
人工智能-國內(nèi)大模型8月份回顧:實時交互能力提升應(yīng)用端持續(xù)更新_第4頁
人工智能-國內(nèi)大模型8月份回顧:實時交互能力提升應(yīng)用端持續(xù)更新_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1/10計算機報告日期:2024年09月09日o國產(chǎn)大模型快速更新迭代,過去一個月時間內(nèi),國內(nèi)主流大模型基本上都更新了模型版本或發(fā)布新應(yīng)用產(chǎn)品,各大模型廠商持續(xù)打磨產(chǎn)品,推出了針對效率辦公、創(chuàng)意創(chuàng)作、智能搜索、實時互動等場景的功能,大模型技術(shù)加速融入用戶的生產(chǎn)o通用能力層面:國產(chǎn)大模型與海外水平持續(xù)縮小國內(nèi)外第一梯隊大模型在中文領(lǐng)域的通用能力差距在持續(xù)縮小,根據(jù)SuperCLUE跟蹤的數(shù)據(jù),國內(nèi)外TOP1模型的差距比例,從2023年5月的30.12%的差距,縮小至2024年8月的1.29%。在中文語境下,國內(nèi)大模型文理科能力領(lǐng)先,Hard能力與國外相比仍有差距。國內(nèi)大模型在理科和文科維度的能力表現(xiàn)整體好于國外大模型。國內(nèi)前三名模型的理科得分相較于國外前三名平均高1.93分,國內(nèi)前三名模型的文科得分相較于國外前三名平均高0.42分。o中文語境下,國內(nèi)模型文生視頻表現(xiàn)優(yōu)于國外根據(jù)SuperCLUE的測評結(jié)果,在中文環(huán)境下,國內(nèi)外多模態(tài)能力總體水平差距不大,海外模型在基礎(chǔ)認(rèn)知能力方面領(lǐng)先,國內(nèi)模型應(yīng)用能力有優(yōu)勢。國內(nèi)文生視頻模型整體表現(xiàn)好于國外。國內(nèi)文生視頻能力表現(xiàn)較強的模型主要有智譜清影、快手可靈、字節(jié)跳動Dreamina、美圖WHEE和科大訊飛星火繪鏡。o建議關(guān)注標(biāo)的建議關(guān)注:科大訊飛、金山辦公、同花順、恒生電子、彩訊股份、云從科技、萬興科技、昆侖萬維、國投智能、潤達(dá)醫(yī)療、拓爾思、海天瑞聲、虹軟科技、焦點科技、宇信科技、通達(dá)海、福昕軟件、佳發(fā)教育、格靈深瞳、云天勵飛。o風(fēng)險提示AI技術(shù)迭代不及預(yù)期的風(fēng)險;AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期;政策不確定性帶來的風(fēng)險;下游市場不確定性帶來的風(fēng)險。liuwenshu03@stocke.cyeguangliang@taoyunqi@.2/10請務(wù)必閱讀正文之后正文目錄 4 62.1通用能力對比:文理科能力領(lǐng)先,Hard能力仍有差距 2.2多模態(tài)能力對比:中文環(huán)境下,文生視頻能力優(yōu)于國外模型 93/10請務(wù)必閱讀正文之后圖1:國內(nèi)外大模型能力差距持續(xù)縮小 圖2:國內(nèi)外大模型通用能力測評 7圖3:國內(nèi)外大模型理科能力對比 圖4:國內(nèi)外大模型文科能力對比 表1:2024年8-9月國內(nèi)大模型功能更新情況 4表2:SuperCLUE-V多模態(tài)理解測評基準(zhǔn)總榜 表3:AIGCBench-TV文生視頻基準(zhǔn)測評總榜 94/10請務(wù)必閱讀正文之后模型騰訊騰訊混元文生圖開源大模型inpainting(圖像修復(fù)與擴充)、lineart資料來源:各公司官方公眾號、各公司官網(wǎng)、CDSN、智東西、搜5/10請務(wù)必閱讀正文之后訊飛星火:的大模型產(chǎn)品,面向公眾開放體驗。星火極速超擬人交互技術(shù)采用“端到端”技術(shù)框架,實現(xiàn)了語音的直接建模,大幅縮短了響應(yīng)時間,解決了傳統(tǒng)純語音產(chǎn)品中的“機械感”問題,提升了共鳴能力,能夠感知并回應(yīng)用戶的情緒變化。星火極速超擬人交互技術(shù)未來有望在閑聊陪伴、PPT文本生成方面進(jìn)行了獨立訓(xùn)練,此次新版本實現(xiàn)商湯科技:系統(tǒng)的智能圖表的能力,由「商湯?小浣熊家族」提供模型能力的支持。智能圖表功能可省重復(fù)勞動,聚焦更有創(chuàng)造力的工作。用戶可以直接粘貼數(shù)據(jù),或上傳各類數(shù)據(jù)文件,通義千問:文心一言:別其它搜索產(chǎn)品,文小言推出了富媒體搜索、多模態(tài)輸入、文本與圖片創(chuàng)作、高隨心閱讀。3)讀、搜、問、寫一站式搞定,借助多輪對話記憶能力,精準(zhǔn)滿足復(fù)雜任務(wù)需求,騰訊混元大模型:括tile(高清放大)、inpaint妝、電商等80%案例和場景,面向用戶包括6/10請務(wù)必閱讀正文之后豆包大模型:智譜清言:頻通話功能將機器視覺與模型智慧融合,不再局限于傳統(tǒng)的文字和語音交互,MiniMax:月之暗面Kimi:9月2日,中文大模型測評基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評2024年8月報告》。測評結(jié)果顯示,國內(nèi)大模型加快升級迭代,持續(xù)縮小與國外大模在中文語境下的能過去一年多時間,國內(nèi)外大模型持續(xù)發(fā)展,以ChatGPT、Claude、Gemini和Llama為代表海外模型已經(jīng)歷多版本的升級,國內(nèi)模型奮起直追,總體趨勢上,國內(nèi)外第一梯隊大模型在中文領(lǐng)域的通用能力差距在持續(xù)縮小,從2023年5月的30.12%的差距,縮小至2024年8月的1.29%。23.0923.0921.0115.2325.93%8.8919.34%4.0012.54%7.34%4.94%25205030.12%24.58%18.76%17.56%12.81%5.35%20.4516.3411.6115.774.965.811.29%國內(nèi)外Top1模型差距分?jǐn)?shù)國內(nèi)外Top1模型差距比例35%30%25%20%15%10%5%0%7/10請務(wù)必閱讀正文之后中文語境下,國內(nèi)大模型的通用能力已經(jīng)接近國際領(lǐng)先水平。SuperCLUE選取國內(nèi)外有代表性的43個大模型在8月份的版本,做了中文語境下的通用能力測試。在測評排行榜中,騰訊混元大模型僅次于ChatGPT-4o-latest,總得分相差1.03。阿里的Qwen2-72B-Instruct和商湯的SenseChat5.5得分排名,超過Anthropic的Claude3.5Sonnet和Google的Gemini-1.5-Pro。在得分榜中,排名靠前的還有字節(jié)跳動、百度、科大訊飛、階躍星辰等國內(nèi)廠商的身影。從細(xì)分的能力來看:1)Hard能力主要指精準(zhǔn)指令遵循和高階推理,在該能力維度上,國內(nèi)外模型表現(xiàn)仍有一定差距,國內(nèi)第一的混元大模型和全球第一ChatGPT-4olatest得分相差4.54,其他國內(nèi)模型得分均在70以下,和國際領(lǐng)先水平有差距。Hard能力是具有高難度的、高挑戰(zhàn)的任務(wù)具有較高區(qū)分性,是國內(nèi)大模型后續(xù)重點優(yōu)化方向之一。2)理科能力。國內(nèi)模型理科能力優(yōu)異,表現(xiàn)超過海外頭部模型。騰訊混元大模型得分超過ChatGPT-4o-latest,位列測評榜第一。商湯SenseChat5.5得分超過Claude3.5Sonnet、GPT-4o-mini、Gemini-1.5-Pro等海外模型。整體來看,國外前三名模型的理科得分相較于國內(nèi)前三名平均低1.93分。3)文科能力。國內(nèi)模型文科能力表現(xiàn)整體好于國外模型。在文科得分榜單中,騰訊混元大模型以78.86的高分排名第一。整體來看,國外前三名模型的文科得分相較于國內(nèi)前三名平均低0.42分。8/10請務(wù)必閱讀正文之后多模態(tài)綜合能力。國內(nèi)外多模態(tài)能力總體水平差距不大,海外模型在基礎(chǔ)認(rèn)知能力方面領(lǐng)先,國內(nèi)模型應(yīng)用能力有優(yōu)勢。排名第一的是OpenAI的GPT-4o,其次是騰訊混元大模型,國內(nèi)其他表現(xiàn)較好的模型有:上海人工智能實驗室InternVL2-40B、階躍星辰Step-1V-8k、智譜GLM-4v、阿里巴巴Qwen和零一萬物Yi-VL-34B。模型騰訊騰訊AnthropicAnthropicYi-VL-34B分排名第一,國內(nèi)模型排名靠前的是智譜清影、快手9/10請務(wù)必閱讀正文之后模型名稱VegaAlAI技術(shù)迭代不及預(yù)期的風(fēng)險;AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期;政策不確定性帶來的風(fēng)險;下游市場不確定性帶來的風(fēng)險。10/10股票投資評級說明以報告日后的6個月內(nèi),證券相對于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn),定義如下:1.買入:相對于滬深300指數(shù)表現(xiàn)+20%以上;2.增持:相對于滬深300指數(shù)表現(xiàn)+1020%;3.中性:相對于滬深300指數(shù)表現(xiàn)-1010%之間波動;4.減持:相對于滬深300指數(shù)表現(xiàn)-10%以下。行業(yè)的投資評級:以報告日后的6個月內(nèi),行業(yè)指數(shù)相對于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn),定義如下:1.看好:行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)+10%以上;2.中性:行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)-10%10%以上;3.看淡:行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)-10%以下。我們在此提醒您,不同證券研究機構(gòu)采用不同的評級術(shù)語及評級標(biāo)準(zhǔn)。我們采用的是相對評級體系,表示投資的相對比建議:投資者買入或者賣出證券的決定取決于個人的實際情況,比如當(dāng)前的持倉結(jié)構(gòu)以及其他需要考慮的因素。投資者不應(yīng)僅僅依靠投資評級來推斷結(jié)論。法律聲明及風(fēng)險提示本報告由浙商證券股份有限公司(已具備中國證監(jiān)會批復(fù)的證券投資咨詢業(yè)務(wù)資格,經(jīng)營許可證編號為:Z39833000)制作。本報告中的信息均來源于我們認(rèn)為可靠的已公開資料,但浙商證券股份有限公司及其關(guān)聯(lián)機構(gòu)(以下統(tǒng)稱“本公司”)對這些信息的真實性、準(zhǔn)確性及完整性不作任何保證,也不保證所包含的信息和建議不發(fā)生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進(jìn)行更新的義務(wù)。本報告僅供本公司的客戶作參考之用。本公司不會因接收人收到本報告

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論