人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新

上傳人：1*** IP屬地：山西上傳時間：2024-09-14 格式：DOCX 頁數(shù)：15 大?。?95.30KB 積分：19.9 舉報 版權(quán)申訴

人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新_第2頁

人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新_第3頁

人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新_第4頁

人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新_第5頁

已閱讀5頁，還剩10頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1/10計算機報告日期：2024年09月09日o國產(chǎn)大模型快速更新迭代，過去一個月時間內(nèi)，國內(nèi)主流大模型基本上都更新了模型版本或發(fā)布新應(yīng)用產(chǎn)品，各大模型廠商持續(xù)打磨產(chǎn)品，推出了針對效率辦公、創(chuàng)意創(chuàng)作、智能搜索、實時互動等場景的功能，大模型技術(shù)加速融入用戶的生產(chǎn)o通用能力層面：國產(chǎn)大模型與海外水平持續(xù)縮小國內(nèi)外第一梯隊大模型在中文領(lǐng)域的通用能力差距在持續(xù)縮小，根據(jù)SuperCLUE跟蹤的數(shù)據(jù)，國內(nèi)外TOP1模型的差距比例，從2023年5月的30.12%的差距，縮小至2024年8月的1.29%。在中文語境下，國內(nèi)大模型文理科能力領(lǐng)先，Hard能力與國外相比仍有差距。國內(nèi)大模型在理科和文科維度的能力表現(xiàn)整體好于國外大模型。國內(nèi)前三名模型的理科得分相較于國外前三名平均高1.93分，國內(nèi)前三名模型的文科得分相較于國外前三名平均高0.42分。o中文語境下，國內(nèi)模型文生視頻表現(xiàn)優(yōu)于國外根據(jù)SuperCLUE的測評結(jié)果，在中文環(huán)境下，國內(nèi)外多模態(tài)能力總體水平差距不大，海外模型在基礎(chǔ)認(rèn)知能力方面領(lǐng)先，國內(nèi)模型應(yīng)用能力有優(yōu)勢。國內(nèi)文生視頻模型整體表現(xiàn)好于國外。國內(nèi)文生視頻能力表現(xiàn)較強的模型主要有智譜清影、快手可靈、字節(jié)跳動Dreamina、美圖WHEE和科大訊飛星火繪鏡。o建議關(guān)注標(biāo)的建議關(guān)注：科大訊飛、金山辦公、同花順、恒生電子、彩訊股份、云從科技、萬興科技、昆侖萬維、國投智能、潤達(dá)醫(yī)療、拓爾思、海天瑞聲、虹軟科技、焦點科技、宇信科技、通達(dá)海、福昕軟件、佳發(fā)教育、格靈深瞳、云天勵飛。o風(fēng)險提示AI技術(shù)迭代不及預(yù)期的風(fēng)險；AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期；政策不確定性帶來的風(fēng)險；下游市場不確定性帶來的風(fēng)險。liuwenshu03@stocke.cyeguangliang@taoyunqi@.2/10請務(wù)必閱讀正文之后正文目錄 4 62.1通用能力對比：文理科能力領(lǐng)先，Hard能力仍有差距 2.2多模態(tài)能力對比：中文環(huán)境下，文生視頻能力優(yōu)于國外模型 93/10請務(wù)必閱讀正文之后圖1：國內(nèi)外大模型能力差距持續(xù)縮小圖2：國內(nèi)外大模型通用能力測評 7圖3：國內(nèi)外大模型理科能力對比圖4：國內(nèi)外大模型文科能力對比表1：2024年8-9月國內(nèi)大模型功能更新情況 4表2：SuperCLUE-V多模態(tài)理解測評基準(zhǔn)總榜表3：AIGCBench-TV文生視頻基準(zhǔn)測評總榜 94/10請務(wù)必閱讀正文之后模型騰訊騰訊混元文生圖開源大模型inpainting（圖像修復(fù)與擴充）、lineart資料來源：各公司官方公眾號、各公司官網(wǎng)、CDSN、智東西、搜5/10請務(wù)必閱讀正文之后訊飛星火：的大模型產(chǎn)品，面向公眾開放體驗。星火極速超擬人交互技術(shù)采用“端到端”技術(shù)框架，實現(xiàn)了語音的直接建模，大幅縮短了響應(yīng)時間，解決了傳統(tǒng)純語音產(chǎn)品中的“機械感”問題，提升了共鳴能力，能夠感知并回應(yīng)用戶的情緒變化。星火極速超擬人交互技術(shù)未來有望在閑聊陪伴、PPT文本生成方面進(jìn)行了獨立訓(xùn)練，此次新版本實現(xiàn)商湯科技：系統(tǒng)的智能圖表的能力，由「商湯?小浣熊家族」提供模型能力的支持。智能圖表功能可省重復(fù)勞動，聚焦更有創(chuàng)造力的工作。用戶可以直接粘貼數(shù)據(jù)，或上傳各類數(shù)據(jù)文件，通義千問：文心一言：別其它搜索產(chǎn)品，文小言推出了富媒體搜索、多模態(tài)輸入、文本與圖片創(chuàng)作、高隨心閱讀。3）讀、搜、問、寫一站式搞定，借助多輪對話記憶能力，精準(zhǔn)滿足復(fù)雜任務(wù)需求，騰訊混元大模型：括tile（高清放大）、inpaint妝、電商等80%案例和場景，面向用戶包括6/10請務(wù)必閱讀正文之后豆包大模型：智譜清言：頻通話功能將機器視覺與模型智慧融合，不再局限于傳統(tǒng)的文字和語音交互，MiniMax：月之暗面Kimi：9月2日，中文大模型測評基準(zhǔn)SuperCLUE發(fā)布《中文大模型基準(zhǔn)測評2024年8月報告》。測評結(jié)果顯示，國內(nèi)大模型加快升級迭代，持續(xù)縮小與國外大模在中文語境下的能過去一年多時間，國內(nèi)外大模型持續(xù)發(fā)展，以ChatGPT、Claude、Gemini和Llama為代表海外模型已經(jīng)歷多版本的升級，國內(nèi)模型奮起直追，總體趨勢上，國內(nèi)外第一梯隊大模型在中文領(lǐng)域的通用能力差距在持續(xù)縮小，從2023年5月的30.12%的差距，縮小至2024年8月的1.29%。23.0923.0921.0115.2325.93%8.8919.34%4.0012.54%7.34%4.94%25205030.12%24.58%18.76%17.56%12.81%5.35%20.4516.3411.6115.774.965.811.29%國內(nèi)外Top1模型差距分?jǐn)?shù)國內(nèi)外Top1模型差距比例35%30%25%20%15%10%5%0%7/10請務(wù)必閱讀正文之后中文語境下，國內(nèi)大模型的通用能力已經(jīng)接近國際領(lǐng)先水平。SuperCLUE選取國內(nèi)外有代表性的43個大模型在8月份的版本，做了中文語境下的通用能力測試。在測評排行榜中，騰訊混元大模型僅次于ChatGPT-4o-latest，總得分相差1.03。阿里的Qwen2-72B-Instruct和商湯的SenseChat5.5得分排名，超過Anthropic的Claude3.5Sonnet和Google的Gemini-1.5-Pro。在得分榜中，排名靠前的還有字節(jié)跳動、百度、科大訊飛、階躍星辰等國內(nèi)廠商的身影。從細(xì)分的能力來看：1）Hard能力主要指精準(zhǔn)指令遵循和高階推理，在該能力維度上，國內(nèi)外模型表現(xiàn)仍有一定差距，國內(nèi)第一的混元大模型和全球第一ChatGPT-4olatest得分相差4.54，其他國內(nèi)模型得分均在70以下，和國際領(lǐng)先水平有差距。Hard能力是具有高難度的、高挑戰(zhàn)的任務(wù)具有較高區(qū)分性，是國內(nèi)大模型后續(xù)重點優(yōu)化方向之一。2）理科能力。國內(nèi)模型理科能力優(yōu)異，表現(xiàn)超過海外頭部模型。騰訊混元大模型得分超過ChatGPT-4o-latest，位列測評榜第一。商湯SenseChat5.5得分超過Claude3.5Sonnet、GPT-4o-mini、Gemini-1.5-Pro等海外模型。整體來看，國外前三名模型的理科得分相較于國內(nèi)前三名平均低1.93分。3）文科能力。國內(nèi)模型文科能力表現(xiàn)整體好于國外模型。在文科得分榜單中，騰訊混元大模型以78.86的高分排名第一。整體來看，國外前三名模型的文科得分相較于國內(nèi)前三名平均低0.42分。8/10請務(wù)必閱讀正文之后多模態(tài)綜合能力。國內(nèi)外多模態(tài)能力總體水平差距不大，海外模型在基礎(chǔ)認(rèn)知能力方面領(lǐng)先，國內(nèi)模型應(yīng)用能力有優(yōu)勢。排名第一的是OpenAI的GPT-4o，其次是騰訊混元大模型，國內(nèi)其他表現(xiàn)較好的模型有：上海人工智能實驗室InternVL2-40B、階躍星辰Step-1V-8k、智譜GLM-4v、阿里巴巴Qwen和零一萬物Yi-VL-34B。模型騰訊騰訊AnthropicAnthropicYi-VL-34B分排名第一，國內(nèi)模型排名靠前的是智譜清影、快手9/10請務(wù)必閱讀正文之后模型名稱VegaAlAI技術(shù)迭代不及預(yù)期的風(fēng)險；AI商業(yè)化產(chǎn)品發(fā)布不及預(yù)期；政策不確定性帶來的風(fēng)險；下游市場不確定性帶來的風(fēng)險。10/10股票投資評級說明以報告日后的6個月內(nèi)，證券相對于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn)，定義如下：1.買入：相對于滬深300指數(shù)表現(xiàn)＋20％以上；2.增持：相對于滬深300指數(shù)表現(xiàn)＋1020%;3.中性：相對于滬深300指數(shù)表現(xiàn)－1010％之間波動；4.減持：相對于滬深300指數(shù)表現(xiàn)－10％以下。行業(yè)的投資評級：以報告日后的6個月內(nèi)，行業(yè)指數(shù)相對于滬深300指數(shù)的漲跌幅為標(biāo)準(zhǔn)，定義如下：1.看好：行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)＋10%以上；2.中性：行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)－10%10%以上；3.看淡：行業(yè)指數(shù)相對于滬深300指數(shù)表現(xiàn)－10%以下。我們在此提醒您，不同證券研究機構(gòu)采用不同的評級術(shù)語及評級標(biāo)準(zhǔn)。我們采用的是相對評級體系，表示投資的相對比建議：投資者買入或者賣出證券的決定取決于個人的實際情況，比如當(dāng)前的持倉結(jié)構(gòu)以及其他需要考慮的因素。投資者不應(yīng)僅僅依靠投資評級來推斷結(jié)論。法律聲明及風(fēng)險提示本報告由浙商證券股份有限公司（已具備中國證監(jiān)會批復(fù)的證券投資咨詢業(yè)務(wù)資格，經(jīng)營許可證編號為：Z39833000）制作。本報告中的信息均來源于我們認(rèn)為可靠的已公開資料，但浙商證券股份有限公司及其關(guān)聯(lián)機構(gòu)（以下統(tǒng)稱“本公司”）對這些信息的真實性、準(zhǔn)確性及完整性不作任何保證，也不保證所包含的信息和建議不發(fā)生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進(jìn)行更新的義務(wù)。本報告僅供本公司的客戶作參考之用。本公司不會因接收人收到本報告

人人文庫> 全部分類> 應(yīng)用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新

文檔簡介

溫馨提示

最新文檔

評論

人工智能-國內(nèi)大模型8月份回顧：實時交互能力提升應(yīng)用端持續(xù)更新

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔