【國信證券】人工智能專題：Openai發(fā)布會梳理

上傳人：緣*** IP屬地：四川上傳時間：2025-01-27 格式：PPTX 頁數(shù)：34 大?。?37.28KB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩29頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

人工智能專題：

Opena

i發(fā)布會梳理證券研究報告

2024年12月23日行業(yè)研究

行業(yè)專題

投資評級：優(yōu)于大市（維持）請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容OpenAI從12月5日連續(xù)12個工作日每天公布一個新應(yīng)用或功能。1

）DAY1:發(fā)布完整版o1；2

）DAY2

：發(fā)布強化微調(diào)技術(shù)；3

）DAY3

：發(fā)布視頻大模型Sora；4

）DAY4

：發(fā)布協(xié)作平臺Canvas；5

）DAY5

：發(fā)布ChatGPT

×Apple

Intelligence；6）DAY6

：發(fā)布高級語音模式；7

）DAY7

：發(fā)布Projects

ChatGPT；8）DAY8

：發(fā)布ChatGPT搜索；9

）DAY9

：發(fā)布o(jì)1API；10）

DAY10

：發(fā)布通話訪問模式；11）

DAY11

：發(fā)布全新桌面應(yīng)用；12）

DAY12

：發(fā)布新一代推理模型o3&o3mini。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容?風(fēng)險提示：A

I應(yīng)用落地不及預(yù)期、行業(yè)競爭加劇、大模型研發(fā)不及預(yù)期。摘要 Open

12天發(fā)布會

風(fēng)險提示請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容0201目錄

發(fā)布三大基礎(chǔ)模型

，模型性能跨越式提升?12天的發(fā)布會中

，

OpenAI推出了三款基礎(chǔ)模型

，分別是增強的ChatGPT

o1模型、

Sora視頻生成模型、

o3模型,新的模型在數(shù)學(xué)和科學(xué)領(lǐng)域均有

著卓越表現(xiàn)

，

同時也意味著openai在推理能力方面邁出了重要一步。?o3模型的發(fā)布

，更是標(biāo)志著AI在編程、科學(xué)推理等領(lǐng)域的巨大進(jìn)步。

o3模型接近通用人工智能（AGI）

的標(biāo)準(zhǔn)

，為復(fù)雜決策和高端問題解決提供

了新的技術(shù)基礎(chǔ)。?Sora的發(fā)布將極大降低內(nèi)容創(chuàng)作的成本和時間。

為營銷、培訓(xùn)、市場等各領(lǐng)域提供AI生成的高質(zhì)量視頻

，有望成為企業(yè)未來內(nèi)容創(chuàng)作的新標(biāo)準(zhǔn)。表1：openai

發(fā)布會基礎(chǔ)模型部分發(fā)布日期發(fā)布產(chǎn)品產(chǎn)品描述DAY1完整版o1o1的完整版本

，相較之前在推理方面具有更快的速度和更優(yōu)的性能DAY3Sora在文生視頻的基礎(chǔ)上

，加入多種編輯工具

，同時支持生成20s視頻輸出及多種分辨率和格式DAY12o3

&o3

mini預(yù)告更強的推理模型

，在ARC-AGI測試中達(dá)到87.5%

，超過人類閾值

，是o1的三倍請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容Openai發(fā)布會——基礎(chǔ)模型資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

強化微調(diào)技術(shù)

，提升垂直行業(yè)模型能力?用戶可以根據(jù)極少量的數(shù)據(jù)

，訓(xùn)練特定領(lǐng)域的專家模型。這意味著企業(yè)構(gòu)建定制化的AI模型

，不再需要大量的特定數(shù)據(jù)

集標(biāo)注。?定制化能力：相較于通用AI

，強化微調(diào)技術(shù)為企業(yè)提供了更靈活的定制化路徑。企業(yè)可以通過這一技術(shù)打造專屬的AI助

手

，在提高生產(chǎn)效率的同時

，提供更具個性化的服務(wù)

，從而有效地提升用戶體驗。?例如

，個性化推薦、A

I診療系統(tǒng)、A

I審查工具等特定場景均都可以通過這一技術(shù)快速部署。表2：openai發(fā)布會微調(diào)部分發(fā)布日期發(fā)布產(chǎn)品產(chǎn)品描述DAY2強化微調(diào)使用較小的數(shù)據(jù)集即可在特定場景創(chuàng)建專家模型

，對科研領(lǐng)域幫助較大DAY9o1APIopenai

向第三方開放調(diào)用o1API權(quán)限

，可支持函數(shù)調(diào)用、結(jié)構(gòu)化輸出、開發(fā)者消息、視覺功能請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容Openai發(fā)布會——微調(diào)資料來源：OpenAI

，國信證券經(jīng)濟研究所整理發(fā)布日期發(fā)布產(chǎn)品產(chǎn)品描述DAY4Canvas集智能寫作、代碼協(xié)作于一身的a

i工作臺DAY5ChatGPT

×AppleIntelligenceApple

Intelligence對ChatGPT的深度整合

，在Siri、協(xié)作工具和相機控制方面增加與ChatGPT的集成DAY6高級語音模式將5月發(fā)布的實時視頻通話功能全量開放DAY7Projects

inChatGPT允許用戶創(chuàng)建特定項目

，設(shè)置自定義指令

，并將相關(guān)對話集中DAY8ChatGPT搜索可在實時對話中調(diào)用搜索功能

，并支持多模態(tài)搜索DAY10通話訪問模式用戶可通過撥打電話的方式與ChatGPT對話DAY11桌面應(yīng)用在MAC其他程序中可輕松調(diào)取ChatGPT

多款a

i智能體升級

，大幅提升用戶體驗?發(fā)布會發(fā)布了集智能寫作&代碼協(xié)作于一身的a

i工作臺、新的桌面應(yīng)用、高級語音模式、通話訪問模式等多款aiagent產(chǎn)品

，標(biāo)志著ChatGPT從簡單的會話助手向更強大的代理工具的轉(zhuǎn)變

，從而可以代表客戶執(zhí)行更多任務(wù)

，為用戶帶來全新的便捷體驗。表3：openai發(fā)布會ai

agent部分請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容Openai發(fā)布會——ai

agent資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

正式發(fā)布完整版o1

，性能大幅提升?

在今年9月份

，

OpenAI發(fā)布o(jì)1-preview

，對模型的技術(shù)思路進(jìn)行了改進(jìn)

：將更多算力運用于推理側(cè)

，

o1是使用大規(guī)模強化學(xué)習(xí)訓(xùn)練并使用思維

鏈進(jìn)行推理的系列模型。?

今年12月

，

OpenAI正式發(fā)布了o1完整版

，

o1完整版在數(shù)學(xué)、編程、博士階段科學(xué)問題（困難問題）

領(lǐng)域的性能遠(yuǎn)超GPT4o

，在科學(xué)問題領(lǐng)域

超越人類專家

，并在數(shù)學(xué)、編程領(lǐng)域的性能較o1-preview有了大幅提升。?

相較于o1-preview

，

OpenAI對o1進(jìn)行了使用體驗方面的改進(jìn)：

o1目前對于簡單問題能夠回答更加迅速

，

OpenAI測試目前o1較o1-preview重

大錯誤率降低了34%

，速度提升50%。?目前o1已面向所有Plus訂閱用戶推出

，用于替代o1-preview

，并將上線后續(xù)推出的Pro訂閱。

圖1：o1在數(shù)學(xué)、編程領(lǐng)域能力有了極大提升請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY1：

完整版o1發(fā)布資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

支持多模態(tài)

，

可處理模糊問題?OpenAI對o1進(jìn)行了改進(jìn)

，

目前支持圖像、

文本兩種輸入方式。在演示中

，對于一張手繪的太空太陽能驅(qū)動的數(shù)據(jù)中心示意圖

，

o1估計出了其

散熱器表面積并解答了兩個問題

：如何處理太陽和深空環(huán)境

，

以及這里如何體現(xiàn)了熱力學(xué)第一定律

，整個推理過程僅需10秒鐘。?

在示例中

，

OpenAI故意省略了冷卻面板的溫度等關(guān)鍵數(shù)據(jù)

，用以測試o1在處理模糊問題時的能力。示例中o1自行識別了關(guān)鍵參數(shù)缺失

，并選

擇了合理的溫度范圍進(jìn)行后續(xù)的推理

，輸出了合理結(jié)果。?OpenAI表示

，

o1未來還會添加網(wǎng)頁瀏覽、文件上傳等功能

，

以及引入API

，具體上線時間未知。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY1：

完整版o1發(fā)布資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖3：研究人員用手繪圖片測試o1性能圖4：o1根據(jù)手繪圖像準(zhǔn)確回答問題

推出PRO訂閱?OpenAI發(fā)布最新訂閱選項ChatGPT

Pro

，定

價200美金/月

，在這個套餐里

，

OpenAI

提

供了o1

pro

mode

，這個模式中o1處理非常

難的題目時

，用戶可要求o1

pro獲得更多算

力

，并強化思考。

pro

mode在數(shù)學(xué)、編

程、科學(xué)問題領(lǐng)域性能較o1均有提升

，但重

點在于o1

pro

mode的連續(xù)性。?OpenAI設(shè)計了“

四次測試”評估

：模型需要

連續(xù)四次都答對同一個問題才算通過。

在這

種條件下

，

pro模式保持了相當(dāng)高的可靠

性

：在競賽數(shù)學(xué)中達(dá)到80%

，編程測試中達(dá)

到74.9%

，

科學(xué)問題中達(dá)到74.2%。

遠(yuǎn)超普

通版o1。這說明o1

pro能提供更佳的穩(wěn)定性

和一致性

，

對于需要AI協(xié)助完成重要工作的

專業(yè)人士來說能夠有更好的保障。?同時

，

ChatGPT

Pro訂閱計劃能無限制訪問OpenAI

，

以及o1-mini

、

GPT-4o和Advanced

Voice。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖6：o1pro模型具有更強穩(wěn)定性，適用于專業(yè)領(lǐng)域DAY1：

完整版o1發(fā)布圖7：Pro訂閱可以解鎖o1Pro及其他權(quán)益圖5：o1pro模型較o1性能有全方位提升資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

o1pro擁有更強的推理能力?

在示例中

，

OpenAI的研究員要求o1找到一種符合六個標(biāo)準(zhǔn)的特定蛋白質(zhì)。這個問題的挑戰(zhàn)在于

，需要模型回憶起相當(dāng)專業(yè)的化學(xué)領(lǐng)域知識，

而對于任何給定的標(biāo)準(zhǔn)

，可能會有數(shù)十種蛋白質(zhì)符合該標(biāo)準(zhǔn)。所以模型必須全面考慮所有候選者

，然后檢查它們是否符合所有標(biāo)準(zhǔn)。?o1-preview在此問題經(jīng)常出錯

，而示例中o1

pro僅使用53秒便準(zhǔn)確回答了相關(guān)問題

，并可查看詳細(xì)的思考過程。?

在思考困難問題時

，

目前o1模型的思考時間可達(dá)幾分鐘

，

因此OpenAI為模型添加了思考進(jìn)度條

，

以直觀展示目前模型的進(jìn)程。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY1：

完整版o1發(fā)布資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖8：o1長時間思考將顯示進(jìn)度圖9：o1可展示詳細(xì)思考進(jìn)度?強化微調(diào)可讓開發(fā)者使用強化學(xué)習(xí)針對具體任務(wù)對模型進(jìn)行進(jìn)一步微調(diào)

，并根據(jù)提供的參考答案對模型的響應(yīng)進(jìn)行評分具體來

說

，強化微調(diào)不僅會教模型模仿其輸入

，更是會讓其學(xué)會在特定領(lǐng)域以新的方式進(jìn)行推理。

當(dāng)模型發(fā)現(xiàn)問題時

，要為它提供思

考問題的空間

，然后再對模型給出的響應(yīng)進(jìn)行打分。之后

，利用強化學(xué)習(xí)的力量

，可以強化模型得到正確答案的思維方式并抑

制導(dǎo)向錯誤答案的思維方式。

強化微調(diào)的優(yōu)勢？?快速高效

：相比于傳統(tǒng)技術(shù)

，強化微調(diào)技術(shù)更高效

，不需要大規(guī)模的數(shù)據(jù)集支持。?使用靈活

：用戶可根據(jù)需求即時調(diào)整模型

，使模型更加符合特定場景需求。?應(yīng)用廣泛

：強化微調(diào)技術(shù)可以推動客服、教育、創(chuàng)意、研究等各個領(lǐng)域的應(yīng)用。圖10：OpenA

I公布強化微調(diào)技術(shù)DAY2：

強化微調(diào)技術(shù)

什么是強化微調(diào)？請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容資料來源：OpenAI官方推特，國信證券經(jīng)濟研究所整理

強化微調(diào)后在特定領(lǐng)域性能明顯提升?

在官方演示里

，

OpenAI設(shè)置了一個實驗

：在給定癥狀列表的情況下

，用模型預(yù)測可能導(dǎo)致罕見遺傳疾病的基因

，并讓模型解釋為什么選這些基

因。實驗人員使用三種模型進(jìn)行對比：

mini、

o1完整版、

mini強化微調(diào)版。?

對于o1

mini強化微調(diào)版

，實驗人員匯集了大約1100個病例報告作為訓(xùn)練和驗證的數(shù)據(jù)集

，在使用訓(xùn)練數(shù)據(jù)集對模型進(jìn)行訓(xùn)練后

，上傳驗證數(shù)據(jù)

集對模型推理能力進(jìn)行反復(fù)測試和調(diào)整

，

同時保證驗證數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集之間的正確基因沒有重疊

，

以防模型作弊。評估結(jié)果時

，實驗人員設(shè)

置了三項指標(biāo)：

1）模型一次答對的概率；

2）模型前五次預(yù)測中有正確答案的概率；

3）模型預(yù)測中有正確答案的概率。?

結(jié)果顯示

，經(jīng)過強化微調(diào)的o1

mini在一次答對的準(zhǔn)確率上躍升180%達(dá)到了31%

，各方面全面超越了o1。

強化微調(diào)技術(shù)將使開發(fā)者能夠通過更

快、成本更低的o1

mini模型獲得超越o1的專業(yè)性能

，將極大促進(jìn)AI在各領(lǐng)域的應(yīng)用。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY2：

強化微調(diào)技術(shù)資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖11：強化微調(diào)后o1mini模型超越o1圖12：強化微調(diào)后o1mini性能評測

正式發(fā)布視頻大模型Sora?

文本/圖像生成視頻：

Sora用戶可以使用文本、

圖像來提示Sora生成相關(guān)視頻?時間線編輯

：全新推出的故事板工具讓用戶可以精準(zhǔn)地指定每個幀的輸入和生成視頻的內(nèi)容

，并輕松進(jìn)行視頻剪輯

，用戶指令越少

，

Sora會嘗試

填充更多細(xì)節(jié)

，用戶指令越詳細(xì)

，

Sora會嘗試遵循要求方向生成視頻。用戶可在Sora中保存自己喜歡的風(fēng)格

，并在后續(xù)視頻生成任務(wù)中重復(fù)調(diào)

用。?

高分辨率、

多種格式支持：

Sora可以生成480p-1080p分辨率、

5-20秒、寬屏、豎屏或方形的視頻。并且用戶可以利用資源進(jìn)行擴展、

remix（用戶只需描述對視頻的更改

，

Sora將自行完成）和融合。對于同一指示

，

Sora可生成多個不同視頻方向的變體

，供用戶選擇。圖13：用戶可通過故事板工具直接描述生成相應(yīng)視頻請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY3：

視頻大模型Sora發(fā)布資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

多種工具支持Sora?1）

Remix:使用Remix替換、刪除或重新構(gòu)想視頻中的元素；?2）

Re-cut：找到并提取最佳幀或視頻段落

，然后向任一方向延伸它們以完成特定場景

，例如可對之前生成的視頻進(jìn)行裁剪

，要求Sora生成全新

開頭或結(jié)尾；?3）

Loop

：使用Loop剪輯并創(chuàng)建無限重復(fù)的視頻

，例如

：用戶喜歡燈塔視頻

，可使用Loop工具

，

Sora將自動生成內(nèi)容將重復(fù)視頻的開頭和結(jié)尾

連接

，生成可重復(fù)視頻；?

4）

Blend

：將兩個視頻合并為一個視頻

，給Sora兩個視頻場景

，

Sora會將其中元素合并生成全新視頻

，用戶可用指令提示Sora兩個視頻的合并

方向；?5）

Style

presets

：使用Presets創(chuàng)建和分享自己的視頻風(fēng)格。圖14：Sora定價

Sora定價?Sora目前已在歐洲和英國以外的其他地區(qū)上線，Plus用戶可獲得一個月生成50個優(yōu)先視頻的權(quán)限，Pro用戶可獲得無限生成權(quán)限，以及500次優(yōu)先生成權(quán)限。資料來源：OpenAI

，國信證券經(jīng)濟研究所整理請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY3：

視頻大模型Sora發(fā)布

正式發(fā)布Canvas協(xié)作平臺?Canvas全面開放

，

已被整合進(jìn)ChatGPT中；?

提升了代碼功能

，用戶可以直接在Canvas上運行Python代碼

，并可直觀看到代碼結(jié)果輸出；?Canvas目前可被CustomGPT調(diào)用圖15：Canvas工具目前已被整合進(jìn)ChatGPT中請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY4：

Canvas協(xié)作平臺發(fā)布資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

Canvas主要功能?

用戶編輯文字：在使用Canvas工具后

，交互頁面將被分為兩部分

，左側(cè)為與模型的對話

，右側(cè)為用戶可直接編輯的文檔

，用戶可直接在Canvas工具中刪除、添加、修改ChatGPT回復(fù)的內(nèi)容

，

以及進(jìn)行加粗等格式調(diào)整。不論是寫信、寫公文還是論文

，這種新生成模式都可以大幅提升效率。

同時OpenAI在Canvas工具右下角集成了部分快捷工具

，用戶只需點擊即可實現(xiàn)包括詢問模型反饋（

Suggest

edits）

、文檔長度調(diào)整（

Adjustthe

length）

、語言風(fēng)格轉(zhuǎn)化（

Reading

level）

、文檔潤色（Add

final

polish）

、添加表情（Add

emojis）這些用戶在處理文檔時的常用功能。?

審稿

：很多人使用ChatGPT幫助寫作

，但以前一問一答的形式非常繁瑣

，現(xiàn)在用戶只需要把文章復(fù)制粘貼到ChatGPT的文本框中

，通過文本輸

入讓其給出修改建議

，大模型給出的建議會以逐條批注的形式出現(xiàn)。用戶可在頁面中對應(yīng)位置看到ChatGPT給出的修改建議

，并決定是否根據(jù)批

注進(jìn)行潤色

，之后關(guān)閉建議

，或者直接選擇Apply

，讓ChatGPT自行對內(nèi)容進(jìn)行修改。這使用戶可以更直觀的使用模型幫助自己審閱文章

，并給

出建議。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY4：

Canvas協(xié)作平臺發(fā)布圖17：Canvas可讓用戶更直觀的看到ChatGPT對文章的修改建議圖16：Canvas可快捷實現(xiàn)對模型回復(fù)的修改資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

Canvas主要功能?

編程：

Canvas可以直接識別代碼

，并轉(zhuǎn)變成為代碼編輯模式。

用戶還可以在Canvas上直接運行測試

，

以及錯誤識別和修改錯誤的建議。

用戶想

要Debug時

，可直接代碼復(fù)制到ChatGPT上

，

即可讓模型解釋問題

，給出正確代碼的示例。如果在ChatGPT上點運行代碼出錯了

，還可以使用A

I給出的comment

，與文本編輯內(nèi)容類似

，如果用戶點擊Fix

Bug按鈕

，

ChatGPT可自行對Bug進(jìn)行修改

，修改的位置可以高亮顯示。?引入CustomGPT：

CustomGPT允許用戶根據(jù)自己的需求和偏好定制GPT模型

，通過給予GPT自定義指令以及自定義上下文等方法

，使其更好

地適應(yīng)特定的應(yīng)用場景或任務(wù)

，并支持將模型與他人分享

，使用GPT

Store平臺

，用戶可快速瀏覽、購買、下載和使用由OpenAI或第三方開發(fā)

的定制GPT模型和插件。圖17：Canvas可直接進(jìn)行代碼修改、運行等功能

圖18：CustomGPT可對模型進(jìn)行自定義請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY4：

Canvas協(xié)作平臺發(fā)布資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

Day5,蘋果公司發(fā)布了其iPhone、

iPad和Mac軟件的更新（iOS和iPadOS

18.2）

，將ChatGPT進(jìn)一步嵌入蘋果系統(tǒng)當(dāng)中

，此次更新包括在Siri、寫作工具和視覺智能中與ChatGPT的集成。

據(jù)彭博社消息，

ChatGPT在回答問題時的準(zhǔn)確率比Siri高出25%

，且能回答30%更多的問題，

蘋果選擇與OpenAI合作

，將ChatGPT整合進(jìn)iOS、

iPadOS和macOS系統(tǒng)將極大提升其智能體驗。

目前

，在iPhone、

Mac、

iPad等設(shè)備中

，新版的蘋果智能已經(jīng)包含ChatGPT拓展功能，

用戶可在設(shè)置中自行選擇是否調(diào)用

ChatGPT。圖19：ChatGPT已集成在App

intelligence中DAY5：

Chatgpt進(jìn)一步集成到Apple生態(tài)系統(tǒng)請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

增強版高級語音模式?

增強版高級語言模式具備屏幕共享和視覺功能

，

ChatGPT可以協(xié)助理解手機攝像頭以及屏幕上所查看的內(nèi)容。這些功能在高級語音模式已有的基

礎(chǔ)上進(jìn)一步增強

，

目前ChatGPT支持像人類的自然對話對話

，

同時對話可以被中斷

，具有多輪交互

，并理解非線性的思維過程。?

實時視頻通話：

用戶現(xiàn)在可以使用視頻與ChatGPT進(jìn)行交流

，

這使得溝通更加直觀和生動

。

在官方展示案例中

，

OpenAI的工作人員通過ChatGPT的視頻功能現(xiàn)場獲取了如何制作一杯咖啡的指引。

當(dāng)演示者按照步驟操作時

，

ChatGPT會同時口頭提供見解和指導(dǎo)。?

實時屏幕共享：用戶可以將自己的屏幕內(nèi)容分享給ChatGPT

，

以獲取ChatGPT提供的技術(shù)支持或協(xié)助處理屏幕內(nèi)容。在官方演示中

，

OpenAI的

工作人員通過與ChatGPT共享屏幕

，獲得了關(guān)于如何回復(fù)其消息的建議。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY6：

增強版高級語音模式發(fā)布圖21：增強版高級語音功能支持屏幕共享圖20：增強版高級語音功能支持視頻交互資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理?

可以將ChatGPT的各種功能整合至一處

，便于用戶創(chuàng)建并管理各類項目

，不僅支持Canvas界面

，還能通過ChatGPT

Search輕松接入互聯(lián)網(wǎng)資源。?

分項目管理ChatGPT：

Projects賦予用戶將聊天與數(shù)據(jù)分組的能力

，從而使用戶能夠依據(jù)自身需求更加便捷地定制ChatGPT。在創(chuàng)建Projects的

過程中

，用戶可以在界面內(nèi)設(shè)定標(biāo)題、

自定義文件夾的顏色、上傳與項目相關(guān)的文件

，并編寫說明來指導(dǎo)ChatGPT如何最高效地協(xié)助用戶完成項

目。在項目內(nèi)部

，用戶可以即刻開啟聊天

，并通過側(cè)邊欄輕松地將過往的聊天記錄添加到項目中

，

同樣支持利用上下文信息來回答問題。聊天內(nèi)

容能夠保存在項目中

，便于支持用戶稍后繼續(xù)對話

，并清楚地知道在哪里查找所需內(nèi)容。DAY7：

Projects對話管理工具上

Projectsin

ChatGPT請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容圖23：Projects自動啟動Canvas并生成郵件資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖22：用戶可根據(jù)自身需求創(chuàng)建項目

搜索功能全新升級?

全方位體驗升級：用戶現(xiàn)在可以直接訪問嵌入式Y(jié)ouTube視頻、

圖片、

電影資源

，還能便捷地使用商業(yè)地圖和餐廳導(dǎo)航。在官方演示中

，演示者

只需與ChatGPT自然對話

，

ChatGPT便可自行判斷是否需要調(diào)用ChatGPT

，

同時

，

用戶也可以選擇開啟ChatGPT

search功能

。ChatGPT

search將自動根據(jù)要求總結(jié)網(wǎng)頁內(nèi)容

，并允許用戶追溯網(wǎng)站來源。?

移動設(shè)備的優(yōu)化體驗：針對移動設(shè)備

，

OpenAI根據(jù)用戶反饋優(yōu)化了聊天搜索的體驗。在官方演示中

，演示者搜索了Mission附近的墨西哥餐廳

，ChatGPT

search可自行進(jìn)行篩選

，并展示了路線、

網(wǎng)站、

電話和營業(yè)時間等詳細(xì)信息。用戶可進(jìn)一步提問哪些餐廳支持室外用餐

，

ChatGPTsearch可自行進(jìn)行下一步篩選

，并列示符合要求的選項

，用戶可點擊商家地址

，

即可調(diào)用蘋果地圖規(guī)劃路線。?

在Advance

Voice模式中集成

：可以在高級語音模式中使用搜索

，通過語音命令訪問最新的網(wǎng)絡(luò)信息

，增強了ChatGPT的交互性和便利性。在

官方演示中

，演示者通過語音向ChatGPT提問在12月23日蘇黎世有什么活動

，

ChatGPT可在搜索后語音進(jìn)行回復(fù)

，并支持用戶對感興趣的活動

進(jìn)一步提問

，如舉辦時間、地點、活動舉辦當(dāng)天的天氣等。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY8：

ChatGPT搜索功能更新圖24：用戶可在ChatGPT網(wǎng)站中直接播放來自YouTube的視頻圖25：通過ChatGPT

search調(diào)用蘋果地圖資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理?Function

calling

：允許開發(fā)者將外部API和數(shù)據(jù)庫連接到o1模型；?Structured

Outputs

：確保模型輸出遵循開發(fā)者定義的JSON模式

，使解析和使用模型輸出更加容易；?Developer

messages

：為模型指定指令

，例如定義語氣、風(fēng)格及其他行為；?

Vision

capabilities

：支持對圖像進(jìn)行推理

，解鎖科學(xué)、制造或編碼等領(lǐng)域中更多依賴視覺輸入的應(yīng)用；?Lower

latency：

o1在每個請求中平均使用比o1-preview少用60%的推理tokens；?Reasoning_effort：一個全新參數(shù)

，允許開發(fā)者控制模型在回答前思考的時間長度。DAY9：

o1正式版API全面上線

o1API全面開放請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容圖26：開發(fā)者可調(diào)用o1API尋找文檔中的錯誤資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖27：模型通過自定義格式輸出信息

o1在各領(lǐng)域性能顯著提升?

現(xiàn)場展示了對o1API調(diào)用的測試結(jié)果

，

o1在函數(shù)調(diào)用、

內(nèi)部結(jié)構(gòu)化輸出、數(shù)學(xué)、編程等領(lǐng)域均達(dá)到了目前所有模型的最高準(zhǔn)確度。?

在數(shù)學(xué)領(lǐng)域

，

OpenAI測試了經(jīng)過自定義輸出結(jié)果的o1模型（

o1with

Structured

Outputs）

，結(jié)果顯示其仍能保持極高的準(zhǔn)確度

，

因此開發(fā)者

對模型進(jìn)行自定義調(diào)整后

，模型仍能夠保持其性能。圖28：o1在函數(shù)調(diào)用領(lǐng)域準(zhǔn)確度明顯高于GPT4o圖29：o1在內(nèi)部結(jié)構(gòu)化輸出領(lǐng)域準(zhǔn)確度明顯高于GPT4o圖30：o1在編程領(lǐng)域準(zhǔn)確度明顯高于GPT4o圖31：o1在數(shù)學(xué)試題場景準(zhǔn)確度明顯高于GPT4o請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY9：

o1正式版API全面上線資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

實時API集成Web

RTC（網(wǎng)頁實時通信）?

實時API現(xiàn)在支持Web

RTC

，這將簡化實時語音體驗的構(gòu)建

，使得在各類平臺（包括基于瀏覽器的應(yīng)用、移動客戶端、物聯(lián)網(wǎng)設(shè)備或直接的服務(wù)

器到服務(wù)器部署）

上構(gòu)建和擴展實時語音產(chǎn)品更加容易。

通過Web

RTC

，

現(xiàn)在只需幾行Javascript代碼

，

開發(fā)者就能為應(yīng)用添加實時功能。Web

RTC提供了許多優(yōu)勢

，例如更好的網(wǎng)絡(luò)適應(yīng)性、

回聲消除和更簡單的代碼實現(xiàn)。

以及將GPT-4o音頻價格降低60%

，

同時將Realtime

API測

試版中引入GPT-4o

mini。?

在官方演示中

，演示者只需極短的代碼

，就可以在網(wǎng)頁端構(gòu)建一個語音助手。

同時

，僅需將網(wǎng)頁端與帶有音頻交互功能的玩具連接

，就可實現(xiàn)玩

具的語音交互功能。演示者提到

，后續(xù)開發(fā)者可自行將Realtime交互的應(yīng)用場景擴展到可穿戴設(shè)備、攝影等領(lǐng)域。圖32：開發(fā)者只需幾行代碼就可以調(diào)用Realtime

API

圖33：開發(fā)者只需幾行代碼就可以構(gòu)建網(wǎng)頁端語音助手請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY9：

o1正式版API全面上線資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

新微調(diào)方法Preference

Fine-Tuning?

偏好微調(diào)允許開發(fā)者通過提供成對的響應(yīng)來訓(xùn)練模型

，其中一個響應(yīng)比另一個響應(yīng)更受歡迎

，模型可自行學(xué)習(xí)

，并減少不受歡迎的輸出結(jié)果。與

監(jiān)督微調(diào)（提供確切的輸入和輸出）不同

，偏好微調(diào)側(cè)重于優(yōu)化模型以捕獲用戶偏好中的細(xì)微差別。通過微調(diào)

，開發(fā)者可以利用自己的數(shù)據(jù)集對

模型進(jìn)行訓(xùn)練

，從而提高模型在特定場景下的性能和準(zhǔn)確性。?

在官方演示中

，演示者提到Rogo

AI正通過偏好微調(diào)在構(gòu)建一款面向金融分析師的AI助手

，偏好微調(diào)使模型能夠更準(zhǔn)確的響應(yīng)準(zhǔn)確性從75%提升

至80%以上

，而監(jiān)督微調(diào)則無法達(dá)到準(zhǔn)確性提升的效果。圖34：偏好微調(diào)允許模型學(xué)習(xí)更受歡迎的響應(yīng)請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY9：

o1正式版API全面上線資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

通話訪問模式?

ChatGPT通話開放：

目前美國用戶可通過電話與ChatGPT溝通

，具體號碼為：

1-800-242-8478

，用戶可將其添加為手機聯(lián)系人

，通話會被審

查以確保安全。在官方演示中

，演示者通過直接撥入電話的方式接入ChatGPT

，并提問在舊金山的280號洲際公路上看到的圓頂房子是什么

，ChatGPT準(zhǔn)確回復(fù)房子的名字

，并進(jìn)行了簡短介紹

，

同時支持用戶對問題進(jìn)行進(jìn)一步溝通。用戶可以通過任何設(shè)備撥號連接ChatGPT

，包括非

智能手機、

固定電話等

，這意味著老年人也可以通過其老年機接入ChatGPT

，并獲得相應(yīng)回復(fù)。?

WhatsApp聊天

：全球范圍內(nèi)

，用戶可在WhatsApp上與ChatGPT聊天

，用戶可以像與聯(lián)系人中的任何人一樣

，通過文本輸入問題

，

即可獲得

基于4o-mini模型生成的回復(fù)。在官方演示中

，演示者通過WhatsApp詢問ChatGPT意面香蒜醬的制作方法

，

ChatGPT可生成詳細(xì)的制作方法

，

包括原材料、制作步驟等。

同時

，

ChatGPT能根據(jù)用戶的不同要求（如素食、特定飲食偏好等）更新食譜

，并回復(fù)相應(yīng)配菜建議。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY10：

ChatGPT通話訪問模式圖35：使用者可將ChatGPT添加到聯(lián)系人，并電話接入圖36：用戶可在WhatsApp中與ChatGPT直接聊天資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理?MacOS桌面應(yīng)用更新：

輕量級且資源占用少

，

擁有單獨窗口

，應(yīng)用時無需在不同的應(yīng)用程序、

窗口之間切換。

用

戶可通過快捷鍵快速調(diào)用ChatGPT

，

同時在對話窗口下方

，

用戶可點擊使用應(yīng)用程序的選項

，

ChatGPT可自動提

取已完成的工作進(jìn)度

，

用戶無需上傳任何信息即可與ChatGPT進(jìn)行交互。?

在官方演示中

，

演示者通過ChatGPT與正在運行的應(yīng)用程序Warp進(jìn)行協(xié)同

，

用戶可直接向ChatGPT提問編寫分

析每日指令數(shù)量的代碼

，

ChatGPT編寫完成后

，

只需粘貼至相應(yīng)應(yīng)用中即可。

同時

，

支持用戶在原有生成數(shù)據(jù)的

基礎(chǔ)上進(jìn)一步下達(dá)指令

，例如生成可視化圖表等。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY11：

桌面應(yīng)用新功能圖37：使用者可通過ChatGPT與正在運行的應(yīng)用協(xié)同資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖38：ChatGPT與Warp協(xié)同

強大的數(shù)學(xué)和編程能力?

編程能力：

o3在編程方面相較o1大幅提升。在SWE-bench

Verified基準(zhǔn)測試中

，

o3的準(zhǔn)確率達(dá)到了71.7%

，

比前輩o1高出20%以上。這意味

著

，

o3在編寫高質(zhì)量代碼方面

，

已經(jīng)超過了大多數(shù)軟件工程師。?

數(shù)學(xué)能力：在AI

2024

，

o3幾乎拿到了滿分

，這是AI在AI

EM數(shù)學(xué)競賽中取得的最好成績。

此外

，在GPQA

Diamond博士級科學(xué)考試中

，

的準(zhǔn)確率達(dá)到了87.7%

，

比o1高出近10%。這表明

，

o3在處理復(fù)雜數(shù)學(xué)問題時

，

已經(jīng)達(dá)到了頂尖水平。請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY12：

全新o3模型亮相資料來源：OpenAI

，國信證券經(jīng)濟研究所整理資料來源：OpenAI

，國信證券經(jīng)濟研究所整理圖40：o3在數(shù)學(xué)方面性能圖39：o3在編程方面性能

推理能力里程碑式突破?o3在ARC-AGI基準(zhǔn)測試中的表現(xiàn)尤為突出

，達(dá)到了87.5%的準(zhǔn)確率

，遠(yuǎn)超人類的85%閾值。ARC-AGI基準(zhǔn)測試旨在評估AI系統(tǒng)的抽象和推理能

力

，要求AI識別模式并解決新問題。

o3實現(xiàn)了AI領(lǐng)域第一次超越人類的成績

，完成了里程碑式的突破。圖41：o3在ARC-AGI測試表現(xiàn)請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY12：

全新o3模型亮相資料來源：OpenAI

，國信證券經(jīng)濟研究所整理

mini模型?o3

Mini是

o3系列中的高效推理模型

，適用于任何需要數(shù)學(xué)和編碼能力的人。

由于成本低

，

Mini可能會在全球范圍內(nèi)開放使用。

Mini支持低中高三種不同的推理時間選項

，可以根據(jù)自己的使用情況自由調(diào)整模型的推理時間。?

編程能力

：支持自適應(yīng)推理時間

，低中位數(shù)推理時間下代碼性能優(yōu)于o1

Mini

，在速度和成本方面出色。?

數(shù)學(xué)能力

：在AIME

2024測試中

，低推理選項與o1

Mini和o3

Mini性能相當(dāng)

，

中位數(shù)推理時間性能更好

，高推理可進(jìn)一步提升；延遲大幅減

少

，支持函數(shù)調(diào)用等功能

，性能優(yōu)于多數(shù)模型。圖42：o3mini在數(shù)學(xué)方面性能請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容DAY12：

全新o3模型亮相資料來源：OpenAI

，國信證券經(jīng)濟研究所整理?

OpenAI為o3引入了協(xié)商對齊（de

liberative

alignment）

的安全評估方法。這種方法可以讓模型在回答問題前明確回憶安全規(guī)范并準(zhǔn)確執(zhí)行推

理

，從而確保o3的行為符合OpenAI的安全政策

，使其保持良好的行為規(guī)范。

發(fā)布計劃?目前

，

o3還處于早期訪問階段

，僅對部分安全研究人員開放。?OpenAI計劃在2024年1月底推出o3-miniDAY12：

全新o3模型亮相

安全性請務(wù)必閱讀正文之后的免責(zé)聲明及其項下所有內(nèi)容 Open

12天發(fā)布會

風(fēng)險提示請務(wù)必閱讀

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

【國信證券】人工智能專題：Openai發(fā)布會梳理

文檔簡介

溫馨提示

最新文檔

評論

【國信證券】人工智能專題：Openai發(fā)布會梳理

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔