综合在线视频,午夜视频一区,日本免费在线播放,国产精品一区二区资源,国产精品免费aⅴ片在线观看,性感美女的诱惑,国产国语一级毛片全部

當前位置:首頁 > 24小時熱點 > 正文

中信證券:OpenAI發(fā)布草莓模型o1 通用推理能力顯著提升

【新澳门内部资料精准大全】
【2024澳门天天开好彩大全】
【管家婆一肖-一码-一中一特】
【澳门一肖一码必中一肖一码】
【2024澳门正版资料免费大全】
【澳门一肖一码100准免费资料】
【2024澳门特马今晚开奖】
【2024正版资料大全免费】
【2024澳门天天六开彩免费资料】
【澳门今晚必中一肖一码准确9995】
【澳门资料大全正版资料2024年免费】
【澳门2024正版资料免费公开】
【澳门天天开彩好正版挂牌】
【2024澳门天天六开彩免费资料】
【澳门一码一肖一特一中2024】
【澳门管家婆一肖一码100精准】
【澳门王中王100%的资料】
【今期澳门三肖三码开一码】
【2024澳门天天开好彩大全】
【2024一肖一码100精准大全】
【494949澳门今晚开什么】
【香港二四六开奖免费资料】
【澳门平特一肖100%免费】
【7777888888管家婆中特】
【2024澳门天天六开彩免费资料】
【2024澳彩管家婆资料传真】
【管家婆精准一肖一码100%l?】

智通財經(jīng)APP獲悉,中信證券發(fā)布研報稱,北京時間9月13日凌晨,OpenAI發(fā)布全新AI推理系列大模型o1。該系列模型通過引入大規(guī)模強化學習算法,將模型思維展現(xiàn)為思維鏈,從而顯著提高了模型通用推理能力和對齊效果。根據(jù)OpenAI官方測評,o1不僅在絕大多數(shù)推理任務(wù)中表現(xiàn)優(yōu)于GPT-4o,甚至在部分推理密集型基準測試中可與人類專家相媲美。推理性能提升的同時,o1系列模型推理算力需求大幅提升,o1-preview定價約為GPT-4o的12倍,后續(xù)降本值得關(guān)注。

投資層面看,盡管o1系列模型純文字輸出形式限制了其應(yīng)用場景,但是隨著底層算法能力提升帶來的通用推理能力的進步,中信證券認為AI爆款應(yīng)用有望從科研、編程等高價值場景起率先解鎖,軟件、互聯(lián)網(wǎng)有望率先受益。除去應(yīng)用端的投資機會,硬件端的需求也必然會隨著多模態(tài)的技術(shù)進步而不斷提高,中信證券仍然持續(xù)看好 AI 算力層面,尤其是得益于商業(yè)端逐步成熟而帶來的更多的 AI 推理側(cè)算力的機會。

中信證券主要觀點如下:

事項:

北京時間9月13日凌晨,全球AI產(chǎn)業(yè)領(lǐng)頭羊OpenAI正式發(fā)布一系列旨在專門解決復雜任務(wù)的全新AI推理大模型o1,即之前醞釀已久的草莓模型。根據(jù)OpenAI官方推特,o1系列模型將包括o1、o1-preview和o1-mini,其中o1-preview已開放使用,ChatGPT Plus和Team的用戶以及API使用等級達到5級(API付費超1000美元)的開發(fā)者已獲得該模型訪問權(quán)限,企業(yè)版和教育版的用戶預計將從9月16日起獲得該模型訪問權(quán)限。與此前The information、The medium等媒體報道基本一致,o1模型在功能、推理和性能表現(xiàn)上基本符合預期。

模型機理及評測效果:強化學習加持下編碼/數(shù)學/推理能力提升顯著。

根據(jù)OpenAI技術(shù)博客,o1模型在訓練過程中引入了大規(guī)模強化學習算法,從而加強了其執(zhí)行復雜推理任務(wù)的能力。而根據(jù)“Reinforcement learning: An introduction”(Sutton),強化學習起源于上世紀60年代,旨在通過獎懲機制讓智能體在復雜環(huán)境中最大限度獲得長期全局最優(yōu)收益。強化學習主要包括定義問題、選擇策略、學習價值函數(shù)(如Q學習)、模型控制和策略優(yōu)化等步驟。此前谷歌圍棋機器人AlphaGo的核心技術(shù)即為強化學習。在應(yīng)用該項技術(shù)后,o1系列模型的輸出過程與GPT系列模型存在顯著不同:o1系列模型會先用至多20~30秒產(chǎn)生較長的思維鏈再進行輸出,即先將復雜任務(wù)拆解為子任務(wù)進行分析,在匯總子任務(wù)結(jié)果后輸出最終結(jié)果,而非GPT系列模型立即開始生成的模式。根據(jù)OpenAI官網(wǎng),o1模型在理科測試、數(shù)學、編程等絕大多數(shù)推理任務(wù)中表現(xiàn)明顯優(yōu)于GPT-4o,甚至在部分推理密集型基準測試中o1模型的表現(xiàn)與人類專家相媲美。例如,在國際奧林匹克資格考試中,o1正確解答了83%的題目,而GPT-4o僅正確解答13%;在PhD水平科學問答測試中,o1和o1-preview表現(xiàn)均優(yōu)于人類專家與GPT-4o。

市場定位:安全性與推理能力顯著提升有望解鎖應(yīng)用,模型成本有待優(yōu)化。

根據(jù)OpenAI官方技術(shù)博客,思維鏈可有效提升模型的安全和對齊水平:1)思維鏈可清晰的展示模型思維;2)將模型行為策略整合到推理模型的思維鏈中,可以高效、穩(wěn)健地教導人類價值觀。我們認為,目前AI產(chǎn)業(yè)的主要矛盾是推理能力不足和成本過高導致的爆款應(yīng)用匱乏。而在安全性有保障的前提下,推理能力的顯著提升使得o1有望逐步解鎖應(yīng)用。但由于龐大的推理算力需求導致的高成本和純文字反饋的輸出形態(tài),我們預計短期內(nèi)o1的應(yīng)用場景仍將集中于編程和科研等特定高價值生產(chǎn)力場景,OpenAI官方亦推出了更加擅長編程的且更便宜的推理模型o1-mini。根據(jù)OpenAI官網(wǎng),o1-preview定價為輸入端15美元/百萬token,輸出端60美元/百萬token;o1-mini的定價為輸入端3美元/百萬token,輸出端12美元/百萬token;GPT-4o的定價為輸入端1.25美元/百萬token,輸出端為5美元/百萬token。當前GitHub Copilot團隊版和企業(yè)版官網(wǎng)定價分別為4美元和21美元每月,我們認為o1模型的后續(xù)成本優(yōu)化值得關(guān)注。

趨勢展望:推理階段有望遵循Scaling Law,多模型配合值得關(guān)注。

在研發(fā)o1模型時,OpenAI發(fā)現(xiàn)給予模型更多的推理時間可有效提高模型的性能,即推理階段的Scaling Law。這一發(fā)現(xiàn)在一定程度上意味著推理端的算力需求有望迎來蓬勃增長。同時目前o1系列模型的訪問限制也從側(cè)面證明了模型算力需求之旺盛。根據(jù)OpenAI官網(wǎng),目前o1-preview使用限制為每周30條,o1-mini為每周50條。此外,我們認為,應(yīng)用層面的多模型配合亦值得關(guān)注。根據(jù)“Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models”(Jinliang Lu, Ziliang Pang, Min Xiao等),多模型協(xié)作具有整體性能提升、多任務(wù)處理能力增強、計算效率提升、錯誤與幻覺減少、知識共享與能力遷移等優(yōu)勢。多模型協(xié)作既可發(fā)生在大模型之間,也可發(fā)生在大模型與小模型之間。多模型協(xié)作策略可分為融合、集成和合作三種,其中合作方法下不同模型兼容度最高最為靈活,可創(chuàng)造出更加全面高效的AI系統(tǒng),因此具備相當潛力。

風險因素:

AI核心技術(shù)發(fā)展不及預期風險;科技領(lǐng)域政策監(jiān)管持續(xù)收緊風險;私有數(shù)據(jù)相關(guān)的政策監(jiān)管風險;全球宏觀經(jīng)濟復蘇不及預期風險;宏觀經(jīng)濟波動導致歐美企業(yè)IT支出不及預期風險;AI潛在倫理、道德、用戶隱私風險;企業(yè)數(shù)據(jù)泄露、信息安全風險;行業(yè)競爭持續(xù)加劇風險等。

投資策略:

本次o1系列模型的更新仍然是圍繞底層算法層面,尤其是大語言模型的推理能力。從技術(shù)角度,o1系列大模型的基礎(chǔ)能力在大規(guī)模強化學習方法加持下在得到顯著提升,不僅證明了在scale繼續(xù)堆規(guī)模和訓練計算投入的道路上仍有不斷的迭代空間,更表明推理階段有望繼續(xù)遵循Scaling Law,從而帶來推理端算力需求的大幅增長。應(yīng)用層面,盡管o1系列模型僅有文字輸出能力限制了其應(yīng)用場景的開闊,但是隨著底層算法能力提升帶來的通用推理能力的進步,我們認為AI爆款應(yīng)用有望從科研、編程等高價值場景起率先解鎖,軟件、互聯(lián)網(wǎng)有望率先受益。除去應(yīng)用端的投資機會,硬件端的需求也必然會隨著多模態(tài)的技術(shù)進步而不斷提高,我們?nèi)匀怀掷m(xù)看好 AI 算力層面,尤其是得益于商業(yè)端逐步成熟而帶來的更多的 AI 推理側(cè)算力的機會。

【免責聲明】本文僅代表作者本人觀點,與和訊網(wǎng)無關(guān)。和訊網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:[email protected]