11月30日,由深度學(xué)習技術(shù)及應用國家工程研究中心主辦的WAVE SUMMIT+ 2022深度學(xué)習開(kāi)發(fā)者峰會(huì )上,百度文心大模型再次升級,包括新增11個(gè)大模型,大模型總量增至36個(gè),構建起業(yè)界規模最大的產(chǎn)業(yè)大模型體系。
【資料圖】
不久前,百度聯(lián)合人民網(wǎng)發(fā)布媒體行業(yè)大模型“人民網(wǎng)-百度·文心”,這是領(lǐng)先的大模型技術(shù)在傳媒行業(yè)的首次嘗試,旨在順應內容與技術(shù)發(fā)展,打造全媒體時(shí)代內容科技創(chuàng )新引擎。
人民網(wǎng)-百度·文心大模型基于文心大模型ERNIE3.0,引入人民網(wǎng)在傳媒行業(yè)積淀的行業(yè)知識與任務(wù)樣本數據,結合雙方在預訓練大模型技術(shù)和傳媒領(lǐng)域業(yè)務(wù)與算法的經(jīng)驗打造。
人工智能是基礎設施,大模型已成為新方向
近些年來(lái),人工智能的應用日益廣泛,“十四五”期間,我國媒體融合發(fā)展進(jìn)入新階段,雖然不同層級和形態(tài)的媒體深度融合、整體轉型形式多樣,但引入先進(jìn)的互聯(lián)網(wǎng)技術(shù)已成為行業(yè)共識。5G、大數據、云計算、人工智能等新技術(shù)被應用到新聞采編播發(fā)的各個(gè)環(huán)節,成為媒體智能化的基礎設施。
從內容發(fā)展形態(tài)來(lái)看,當下從文字到圖文到視頻,多模態(tài)的內容形式已成為常態(tài),傳播路徑越來(lái)越短,傳播速度越來(lái)越快。與之相伴的是,以移動(dòng)終端為傳播介質(zhì)的新媒體成為傳媒輿論的主陣地,傳播形態(tài)和介質(zhì)的變化導致新聞傳播規則和評價(jià)標準隨之改變。
對傳統媒體來(lái)說(shuō),加碼技術(shù)領(lǐng)域的投入迫在眉睫。從技術(shù)發(fā)展趨勢來(lái)看,隨著(zhù)數據井噴、算法進(jìn)步以及算力突破,預訓練大模型已成為人工智能發(fā)展的新方向,基于大規模知識和海量無(wú)結構數據融合學(xué)習、深度學(xué)習,在多模態(tài)內容理解上具備更強的能力,在內容生成上也有更好的表現,可以進(jìn)一步提升內容創(chuàng )作效率,促進(jìn)內容生態(tài)繁榮。
在媒體轉型浪潮的初期,“造不如買(mǎi)、買(mǎi)不如租”是大多數媒體的選擇,隨著(zhù)改革的深入,自主開(kāi)發(fā)受到不少媒體的青睞,但是“造游艇”和“造航母”,畢竟完全不在一個(gè)數量級上,預訓練大模型雖然作用巨大、前景廣闊,但受技術(shù)復雜、研發(fā)周期長(cháng)、投入成本高等因素的制約,絕大部分媒體都不可能獨自踏入這條賽道。
以百度為代表的大模型生產(chǎn)企業(yè),在大模型能力、海量數據、大規模算力等方面具有優(yōu)勢,能夠根據AI應用方的需求,自動(dòng)化、標準化地進(jìn)行多場(chǎng)景多領(lǐng)域的模型生產(chǎn),當達到一定規模時(shí),即可形成健康、可持續發(fā)展的大模型產(chǎn)業(yè)模式。
“具有算法、算力和數據綜合優(yōu)勢的企業(yè),可以將模型生產(chǎn)的復雜過(guò)程封裝起來(lái),通過(guò)低門(mén)檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)?!卑俣仁紫夹g(shù)官、深度學(xué)習技術(shù)及應用國家工程研究中心主任王海峰指出,如此一來(lái),大數據、大算力、大模型能力僅需少數企業(yè)操心,千行百業(yè)直接應用AI模型即可。
王海峰提出的這條產(chǎn)業(yè)化路徑,是媒體轉型過(guò)程中一種可行的模式。龐雜的系統和復雜的研發(fā)流程,對以?xún)热菀?jiàn)長(cháng)的傳統媒體來(lái)說(shuō),不啻于一座大山,唯有借助合作伙伴的力量才有可能翻越。
值得一提的是,文心大模型與媒體行業(yè)的結合已經(jīng)在一些場(chǎng)景上帶來(lái)了新模式。傳媒內參從百度方面獲悉,部分媒體“策、采、編、發(fā)”各個(gè)環(huán)節已采用人機協(xié)作的模式工作。此外,2022年北京冬奧會(huì ),大模型作為底層技術(shù)支持的AI數字人作為手語(yǔ)主播,為超過(guò)兩千萬(wàn)的聽(tīng)障人士觀(guān)看觀(guān)賽提供了高效、高質(zhì)量的服務(wù)。
內容與技術(shù)的牽手:人工智能加持傳媒、大模型顯著(zhù)提升行業(yè)效率
作為傳媒領(lǐng)域的AI基礎設施,百度與人民網(wǎng)計劃基于人民網(wǎng)-百度·文心大模型,打造全媒體時(shí)代內容科技創(chuàng )新引擎,通過(guò)集約化的大模型建設,實(shí)現以一個(gè)傳媒行業(yè)大模型底座支持多個(gè)細分業(yè)務(wù)場(chǎng)景應用,加快傳媒行業(yè)融合發(fā)展的步伐。
在百度文心大模型的技術(shù)加持下,人民網(wǎng)首批將自主可控的大模型應用于業(yè)務(wù)之中,將打造全媒體時(shí)代內容科技創(chuàng )新引擎,引領(lǐng)媒體行業(yè)的AI應用新方向。
在技術(shù)方面,以人民網(wǎng)-百度·文心大模型替換原有模型,在各類(lèi)NLP(自然語(yǔ)言處理)場(chǎng)景上,顯著(zhù)提升功能效果;在應用方面,集約化建設AI能力,突破效果瓶頸,實(shí)現更多傳媒業(yè)務(wù)場(chǎng)景的降本增效,如應用于文章摘要生成等內容生成類(lèi)場(chǎng)景。
人民網(wǎng)-百度·文心大模型已應用于人民網(wǎng)的新聞?wù)巿蟾嫔?、新聞內容審核分?lèi)、輿情分析等重要場(chǎng)景上,取得了比較明顯的效果提升,大幅領(lǐng)先業(yè)界其他模型。
未來(lái)該模型還將用于新聞事件抽取分析、新聞評論聚合分析、新聞信息個(gè)性化推薦等更多領(lǐng)域,全面提升大模型對傳媒領(lǐng)域任務(wù)的適配能力,加快傳媒行業(yè)融合發(fā)展步伐。
百度集團副總裁、深度學(xué)習技術(shù)及應用國家工程研究中心副主任吳甜表示,百度與人民網(wǎng)的合作由來(lái)已久,此次聯(lián)合發(fā)布媒體行業(yè)大模型,是人工智能前沿技術(shù)在媒體行業(yè)的最新實(shí)踐成果。
人民網(wǎng)輿情數據中心相關(guān)負責人表示,人民網(wǎng)輿情數據中心一直著(zhù)力打造“輿情領(lǐng)航者”、“數據國家隊”和“數字經(jīng)濟高端智庫”,依托人民網(wǎng)在內容科技戰略上的整體布局,積極探索AI技術(shù)在輿情場(chǎng)景的應用,推動(dòng)輿情服務(wù)由人力密集型向智能密集型轉變。希望此次與百度在傳媒行業(yè)大模型的共建中能發(fā)揮雙方優(yōu)勢,加速人工智能新技術(shù)在媒體行業(yè)落地。
大模型背后的底氣:技術(shù)賦能多個(gè)行業(yè)、應用版圖不斷擴大
文心大模型是百度自主研發(fā)的產(chǎn)業(yè)級知識增強大模型體系,全景圖由模型層、工具與平臺層、產(chǎn)品與社區層構成。
在模型層,文心大模型已經(jīng)包括36個(gè)大模型,涵蓋基礎大模型、任務(wù)大模型、行業(yè)大模型的三級體系,全面滿(mǎn)足產(chǎn)業(yè)應用需求,構建了業(yè)界規模最大的產(chǎn)業(yè)大模型體系;在工具與平臺層,通過(guò)大模型開(kāi)發(fā)套件、文心API和提供全流程開(kāi)箱即用大模型能力的EasyDL和BML開(kāi)發(fā)平臺,全方位降低應用門(mén)檻;產(chǎn)品與社區層,包括AI藝術(shù)與輔助創(chuàng )作平臺“文心一格”、產(chǎn)業(yè)級搜索系統“文心百中”和旸谷社區,讓更多人零距離感受到最先進(jìn)的AI大模型技術(shù)帶來(lái)的新體驗。
以ERNIE為代表的基礎大模型是文心大模型最重要的基礎,也是百度開(kāi)展的歷史最悠久的模型。從2019年至今,ERNIE已經(jīng)迭代到了3.0版本,每一個(gè)大版本都有基礎技術(shù)的創(chuàng )新。人民網(wǎng)-百度·文心大模型正是基于文心ERNIE 3.0打造。
作為百億參數知識增強的大模型,文心ERNIE 3.0首次在百億級預訓練模型中引入大規模知識圖譜,促進(jìn)了結構化知識和無(wú)結構文本之間的信息共享,大幅提升了模型對于知識的記憶和推理能力。相比較于沒(méi)有知識增強的大模型,文心大模型的學(xué)習效率更高,且在實(shí)體問(wèn)答、知識預測、可控文本生成等多個(gè)場(chǎng)景上擁有更好的效果。
文心大模型在產(chǎn)業(yè)應用過(guò)程中打磨技術(shù),并致力于持續降低應用門(mén)檻,推動(dòng)產(chǎn)業(yè)智能化升級。
目前,文心大模型已大規模應用于百度搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,顯著(zhù)提升了百度的產(chǎn)品效果和用戶(hù)體驗。從外部落地應用來(lái)看,文心大模型已通過(guò)飛槳開(kāi)源開(kāi)放平臺、百度智能云等賦能到工業(yè)、能源、金融、通信、媒體、教育等多個(gè)行業(yè)。
在媒體行業(yè),文心大模型的理解和生成創(chuàng )作能力激發(fā)創(chuàng )意,提升內容多樣性,可降低制作成本;在保險領(lǐng)域應用中,文心大模型的智能解析能力,能使文本處理效率提升30倍;在醫療領(lǐng)域應用中,文心大模型將每份病歷的檢查時(shí)間,從30分鐘縮短到了秒級別……
從技術(shù)研發(fā)到落地應用,大模型發(fā)展已經(jīng)進(jìn)入產(chǎn)業(yè)落地的關(guān)鍵期,與產(chǎn)業(yè)場(chǎng)景需求的高度契合是大模型真正助力產(chǎn)業(yè)發(fā)展的重要前提。聯(lián)合行業(yè)頭部企業(yè)研制行業(yè)大模型就是百度文心的重要實(shí)踐。隨著(zhù)人民網(wǎng)的加入,文心大模型再添新成員,應用版圖進(jìn)一步擴大。截至目前,文心已累計發(fā)布11個(gè)行業(yè)大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,實(shí)現顯著(zhù)的效果提升,產(chǎn)業(yè)生態(tài)初步形成。
責任編輯:李楠
分享到:版權聲明:凡注明來(lái)源“流媒體網(wǎng)”的文章,版權均屬流媒體網(wǎng)所有,轉載需注明出處。非本站出處的文章為轉載,觀(guān)點(diǎn)供業(yè)內參考,不代表本站觀(guān)點(diǎn)。文中圖片均來(lái)源于網(wǎng)絡(luò )收集整理,僅供學(xué)習交流,版權歸原作者所有。如涉及侵權,請及時(shí)聯(lián)系我們刪除!