人工智能框架作為軟件根技術,已成為加速人工智能大模型開發(fā)、推動產(chǎn)業(yè)智能化發(fā)展的核心力量。3月22日, 以“為智而昇,思創(chuàng)之源”為主題的昇思人工智能框架峰會2024在北京國家會議中心舉辦,旨在匯聚AI產(chǎn)業(yè)界創(chuàng)新力量,推動根技術持續(xù)創(chuàng)新,共建人工智能開源新生態(tài)。
格靈深瞳作為昇思開源理事會成員受邀參加本次活動,格靈深瞳研發(fā)總監(jiān)潘玉峰在「昇思MindSpore產(chǎn)學研融合創(chuàng)新與應用論壇2024」上發(fā)表了題為《視覺大模型在各行業(yè)的創(chuàng)新與應用》的主題演講。
潘玉峰表示,預訓練大模型雖然帶來了算法層面的新變革,但同時也引入了一系列的工程化問題。一方面預訓練大模型對算力提出了更高的要求,并且要求基礎設施的迭代能隨時應對業(yè)務的需求,另一方面算力的堆疊不等同于性能的提升,而且因為AI算力成本較高,需要盡可能地榨干性能,以期得到充分的利用。因此,我們需要思考如何更高效地進行敏捷開發(fā),同時減弱與業(yè)務強耦合的工具開發(fā)。
而昇思MindSpore作為國內(nèi)主流開源框架,可以讓開發(fā)者更靈活地實現(xiàn)大模型創(chuàng)新,幫助我們加速大模型應用規(guī)模落地。潘玉峰提到,昇思MindSpore 加速了大規(guī)模預訓練模型的訓練過程,提供了更穩(wěn)定的算力基礎設施、更高的訓練性能以及更高的開發(fā)效率。
格靈深瞳使用 MindSpore 框架高效完成了預訓練大模型的開發(fā)和調(diào)試,并在華為的訓練卡上完成了訓練;此外,我們基于 MindSpore 框架針對業(yè)務需求對預訓練模型進行了微調(diào)后,可以為客戶提供適配到目標業(yè)務場景的模型;與此同時,MindSpore Lite極大簡化了推理工程化,借助 MindSpore Lite優(yōu)化過的 kernel 算子,在各算力平臺上實現(xiàn)了高吞吐、低時延的功耗推理,幫助我們提高了交付效率,加速了業(yè)務落地。
目前,格靈深瞳自研的大模型方案已經(jīng)在智慧金融等領域落地實踐,可為客戶提供高效的模型生產(chǎn)、高精度的算法能力和安全可靠的國產(chǎn)化解決方案。模型應用了先進的多模態(tài)弱監(jiān)督學習技術,可大大降低數(shù)據(jù)標注的成本,在少量樣本學習場景中,能顯著提升模型精確度,并擁有出色的零樣本泛化能力,輕松實現(xiàn)模型的冷啟動。同時,借助自主學習方案,用戶可迅速用行業(yè)數(shù)據(jù)進行模型微調(diào),打造滿足特定行業(yè)需求的垂直行業(yè)大模型。
審核編輯:劉清
-
人工智能
+關注
關注
1789文章
46368瀏覽量
236559 -
格靈深瞳
+關注
關注
1文章
42瀏覽量
5490 -
大模型
+關注
關注
2文章
2220瀏覽量
2242
原文標題:格靈深瞳受邀參加昇思人工智能框架峰會2024并發(fā)表主題演講
文章出處:【微信號:shentongzhineng,微信公眾號:格靈深瞳】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論