2023年,以基于GPT模型對話應用為代表的生成式AI浪潮席卷全球,引起企業(yè)廣泛關注。自此,由生成式AI引導的企業(yè)變革序幕全面展開,企業(yè)向數(shù)智化轉型邁出了堅實的一步。
西門子股份公司(以下簡稱“西門子”)是一家專注于工業(yè)、基礎設施、交通和醫(yī)療領域的科技公司。從更高效節(jié)能的工廠、更具韌性的供應鏈、更智能的樓宇和電網(wǎng),到更清潔、更舒適的交通以及先進的醫(yī)療系統(tǒng),西門子致力于讓科技有為,為客戶創(chuàng)造價值。
出于企業(yè)戰(zhàn)略考慮,在結合業(yè)務具體需求的前提下,西門子中國與亞馬遜云科技合作開發(fā)了基于生成式人工智能技術的智能會話機器人“小禹”,在生成式AI領域邁出了可喜的一步。目前,西門子中國使用的亞馬遜云科技服務包括:Amazon EKS、Amazon RDS、Amazon Lambda、Amazon S3、Amazon OpenSearch Service、Amazon ElastiCache、Amazon SageMaker等。
機會:運用生成式AI之力
打破數(shù)據(jù)孤島,重塑數(shù)據(jù)價值
作為一家擁有全球視野、獨具未來前瞻思考的公司,西門子中國認為科技創(chuàng)新是企業(yè)韌性成長、保持領先的關鍵。因此,如何運用新興科技更好地發(fā)掘數(shù)據(jù)價值,是西門子中國持續(xù)發(fā)力的方向。西門子中國大禹團隊應用大數(shù)據(jù)技術、機器學習、云技術、低代碼來組建數(shù)據(jù)分析系統(tǒng),專注于創(chuàng)新領域,借助AI能力更好地發(fā)揮數(shù)據(jù)的價值。
在構建知識庫的過程中,大禹團隊通過調(diào)研認識到,長期以來企業(yè)內(nèi)部資源的檢索和調(diào)用都存在結構散亂、檢索速度慢、交互不便等問題。由于橫跨多個不同領域、涉及多個不同業(yè)務單元,如若以傳統(tǒng)方式打造知識庫,這些問題將一直是橫亙在部門間的長久之痛。因此,大禹團隊決定將大數(shù)據(jù)庫和生成式AI應用于一個全新的“智能知識庫”,從根本上提升知識庫的可用性。
長期以來亞馬遜云科技一直是西門子中國的重要合作伙伴,雙方在多個項目上有著緊密合作,因此,西門子大禹團隊決定再度與亞馬遜云科技攜手,在亞馬遜云的技術支持下,開發(fā)這款為西門子中國量身打造的以人工智能生成的方式進行交互的智能聊天機器人。
解決方案:高完成度解決方案指南,
生成式對話機器人小禹敏捷落地
由于公司體量龐大,智能數(shù)據(jù)庫的構建需面向多個不同業(yè)務部門,勢必涉及大量的業(yè)務數(shù)據(jù)和文本數(shù)據(jù)。因此,智能知識庫的存儲架構,成為亞馬遜云科技設計智能知識庫時的首要考慮。
亞馬遜云科技認為,智能知識庫的架構設計,實質(zhì)上是大語言模型(LLM,Large Language Model)在知識檢索領域如何得到充分利用的問題。以往要讓LLM在特定領域發(fā)揮作用,通常依靠的方法是提示工程(Prompt Engineering),通過不斷完善提問關鍵字,獲得對大語言模型的深入理解。但提示工程在知識庫這種相對具體的應用場合,效果不甚理想,對模型進行微調(diào)(Fine-tune)又可能導致成本過高。為此,亞馬遜云科技決定采取檢索增強生成(RAG,Retrieval Augment Generation)方式增強模型,使之具有來自存檔知識源的增強上下文的模型架構。
通過深思熟慮,最終亞馬遜云科技為大禹團隊提供的,是一個智能知識庫暨智能會話機器人的解決方案指南,其中包括預訓練大語言模型,Amazon OpenSearch Service的向量數(shù)據(jù)服務,以及相關系統(tǒng)集成等。該解決方案指南具備自然語言處理能力、知識庫檢索能力、甚至是以數(shù)據(jù)去訓練大語言模型的能力,這些核心關鍵能力讓解決方案指南能實現(xiàn)目標知識庫約80%功能,西門子中國根據(jù)企業(yè)內(nèi)部需求再做20%定制化開發(fā),最終形成完整的解決方案。
整個解決方案指南中,最大的亮點在于“RAG架構+向量數(shù)據(jù)庫”設計:核心主體知識庫以向量方式構建,能夠存儲超大規(guī)模的向量數(shù)據(jù)。通過對數(shù)據(jù)進行向量嵌入處理,跨部門、跨業(yè)務、跨場景的數(shù)據(jù)之間也能夠進行關系考量。而Amazon OpenSearch Service的k近鄰(kNN)插件為它提供了核心向量數(shù)據(jù)庫功能,現(xiàn)在向量嵌入可以與單個混合請求中基于文本的關鍵字組合,查詢時在幾毫秒內(nèi)就可獲得數(shù)十億向量的上下文相關響應。
另一方面,RAG架構極大地拓展了大模型的可用性。普通情況下當知識庫新增內(nèi)容時,相應的大模型必須進行微調(diào),甚至是重新訓練。而RAG允許對新增部分使用相同的模型處理,無需調(diào)整模型。這就相當于知識庫在不影響訪問速度的前提下,擁有了近乎無限的可擴展性。由向量數(shù)據(jù)庫保障的杰出性能,再加上RAG架構提供的無限潛力,這就是智能會話機器人“小禹”能夠在用戶以簡單語言進行提問的前提下,快速反饋生成式回答的秘密。
并且,由于亞馬遜云科技提供了包括向量數(shù)據(jù)庫、生成式AI在內(nèi)的一系列核心技術,整個解決方案指南完成度高達80%,而Amazon OpenSearch Service的無服務器特性,讓開發(fā)人員不需要管理集群或擔心生產(chǎn)規(guī)模,可以快速推動部署。
Amazon SageMaker也為架構的伸縮性以及大語言模型持續(xù)迭代提供了很大幫助。借助SageMaker Endpoint的彈性伸縮能力,系統(tǒng)可以自動按照負載調(diào)整用于實時推理的資源,保證訪問需求的同時提升整體性價比。Amazon SageMaker上提供了豐富的模型開發(fā)和訓練工具,保證客戶可以在云端輕松實現(xiàn)大語言模型的調(diào)優(yōu)以及測試更多不同類型的開源模型。
最終大禹團隊完成后續(xù)開發(fā)和整套系統(tǒng)的部署時間大大縮短,整體開發(fā)與部署僅用三個月就圓滿完成。
大模型對于很多企業(yè)用戶而言都是新生事物,從接受、熟悉到使用大模型,往往是一個漫長的過程。亞馬遜云科技不僅為企業(yè)客戶提供充裕的多樣化算力、以及包括向量數(shù)據(jù)服務在內(nèi)的數(shù)據(jù)基礎設施來滿足和支撐大模型,更提供解決方案指南并與企業(yè)用戶共同進行后續(xù)開發(fā)。這讓客戶無需再花費時間在重復性的基礎建設上,從而能夠在非常短的時間內(nèi)把垂直的、定制化的企業(yè)解決方案落地并投入應用。這在人工智能高速發(fā)展,日新月異的今天,有重要的意義。
業(yè)務成果:首周超過4000用戶使用,12000個問題被解答
相對于傳統(tǒng)機器人,“小禹”智能會話機器人的回答內(nèi)容不僅生成速度更快,其對搜索關鍵詞的命中率也更高,整體使用體驗遠超傳統(tǒng)機器人。
西門子中國專屬智能知識庫上線后,首周就有超過4000位內(nèi)部用戶參與使用,超過12000個問題被提出并解答。作為智能知識庫,它不但解決了各業(yè)務部門之間需求相似、重復開發(fā)的問題,更以云上彈性資源和托管的Amazon OpenSearch Service、Amazon SageMaker等服務節(jié)約了系統(tǒng)在運維和擴展方面的投入成本。后續(xù)西門子大禹團隊仍將不斷完善智能知識庫與“小禹”智能會話機器人,與亞馬遜云科技團隊以“聯(lián)合創(chuàng)新”模式合作,共同探討產(chǎn)品所需要的功能和實現(xiàn)方法,打造更優(yōu)秀的產(chǎn)品功能與體驗。
未來,西門子中國將與亞馬遜云科技在人工智能領域展開更為深度的合作,在數(shù)字孿生、工業(yè)元宇宙等多個方面進一步發(fā)揮人工智能的作用。此前亞馬遜云科技的一些產(chǎn)品和功能已被運用到西門子中國成都燈塔工廠,用于廢料分揀、產(chǎn)品自檢等關鍵的生產(chǎn)制造環(huán)節(jié)??梢韵胂裨趯?,人工智能技術一定能夠以多種多樣的方式,發(fā)揮更大價值。
審核編輯 黃宇
-
AI
+關注
關注
87文章
29359瀏覽量
267643 -
亞馬遜
+關注
關注
8文章
2612瀏覽量
83022 -
大模型
+關注
關注
2文章
2206瀏覽量
2229
發(fā)布評論請先 登錄
相關推薦
評論