從風(fēng)火輪到內(nèi)容處理
微軟AI能做哪些超乎想象的工作?
設(shè)計一款新玩具、總結(jié)一次會議、創(chuàng)作一則內(nèi)容……這些以往必須由專業(yè)人員處理的工作內(nèi)容現(xiàn)在可以完全交給AI系統(tǒng),AI不止可以為設(shè)計者提供無窮的創(chuàng)意,可以將自然語言轉(zhuǎn)化成最終作品,還可以根據(jù)每個不同的對象生成個性化圖像和內(nèi)容,極大提升生產(chǎn)力和創(chuàng)作力,現(xiàn)在就讓我們一起來看看強大的微軟AI為各行各業(yè)做出的那些令人驚嘆的事情。
最近美泰玩具公司的設(shè)計師們被要求設(shè)計一款新的風(fēng)火輪模型車時,他們從DALL?E 2中尋找靈感。DALL?E 2是一個由OpenAI開發(fā)的AI系統(tǒng),可以根據(jù)簡單的語言描述內(nèi)容量身定做圖像和藝術(shù)作品。
使用該工具時,設(shè)計師可以輸入一條指示,如“一輛老爺車的縮尺模型”,然后DALL?E 2會生成一個玩具古董車的圖像,也許會是銀色的車身加白壁輪胎。
下一步,設(shè)計者可以擦除車頂,然后輸入“變成敞篷車”,DALL?E 2會將汽車圖像更新為敞篷車。設(shè)計師可以繼續(xù)調(diào)整設(shè)計,要求DALL?E 2把車涂成粉色或藍(lán)色,打開敞篷等等。
在面向開發(fā)者和信息技術(shù)專業(yè)人士的Ignite大會上,微軟宣布DALL?E 21將加入全球Azure平臺上的 OpenAI服務(wù),先期受邀請的AzureAI客戶可以使用文本或圖像生成自定義圖像。
微軟表示,通過Azure OpenAI服務(wù)2提供的DALL?E 2為美泰這樣的客戶提供了AI的云基礎(chǔ)設(shè)施,有機(jī)結(jié)合了文本到圖象生成技術(shù)的前沿創(chuàng)新和Azure云平臺的合規(guī)性及負(fù)責(zé)任的AI護(hù)欄與認(rèn)證。
美泰公司的設(shè)計師們能夠生成幾十張圖片,每一次迭代都能激發(fā)和打磨創(chuàng)意,有助于設(shè)計出一個新的風(fēng)火輪汽車模型的內(nèi)容詳實的最終效果圖。
加利福尼亞州埃爾塞貢多市美泰未來實驗室的產(chǎn)品設(shè)計總監(jiān)卡麗·布斯表示:“人們會感嘆‘噢,我怎么沒有想到這個!’”。她把AI技術(shù)視為一種幫助設(shè)計師產(chǎn)生更多創(chuàng)意的工具。她提到:“追根究底,質(zhì)量是最重要的,但有時積累數(shù)量可以得到質(zhì)量。”
微軟也正在將DALL?E 2整合到其面向消費者的應(yīng)用程序和服務(wù)中,從新宣布的微軟Designer3應(yīng)用程序開始,很快它將被并入到微軟必應(yīng)的Image Creator中。
在微軟產(chǎn)品和服務(wù)中推出DALL?E 2反映了該公司在AI研究方面的投資是如何將AI注入其創(chuàng)造、生產(chǎn)和發(fā)行的多個方面,以幫助每個人提高生產(chǎn)力和創(chuàng)新力。
在過去的一年半時間里,我們已經(jīng)看到了這種技術(shù)已經(jīng)漸漸應(yīng)用到對最終用戶有用的實際場景和流程中。
這一趨勢是AI能力取得非線性突破的結(jié)果,而突破來自于將更多的計算帶入到更多的數(shù)據(jù)來訓(xùn)練更豐富更強大的模型。
模型的力量已經(jīng)跨過了質(zhì)的門檻,現(xiàn)在它們在更多的應(yīng)用中發(fā)揮作用。我們現(xiàn)在看到的另一個趨勢是,所有的產(chǎn)品開發(fā)者都開始認(rèn)真思考他們可以如何在其產(chǎn)品中使用AI,既是為了方便操作也是為了說“哦,如使用AI,我的產(chǎn)品能有更好表現(xiàn)?!?/span>
埃里克·博伊德
微軟公司負(fù)責(zé)AI平臺副總裁
DALL?E 2的訓(xùn)練是在微軟為OpenAI專門打造的一臺托管在Azure的超級計算機(jī)進(jìn)行的。同一臺Azure超級計算機(jī)還被用來訓(xùn)練OpenAI的GPT-3自然語言模型和Codex,該模型為編程工具GitHub Copilot和微軟Power Apps中使用Azure OpenAI的某些功能提供了支持4。Azure使這些AI工具能夠迅速生成圖像、文本或代碼建議,供用戶參考和借鑒。
DALL?E 2的加入建立在微軟和OpenAI持續(xù)合作5的基礎(chǔ)上,并擴(kuò)寬了Azure OpenAI服務(wù)內(nèi)的使用案例的豐富能力。處于預(yù)覽階段的Azure OpenAI服務(wù)是Azure認(rèn)知服務(wù)系列的最新產(chǎn)品,它提供了內(nèi)置于微軟Azure的安全性、可靠性、合規(guī)性、數(shù)據(jù)保密和其它企業(yè)級功能。
由微軟開發(fā)并通過Azure認(rèn)知服務(wù)6提供的其它AI技術(shù),如語言翻譯、語音轉(zhuǎn)錄、光學(xué)字符識別和文檔摘要,也出現(xiàn)在微軟Teams7、微軟Power Platform8和微軟3659等產(chǎn)品和服務(wù)中。
微軟公司業(yè)務(wù)應(yīng)用和平臺副總裁查爾斯·拉曼納說:“在過去的一年半時間里,我們已經(jīng)看到了這種技術(shù)已經(jīng)漸漸應(yīng)用到對最終用戶有用的實際場景和流程中?!薄斑@是這些大型語言模型的產(chǎn)品化?!?/span>
收到老板的電子郵件時,
向我的手機(jī)發(fā)送一條短信。
拉曼納說,這些AI功能旨在卸除繁瑣的工作,使員工能夠?qū)W⒂谟懈邇r值的任務(wù),比如讓銷售人員與客戶交談時10無需做筆記。這些新工具還可以將目前占用人們工作日數(shù)小時時間的流程自動化,如撰寫銷售電話的總結(jié)并將總結(jié)添加到客戶數(shù)據(jù)庫中。
拉曼納表示:“現(xiàn)在我們可以注入AI的能力,讓AI聽取對話并通過轉(zhuǎn)錄文字、記錄行動項目、進(jìn)行總結(jié)會議、識別常用短語或分析‘我是一個好的傾聽者嗎?’來幫助人們提高產(chǎn)出效率。”“這需要使用最新的AI能力并升級數(shù)字協(xié)作工具。”
拉曼納專注于打造出使任何擁有計算設(shè)備的人都能使用微軟Power Platform創(chuàng)建自己的由AI驅(qū)動的應(yīng)用程序的工具。例如,他的團(tuán)隊正在Power Automate中推出一項具有AI輔助功能的性能11,讓人們能夠使用自然語言來建立鏈接微軟云中運行的各種服務(wù)的工作流程。
拉曼納解釋道:“用戶可以說,‘嘿,收到老板的電子郵件時,給我的手機(jī)發(fā)一條短信,并在我的Outlook里放置一個待辦事項。’”只要他們發(fā)話,它就會自動生成。
他說,這種將一句話變成工作流程的能力極大地增加了能夠提供AI軟件解決方案的人數(shù)。他又補充道,擁有更多技術(shù)知識的人可以利用微軟動力平臺中的低代碼工具和圖形界面,如AI Builder中的智能文檔處理技術(shù)12,進(jìn)一步定制和完善他們的應(yīng)用程序。
律師可以利用這項技術(shù)定制一個應(yīng)用程序,每當(dāng)有新的合同上傳到公司的門戶站點SharePoint網(wǎng)站時就會被啟動。這個應(yīng)用程序可以提煉關(guān)鍵信息,如誰擬的合同、關(guān)聯(lián)方和行業(yè)部門,然后通過電子郵件將合同的摘要和這些細(xì)節(jié)信息發(fā)送給公司里負(fù)責(zé)該行業(yè)部門或客戶的律師。
在將這種AI自動化工作流程與今日完成此類任務(wù)的常規(guī)方式進(jìn)行對比時,拉曼納說:“這有點神奇”?!澳悴榭碨harePoint網(wǎng)站,打開了一個新文件,然后瀏覽文件作總結(jié),來看看是否與你有關(guān)。AI正在幫助人們擺脫這種單調(diào)任務(wù),讓計算機(jī)做對人們最有利的事情?!?/span>
內(nèi)容AI
過去幾年的數(shù)字化轉(zhuǎn)型讓世界各地的人們生產(chǎn)的內(nèi)容更加泛濫。例如,微軟客戶現(xiàn)在每天向Microsoft 365 添加約16億條內(nèi)容。想想看營銷演示文檔、合同、發(fā)票和工作指令及Teams會議的視頻錄制和文字記錄。
微軟協(xié)作應(yīng)用和平臺總裁杰夫·特伯表示:“他們在創(chuàng)建文件,他們在Teams上進(jìn)行合作,他們把文件儲存在SharePoint體驗中?!薄拔覀兿胱龅氖菍I技術(shù)與這些內(nèi)容結(jié)合起來,這樣客戶就可以進(jìn)行更多的條理性活動,如審批合同、管理發(fā)票管理和監(jiān)管備案。”
這就是為什么微軟又打造了微軟Syntex13。微軟Syntex是Microsoft 365的一個新的內(nèi)容AI產(chǎn)品,它利用Azure認(rèn)知服務(wù)和其它AI技術(shù)來改變內(nèi)容創(chuàng)建、處理和挖掘方式。無論是數(shù)字內(nèi)容還是紙質(zhì)內(nèi)容,它都可以讀取、標(biāo)記和索引,使其可以在特定的應(yīng)用程序中檢索和使用或作為可重復(fù)使用的信息。它還可以通過安全和保留設(shè)置來管理內(nèi)容生命周期。
例如,TaylorMade 高爾夫公司曾向微軟Syntex14尋求一個綜合性文件管理系統(tǒng)來整理和保護(hù)電子郵件、附件和其它知識產(chǎn)權(quán)及專利文件。而當(dāng)時,公司的律師需要手動管理這些內(nèi)容,花費數(shù)小時時間來歸檔和移動文件,以便后期共享和處理。
有了微軟Syntex,這些文件會以一種更安全的方式被自動歸類、標(biāo)記和篩選,而且它們易于通過搜索查找,不再需要在傳統(tǒng)的文件和文件夾系統(tǒng)中翻找。TaylorMade 公司還在探索如何使用微軟Syntex來自動處理訂單收據(jù)和其它應(yīng)付賬款和財務(wù)團(tuán)隊的事務(wù)性文件。
例如,TaylorMade 高爾夫公司曾向微軟Syntex14尋求一個綜合性文件管理系統(tǒng)來整理和保護(hù)電子郵件、附件和其它知識產(chǎn)權(quán)及專利文件。而當(dāng)時,公司的律師需要手動管理這些內(nèi)容,花費數(shù)小時時間來歸檔和移動文件,以便后期共享和處理。
有了微軟Syntex,這些文件會以一種更安全的方式被自動歸類、標(biāo)記和篩選,而且它們易于通過搜索查找,不再需要在傳統(tǒng)的文件和文件夾系統(tǒng)中翻找。TaylorMade 公司還在探索如何使用微軟Syntex來自動處理訂單收據(jù)和其它應(yīng)付賬款和財務(wù)團(tuán)隊的事務(wù)性文件。
特伯指出,其他客戶正在使用微軟Syntex進(jìn)行合同管理和匯編。雖然每份合同都或有其特殊內(nèi)容,但它們基本都是圍繞財務(wù)條款、變更控制、時間表等通用條款構(gòu)成。與其每次都從頭開始撰寫這些通用條款,人們可以使用Syntex從各種文件中匯編這些條款,然后進(jìn)行修改。
他說:“他們需要AI和機(jī)器學(xué)習(xí)來查對,‘嘿,這一段與我們的標(biāo)準(zhǔn)條款非常不同,可能需要額外的注意’”。
他補充道:“如果你試圖閱讀一份100頁的合同并查找有重大變化的內(nèi)容,沒有AI的幫助,這將是一項非常繁重的工作。然后圍繞這些合同的工作流程是:誰來審批它們?把它們存放在哪里?以后如何找到它們?這其中有很大一部分是元數(shù)據(jù)。”
個性化DALL?E 2
在Azure OpenAI服務(wù)中使用DALL?E 2激發(fā)了德國RTL公司不斷探索如何根據(jù)客戶的興趣生成個性化圖像,該公司是德國最大的私營跨媒體企業(yè)。例如,在RTL的數(shù)據(jù)研究和AI功能中心,數(shù)據(jù)科學(xué)家正在測試各種策略,通過生成圖像來提升用戶體驗。
德國RTL的流媒體服務(wù)RTL+正在擴(kuò)展,現(xiàn)在可按需讀取數(shù)百萬視頻、音樂專輯、播客、有聲讀物和電子雜志。RTL數(shù)據(jù)團(tuán)隊的數(shù)據(jù)產(chǎn)品和技術(shù)高級副總裁馬克·埃格說,該平臺主要依靠圖片來吸引人們的注意力。
他說:“即使你的推送很完美,你依然不知道用戶是否會點擊它,因為用戶是通過視覺線索來決定他們是否有興趣消費某物。因此插圖真的很重要,必須為合適的人準(zhǔn)備合適的插圖”。
試想一下一部關(guān)于一名職業(yè)足球運動員被調(diào)往巴黎并與一名法國體育記者相愛的浪漫喜劇電影。如果有足球比賽的畫面,體育迷可能會更愿意去看這部電影,而喜歡看言情小說或旅游的人可能會對情侶在埃菲爾鐵塔下接吻的畫面更感興趣。
埃格表示,將DALL?E 2的力量與用戶互動過的內(nèi)容元數(shù)據(jù)結(jié)合起來有可能提供以前無法想象的規(guī)模的個性化圖像。
他說道:“如果你有數(shù)百萬用戶和數(shù)以百萬計的資產(chǎn),你會遇到無法解決的問題,那就是工作人員不夠。圖形設(shè)計師數(shù)量永遠(yuǎn)不夠來設(shè)計你想要的所有個性化圖片。因此,這種技術(shù)可以讓你做到動用其它方式無法做到的事情。”
埃格的團(tuán)隊也在考慮如何在Azure OpenAI服務(wù)中使用DALL?E 2為目前缺乏圖像的內(nèi)容打造視覺效果,如播客劇集和有聲讀物場景。例如,一部播客劇集的元數(shù)據(jù)可以用來生成一個獨特的圖像來搭配它,而不是反復(fù)使用相同的通用播客圖像。
德國最大的私營跨媒體企業(yè)德國RTL正在探索如何在Azure OpenAI服務(wù)中使用DALL?E 2來吸引人們?yōu)g覽其流媒體服務(wù)RTL+。其中一個構(gòu)想是使用DALL?E 2生成獨特的圖像來給每個播客集作插圖,而不是用一樣的播客封面。
按照類似思路,在手機(jī)上聽有聲讀物的人通常看到的是每一章都相同的封面。DALL?E 2可以用來生成一個獨特的圖像用來搭配每個章節(jié)的各個場景。
埃格補充說,通過Azure OpenAI服務(wù)使用DALL?E 2可以在一個地方訪問其他Azure服務(wù)和工具,這使他的團(tuán)隊能夠高效和不間斷地工作。“與所有其它軟件即服務(wù)的產(chǎn)品一樣,我們可以肯定,如果我們需要由DALL?E 2創(chuàng)作的大量圖像,我們不用擔(dān)心線上操作問題?!?/span>
恰當(dāng)和負(fù)責(zé)任地
使用DALL?E 2
據(jù)AzureAI微軟首席小組項目經(jīng)理薩拉·伯德稱,沒有哪項AI技術(shù)像DALL?E 2這樣能夠從自然語言描述中生成圖像的系統(tǒng)那樣引起人們的興奮。
她在談到DALL?E 2時說:“人們喜歡圖像,但對于像我這樣完全沒有視覺藝術(shù)細(xì)胞的人來說,我能用它做出比用其它視覺工具漂亮得多的東西”?!八峁┙o人類一個新的工具來創(chuàng)造性地表達(dá)自己,并以引人入勝妙趣橫生的方式進(jìn)行交流。”
她的團(tuán)隊專注于開發(fā)工具和技術(shù)以指導(dǎo)人們正確和負(fù)責(zé)任地使用AI工具15,如Azure AI中的DALL?E 2,并對可能會產(chǎn)生危害的使用方式進(jìn)行限制。
為了防止DALL?E 2在Azure OpenAI服務(wù)中輸出不當(dāng)內(nèi)容,OpenAI從用于訓(xùn)練模型的數(shù)據(jù)集中刪除了最明顯的性和暴力相關(guān)內(nèi)容,而且Azure AI部署了篩選程序來拒止違反內(nèi)容政策的提示。
除此之外,該團(tuán)隊還整合了一些技術(shù),防止DALL?E 2創(chuàng)建名人圖像及經(jīng)常被用來欺騙系統(tǒng)生成性或暴力內(nèi)容的對象。在輸出端,該團(tuán)隊添加了一些模型用來刪除AI生成的包含成人、血腥和其它類型不當(dāng)內(nèi)容的圖像。
我們正在設(shè)計界面來幫助用戶......使用這個工具來得到他們想要的效果。
DALL?E 2仍然受到許多AI系統(tǒng)都會遇到的挑戰(zhàn):只有用于訓(xùn)練它的數(shù)據(jù)足夠好,系統(tǒng)才會好。如果沒有用來了解用戶意圖的上下文,輸入DALL?E 2的描述性較差的提示會出現(xiàn)嵌入在訓(xùn)練數(shù)據(jù)(網(wǎng)絡(luò)文本和圖像)中的偏差。
這就是為什么伯德正在與微軟產(chǎn)品團(tuán)隊合作教人們?nèi)绾问褂肈ALL?E 2來幫助他們實現(xiàn)他們的目標(biāo),例如使用更多的描述性提示幫助AI系統(tǒng)更好地理解他們所追求的效果。
她說:“我們正在設(shè)計界面來幫助用戶更順利地生成創(chuàng)造,并分享今天的限制條件,以便用戶能夠使用這個工具來獲得他們想要的效果,而不是網(wǎng)上那些平庸的效果”。
“你如何預(yù)測未來?”
最近布斯加入了美泰未來實驗室,該實驗室正在探索元宇宙和NFT(非同質(zhì)化代幣)等想法以擴(kuò)大玩具業(yè)務(wù)的范圍。她正在利用DALL?E 2輔助她想象虛擬體驗可能的樣子。
她在說明DALL?E 2正在幫助其團(tuán)隊預(yù)測未來時說道:“隨便滑動手指,選一個描述詞,森林、美人魚,隨便什么都可以,來思考虛構(gòu)世界會發(fā)生什么,非常有趣。”。“如何預(yù)測未來?不斷地給自己灌輸更多的信息、畫面與想法,想象它們將如何組合在一起?!?/span>
微軟公司Azure平臺副總裁博伊德表示,DALL?E 2和支持它的大型語言模型家族正在釋放客戶的創(chuàng)造性力。AI系統(tǒng)是想象力的助燃器,它讓用戶產(chǎn)生新的有趣的想法,并在演示文稿和文件中生動展現(xiàn)這些想法。
他說道:“我認(rèn)為,最令人激動的是,我們對這些大型語言模型的力量還只是觸及皮毛”。
[1]https://info.microsoft.com/ww-landing-ai-interest-capture-execution-for-ignite-keynote.html?lcid=en-usus/free/ai/search/
[2]https://azure.microsoft.com/en-us/products/cognitive-services/openai-service/
[3]https://www.microsoft.com/en-us/microsoft-365/blog/2022/10/12/new-tools-from-microsoft-365-edge-and-bing-bridge-the-gap-between-productivity-and-creativity/
[4]https://blogs.microsoft.com/ai/how-ai-makes-developers-lives-easier-and-helps-everybody-learn-to-develop-software/
[5]https://news.microsoft.com/2019/07/22/openai-forms-exclusive-computing-partnership-with-microsoft-to-build-new-azure-ai-supercomputing-technologies/
[6]https://azure.microsoft.com/en-us/products/cognitive-services/
[7]https://www.microsoft.com/en-us/microsoft-teams/group-chat-software
[8]https://powerplatform.microsoft.com/en-us/
[9]https://www.microsoft.com/en-us/microsoft-365
[10]https://cloudblogs.microsoft.com/dynamics365/bdm/2022/10/12/bringing-more-intelligence-to-sales-teams-with-dynamics-365/
[11]https://powerautomate.microsoft.com/zh-cn/blog/new-ways-to-innovate-with-ai-and-microsoft-power-automate/
[12]https://powerautomate.microsoft.com/zh-cn/blog/new-ways-to-innovate-with-ai-and-microsoft-power-automate/
[13]https://www.microsoft.com/en-us/microsoft-365/blog/2022/10/12/welcome-to-microsoft-syntexcontent-ai-integrated-in-the-flow-of-work/
[14]https://customers.microsoft.com/en-us/story/1556853242544319473-taylormade-golf-retailers-microsoft-syntex
[15]https://www.microsoft.com/en-us/ai/responsible-ai?activetab=pivot1%3Aprimaryr6
?
原文標(biāo)題:設(shè)計一款風(fēng)火輪模型車?竟如此簡單
文章出處:【微信公眾號:微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
微軟
+關(guān)注
關(guān)注
4文章
6541瀏覽量
103821
原文標(biāo)題:設(shè)計一款風(fēng)火輪模型車?竟如此簡單
文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論