0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Google: 時尚與人工智能相遇

Qxwdz168 ? 來源:計算機視覺芯片設計 ? 2023-06-20 15:48 ? 次閱讀

如果您看不到或想象自己穿著一件衣服,就很難知道它是否適合您。有多少次你在網(wǎng)上買了一件東西,當它送到你家門口時興奮地打開盒子,沖上去試穿,然后……困惑地盯著鏡子?它可能以您意想不到的方式垂墜。或者在您身上看起來與在在線模型上看起來完全不同。

本周,google將在 Google.com 上發(fā)布一項新的購物功能,旨在為人們提供更有用的在線購物體驗。虛擬試穿 (VTO) 在具有不同體型和尺寸的真實模特身上生成栩栩如生的服裝寫照。這些圖像包括那些微妙但至關重要的細節(jié),例如某些東西如何懸垂、折疊、緊貼、拉伸和皺紋——所有這些都具有為 VTO 開發(fā)的新生成 AI 模型的強大功能。

購物者只需選擇一件他們感興趣的服裝,然后選擇一個款式,瞧,他們已經(jīng)看到試穿了。

01b2471e-0c5e-11ee-962d-dac502259ad0.jpg

“VTO 是在線購物向前邁出的激動人心的一步,尤其是在顯然需要更多代表性的服裝領域,”購物產(chǎn)品經(jīng)理 Shyam Sunder 說。“服裝是谷歌搜索最多的購物類別之一,因此對人們和品牌的幫助潛力巨大。統(tǒng)計數(shù)據(jù)顯示了一個明確的需求:42% 的在線購物者覺得模特圖片無法代表他們,59% 的人對他們在網(wǎng)上購買的商品感到不滿意,因為它看起來與他們預期的不一樣。”

從一開始,該團隊就想為購物者提供一系列可以解決這個問題的模型?!爱斘覀冊?a target="_blank">網(wǎng)絡上搜索服裝時,當涉及到穿著這些衣服的模特時,我們會發(fā)現(xiàn)結果差異很小,”Shyam 說?!拔矣浀靡粋€例子,50 張圖片中只有四張是有色人種。所以問題是,即使我們想在購物中顯示不同的圖像,我們也做不到,因為網(wǎng)絡上沒有足夠的圖像。這是我熱切想要解決的問題?!?/p>

因此,該團隊創(chuàng)建了他們自己的資料庫,其中包含 80 個代表多種尺寸、膚色、身高、年齡和性別的模特,以便在 Google 上購物的人可以選擇他們最感興趣的模特,并查看衣服穿在身上的效果。

“一個關鍵問題是如何在每個模型上自動生成任何服裝,”購物研究科學家 Ira Kemelmacher-Shlizerman 說。“人們研究類似技術已經(jīng)有一段時間了,但最終的圖像從來沒有完全達到目標——它們存在視覺缺陷,比如錯位的褶皺,使衣服看起來畸形和不自然。所以我們給自己設定了一個挑戰(zhàn):創(chuàng)造一種方法,可以為任何體型和體形的人合成逼真的高質(zhì)量圖像。這就是生成人工智能的用武之地?!?/p>

該團隊轉向了 VTO 的文本到圖像模型,該模型能夠從文本輸入創(chuàng)建高度逼真的圖像。尤其重要的是一種稱為擴散的技術,該技術會逐漸將噪聲添加到照片中,并訓練神經(jīng)網(wǎng)絡去除這些噪聲像素。

對于 VTO,該團隊沒有使用單一的擴散網(wǎng)絡和大型語言模型(如在文本到圖像中使用的那樣),而是創(chuàng)建了一種稱為并行 U-net 的新架構,它接受兩幅圖像:人物圖像和服裝圖像。每張圖片都通過自己的神經(jīng)網(wǎng)絡——U-net——同時通過稱為“交叉注意力”的過程進一步相互交流?!敖Y果是驚人的,”艾拉說?!拔覀兊挠脩粞芯勘砻鳎覀兊姆椒ū茸钕冗M的方法有很大的優(yōu)勢——超過 95% 的時間?!?/p>

該團隊使用 Google 的 Shopping Graph 對新的 AI 模型進行嚴格訓練,這是世界上最全面的產(chǎn)品、賣家、品牌、評論和庫存數(shù)據(jù)集。他們使用數(shù)百萬對圖像來訓練模型,每對圖像都包括一個穿著衣服的人以兩種不同的姿勢。人工智能模型學習將一個姿勢的襯衫形狀與另一個姿勢的人相匹配,反之亦然,直到它可以從各個角度生成該人穿著襯衫的逼真圖像。

01df36f2-0c5e-11ee-962d-dac502259ad0.jpg

在一個例子中,試穿結果似乎比原來的衣服顏色更亮。該團隊對這些類型的示例進行了數(shù)天的審議,但最終決定在發(fā)布時謹慎行事,當出現(xiàn)任何此類錯誤時,刪除在模型上虛擬試穿服裝的選項。隨著他們從用戶和品牌那里得到反饋,他們將繼續(xù)做出調(diào)整。“為生成圖像發(fā)明全自動評估仍然是一個懸而未決的問題,我們正在積極努力,”艾拉說。

如今,Google Shopping Graph 上數(shù)百個品牌和零售商的女裝上衣均可試穿,包括 Anthropologie、LOFT、H&M 和 Everlane。隨著時間的推移,該工具將變得更加精確并擴展到更多品牌。到目前為止,品牌反響非常積極。

“當我們讓他們了解這項技術時,我們收到了一些很好的反饋,并且也非??释麉⑴c,”Shyam 說?!八麄冎械囊恍┤朔浅O矚g它,他們要求使用這項技術來支持他們自己的網(wǎng)站?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1752

    瀏覽量

    57329
  • AI
    AI
    +關注

    關注

    87

    文章

    29435

    瀏覽量

    267746
  • 人工智能
    +關注

    關注

    1789

    文章

    46397

    瀏覽量

    236605
  • 模型
    +關注

    關注

    1

    文章

    3073

    瀏覽量

    48584

原文標題:Google: 時尚與人工智能相遇

文章出處:【微信號:計算機視覺芯片設計,微信公眾號:計算機視覺芯片設計】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內(nèi)容詳實,干活滿滿。 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》這本書的第一章,作為整個著作的開篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    與人工智能推薦系統(tǒng)中強大的圖形處理器(GPU)一爭高下。其獨特的設計使得該處理器在功耗受限的條件下仍能實現(xiàn)高性能的圖像處理任務。 Ceremorphic公司 :該公司開發(fā)的分層學習處理器結合了
    發(fā)表于 09-28 11:00

    智能制造與人工智能的區(qū)別

    智能制造與人工智能在定義、技術組成、應用領域以及發(fā)展重點等方面存在明顯的區(qū)別。
    的頭像 發(fā)表于 09-15 14:27 ?483次閱讀

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新

    ! 《AI for Science:人工智能驅(qū)動科學創(chuàng)新》 這本書便將為讀者徐徐展開AI for Science的美麗圖景,與大家一起去了解: 人工智能究竟幫科學家做了什么? 人工智能將如何改變我們所生
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領域集產(chǎn)品
    發(fā)表于 08-22 15:00

    串口屏與人工智能的結合

    在當今智能化浪潮中,傳統(tǒng)設備與新興技術的融合正不斷推動產(chǎn)業(yè)升級,其中,串口屏與人工智能(AI)的結合尤為引人注目。串口屏作為一種常見的信息展示與交互設備,在工業(yè)控制、智能家居、醫(yī)療健康等多個領域發(fā)揮
    的頭像 發(fā)表于 08-16 12:29 ?1184次閱讀

    FPGA在人工智能中的應用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領域的應用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學習加速 訓練和推理過程加速:FPGA可以用來加速深度學習的訓練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    計算機視覺與人工智能的關系是什么

    、交流等方面。計算機視覺與人工智能之間存在著密切的聯(lián)系,計算機視覺是人工智能的一個重要分支,也是實現(xiàn)人工智能的關鍵技術之一。 計算機視覺的定義與發(fā)展 2.1 計算機視覺的定義 計算機視覺是一門研究如何使計算機能夠理解
    的頭像 發(fā)表于 07-09 09:25 ?429次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2) 課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎知識指引 14分50秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    課程類別 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 人工智能 參賽基礎知識指引 14分50秒 https://t.elecfans.com/v/25508.html *附件:參賽基礎知識指引
    發(fā)表于 04-01 10:40

    FMEA與人工智能的融合發(fā)展

    工具,正逐漸展現(xiàn)出其在賦能人工智能領域的巨大潛力。本文將分享FMEA如何與人工智能相結合,共同開啟智能風險預防的新紀元。 一、FMEA與人工智能:相得益彰的結合 FMEA通過分析產(chǎn)品或
    的頭像 發(fā)表于 03-18 16:21 ?603次閱讀

    科達嘉電感器在大數(shù)據(jù)與人工智能領域被廣泛應用

    近年來,大數(shù)據(jù)與人工智能成為科技領域的熱門話題。大數(shù)據(jù)為人工智能提供了大量的數(shù)據(jù)作為輸入,使得人工智能算法和模型能夠通過學習做出更準確的預測和決策。
    的頭像 發(fā)表于 02-29 13:56 ?430次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎建設與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領域布局
    發(fā)表于 02-26 10:17

    龍芯中科連續(xù)兩年為安徽省大數(shù)據(jù)與人工智能應用競賽保駕護航

    近日,2023年安徽省大數(shù)據(jù)與人工智能應用競賽人工智能賽道決賽(以下簡稱“大賽”)在安徽工業(yè)經(jīng)濟職業(yè)技術學院圓滿落幕。
    的頭像 發(fā)表于 11-02 10:37 ?878次閱讀
    龍芯中科連續(xù)兩年為安徽省大數(shù)據(jù)<b class='flag-5'>與人工智能</b>應用競賽保駕護航