0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用Cortex將PyTorch模型部署到生產中

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-10 20:14 ? 次閱讀

從 NLP 到計算機視覺都可以通過 Cortex來非常方便的部署PyTorch模型。
作者:Caleb Kaiser
編譯:ronghuaiyang
首發(fā):AI公園公眾號

Using PyTorch Models in Production with Cortex

該框架的 python 風格,其學習曲線的溫和性,以及它對快速和簡單原型的方便實現(xiàn),使 PyTorch 明顯成為研究人員的最愛。因此,它正在推動一些最酷的機器學習項目:

Transformers,Hugging Face 生成的廣泛流行的自然語言處理(NLP)庫,是建立在 PyTorch 上的。

Selene,生物前沿 ML 庫,建在 PyTorch 上。

CrypTen,這個熱門的、新的、關注隱私的機器學習框架是建立在 PyTorch 上的。

在 ML 的幾乎任何領域,從計算機視覺到 NLP 再到計算生物學,你都會發(fā)現(xiàn) PyTorch 在前沿為實驗提供能量。

然而,最自然的問題是如何將這些實驗合并到軟件中。如何從“跨語言語言模型”轉換為谷歌翻譯?

在這篇博客文章中,我們將了解在生產環(huán)境中使用 PyTorch 模型意味著什么,然后介紹一種允許部署任何 PyTorch 模型以便在軟件中使用的方法。

在生產中使用 PyTorch 意味著什么?

根據(jù)生產環(huán)境的不同,在生產環(huán)境中運行機器學習可能意味著不同的事情。一般來說,在生產中有兩類機器學習的設計模式:

通過推理服務器提供一個預測 API。這是在通用軟件開發(fā)中使用的標準方法,即不是移動軟件或獨立設備。

嵌入。將你的模型直接嵌入到你的應用程序中。這通常用于機器人和獨立設備,有時也用于移動應用程序。

如果你打算直接將你的模型嵌入到你的應用程序中,那么你應該看看 PyTorch 的 TorchScript。使用即時編譯,PyTorch 可以將 Python 編譯成不需要 Python 解釋器就可以運行的 TorchScript,這對于資源受限的部署目標(比如移動設備)非常有用。

在大多數(shù)情況下,你會使用模型服務器。今天你看到的許多 ML 應用程序 — 從你最喜歡的流媒體服務背后的推薦引擎到在線搜索欄中的自動完成功能—都依賴于這種部署形式,更確切地說,依賴于實時推理

在實時推理中,一個模型通常被部署為一個微服務(通常是一個 JSON API),通過它,一個軟件可以查詢模型并接收預測。

讓我們以 Facebook 人工智能的 RoBERTa 為例,一個領先的 NLP 模型。它通過分析去掉一個單詞的句子(或“屏蔽詞”),并猜測屏蔽詞是什么,來進行推斷。例如,如果你要使用一個預先訓練好的 RoBERTa 模型來猜測一個句子中的下一個單詞,你要使用的 Python 方法是這樣的,非常簡單:

roberta.fill_mask(input_text + " ")

事實證明,在序列中預測缺失的單詞正是 autocomplete 等功能背后的功能。要在應用程序中實現(xiàn) autocomplete,可以將 RoBERTa 部署為 JSON API,然后在應用程序中使用用戶的輸入在 RoBERTa 節(jié)點上進行查詢。

設置 JSON API 聽起來相當簡單,但是將模型部署為微服務實際上需要大量的基礎設施工作。

你需要自動控制流量的波動。你需要監(jiān)控你的預測。你需要處理模型更新。你需要了解日志記錄。非常多的工作。

那么,問題是如何將 RoBERTa 部署為一個 JSON API,而不需要手動滾動所有這些自定義基礎設施?

將 PyTorch 模型與 Cortex 一起投入生產

你可以使用 Cortex 自動化部署 PyTorch 模型所需的大部分基礎設施工作,這是一個將模型作為 api 部署到 AWS 上的開源工具。這篇文章并不是一個完整的 Cortex 使用指南,只是一個高層次的 Cortex 使用方法,你所需要的是:

提供推斷的 Python 腳本

定義你的 API 的配置文件

Cortex CLI 啟動你的部署

這種方法并不局限于 RoBERTa。想要為你的圖像自動生成 alt 文本,使你的網(wǎng)站更容易訪問?你可以部署一個 AlexNet 模型,使用 PyTorch 和 Cortex 來標記圖像。

那語言分類器呢,比如 Chrome 用來檢測頁面不是用默認語言寫的那個?fastText 是這個任務的完美模型,你可以使用 PyTorch 和 Cortex 部署它。

使用 Cortex,你可以將許多由 PyTorch 支持的 ML 特性添加到你的應用程序中進行實時推斷。

PyTorch 用到生產中

有超過 25 個研究模型儲存在 PyTorch Hub],從 NLP 到計算機視覺。所有這些都可以通過 Cortex 來實現(xiàn),使用的過程和我們剛才演示的一樣。

PyTorch 團隊無疑在他們的路線圖上有更多的以生產為中心的特性,但是僅僅看看到目前為止所取得的進展,很明顯 PyTorch 不是為生產而構建的框架的觀點已經(jīng)過時了。

關注圖像處理,自然語言處理,機器學習等人工智能領域。
歡迎關注微信公眾號

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1789

    文章

    46334

    瀏覽量

    236498
  • pytorch
    +關注

    關注

    2

    文章

    795

    瀏覽量

    13079
收藏 人收藏

    評論

    相關推薦

    新手小白怎么通過云服務器跑pytorch?

    安裝PyTorch的步驟可以根據(jù)不同的操作系統(tǒng)和需求有所差異,通過云服務器運行PyTorch的過程主要包括選擇GPU云服務器平臺、配置服務器環(huán)境、部署和運行PyTorch
    的頭像 發(fā)表于 09-25 11:35 ?157次閱讀

    基于Pytorch訓練并部署ONNX模型在TDA4應用筆記

    電子發(fā)燒友網(wǎng)站提供《基于Pytorch訓練并部署ONNX模型在TDA4應用筆記.pdf》資料免費下載
    發(fā)表于 09-11 09:24 ?0次下載
    基于<b class='flag-5'>Pytorch</b>訓練并<b class='flag-5'>部署</b>ONNX<b class='flag-5'>模型</b>在TDA4應用筆記

    PyTorch中搭建一個最簡單的模型

    PyTorch中搭建一個最簡單的模型通常涉及幾個關鍵步驟:定義模型結構、加載數(shù)據(jù)、設置損失函數(shù)和優(yōu)化器,以及進行模型訓練和評估。
    的頭像 發(fā)表于 07-16 18:09 ?1489次閱讀

    pytorch如何訓練自己的數(shù)據(jù)

    本文詳細介紹如何使用PyTorch框架來訓練自己的數(shù)據(jù)。我們將從數(shù)據(jù)準備、模型構建、訓練過程、評估和測試等方面進行講解。 環(huán)境搭建 首先,我們需要安裝PyTorch??梢酝ㄟ^訪問
    的頭像 發(fā)表于 07-11 10:04 ?374次閱讀

    pytorch中有神經(jīng)網(wǎng)絡模型

    當然,PyTorch是一個廣泛使用的深度學習框架,它提供了許多預訓練的神經(jīng)網(wǎng)絡模型PyTorch中的神經(jīng)網(wǎng)絡模型 1. 引言 深度學習是一種基于人工神經(jīng)網(wǎng)絡的機器學習技術,它在圖像
    的頭像 發(fā)表于 07-11 09:59 ?577次閱讀

    PyTorch神經(jīng)網(wǎng)絡模型構建過程

    PyTorch,作為一個廣泛使用的開源深度學習庫,提供了豐富的工具和模塊,幫助開發(fā)者構建、訓練和部署神經(jīng)網(wǎng)絡模型。在神經(jīng)網(wǎng)絡模型中,輸出層是尤為關鍵的部分,它負責
    的頭像 發(fā)表于 07-10 14:57 ?369次閱讀

    解讀PyTorch模型訓練過程

    PyTorch作為一個開源的機器學習庫,以其動態(tài)計算圖、易于使用的API和強大的靈活性,在深度學習領域得到了廣泛的應用。本文深入解讀PyTorch模型訓練的全過程,包括數(shù)據(jù)準備、
    的頭像 發(fā)表于 07-03 16:07 ?729次閱讀

    如何使用PyTorch建立網(wǎng)絡模型

    PyTorch是一個基于Python的開源機器學習庫,因其易用性、靈活性和強大的動態(tài)圖特性,在深度學習領域得到了廣泛應用。本文將從PyTorch的基本概念、網(wǎng)絡模型構建、優(yōu)化方法、實際應用等多個方面,深入探討使用
    的頭像 發(fā)表于 07-02 14:08 ?305次閱讀

    使用PyTorch搭建Transformer模型

    Transformer模型自其問世以來,在自然語言處理(NLP)領域取得了巨大的成功,并成為了許多先進模型(如BERT、GPT等)的基礎。本文深入解讀如何使用PyTorch框架搭建T
    的頭像 發(fā)表于 07-02 11:41 ?1279次閱讀

    請問電腦端Pytorch訓練的模型如何轉化為能在ESP32S3平臺運行的模型?

    由題目, 電腦端Pytorch訓練的模型如何轉化為能在ESP32S3平臺運行的模型? 如何把這個Pytorch模型燒錄到ESP32S3上去?
    發(fā)表于 06-27 06:06

    使用CUBEAI部署tflite模型STM32F0中,模型創(chuàng)建失敗怎么解決?

    看到CUBE_AI已經(jīng)支持STM32F0系列芯片,就想拿來入門嵌入式AI。 生成的模型很小,是可以部署F0上的,但是一直無法創(chuàng)建成功。 查閱CUBE AI文檔說在調用create
    發(fā)表于 03-15 08:10

    pytorch模型更快速投入生產的方法

    大家好,非常感謝大家的加入。我是馬克,在推理和PyTorch方面有著豐富的經(jīng)驗。今天我想和大家談談一種讓你的模型快速投入生產的方法。訓練模型的過程非常艱難,你需要花費大量時間和計算資源
    的頭像 發(fā)表于 01-19 10:38 ?456次閱讀
    讓<b class='flag-5'>pytorch</b><b class='flag-5'>模型</b>更快速投入<b class='flag-5'>生產</b>的方法

    15-PyTorch-Edge-在邊緣設備上部署AI模型的開發(fā)者之旅

    對于開發(fā)者而言,我們整個ExecuTorch技術棧分為兩個階段。首先,我們從一個PyTorch模型開始,這在大多數(shù)情況下是一個torch.in.module。然后我們從中捕獲圖形,并將其lowering并序列化為額外的torc
    的頭像 發(fā)表于 01-12 10:29 ?636次閱讀
    15-<b class='flag-5'>PyTorch</b>-Edge-在邊緣設備上<b class='flag-5'>部署</b>AI<b class='flag-5'>模型</b>的開發(fā)者之旅

    【飛騰派4G版免費試用】第四章:部署模型飛騰派的嘗試

    本章記錄這幾天嘗試訓練的佩奇檢測模型部署飛騰派的階段總結。
    的頭像 發(fā)表于 12-20 20:54 ?2195次閱讀
    【飛騰派4G版免費試用】第四章:<b class='flag-5'>部署</b><b class='flag-5'>模型</b><b class='flag-5'>到</b>飛騰派的嘗試

    Hugging Face LLM部署大語言模型亞馬遜云科技Amazon SageMaker推理示例

    ?本篇文章主要介紹如何使用新的Hugging Face LLM推理容器開源LLMs,比如BLOOM大型語言模型部署亞馬遜云科技Amazon SageMaker進行推理的示例。我們
    的頭像 發(fā)表于 11-01 17:48 ?850次閱讀
    Hugging Face LLM<b class='flag-5'>部署</b>大語言<b class='flag-5'>模型</b><b class='flag-5'>到</b>亞馬遜云科技Amazon SageMaker推理示例