0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

現(xiàn)代化機(jī)器學(xué)習(xí)工具,有助于數(shù)據(jù)科學(xué)開展更多工程功能

如意 ? 來源: 云智小號(hào) ? 作者: 云智小號(hào) ? 2020-07-06 10:11 ? 次閱讀

數(shù)據(jù)科學(xué)的發(fā)展日新月異,機(jī)器學(xué)習(xí)的角色正從數(shù)據(jù)科學(xué)的混合角色過渡到更多的工程或面相分析的角色,主要是以下的因素促成了這種變化。

1.機(jī)器學(xué)習(xí)模型更多地被應(yīng)用到生產(chǎn)系統(tǒng)中,需要數(shù)據(jù)科學(xué)家具有比以前更深入的技術(shù)技能。

2.商業(yè)產(chǎn)品和用戶行為的變化步伐加快,對(duì)自動(dòng)化的需求也增加。

3.還有出于數(shù)據(jù)合規(guī)和監(jiān)管的要求,增加了對(duì)數(shù)據(jù)的可追溯性和可解釋性的預(yù)測(cè)和決策的需求。

這些變化的因素也導(dǎo)致了數(shù)據(jù)科學(xué)家使用的工具發(fā)生了變化。使得他們更多地利用云,自動(dòng)化,可解釋性和可重復(fù)過程的方向去發(fā)展。

基于云的機(jī)器學(xué)習(xí)。云基礎(chǔ)架構(gòu)和Kubernetes改變了數(shù)據(jù)科學(xué)家進(jìn)行機(jī)器學(xué)習(xí)的方式。從能夠?qū)㈩A(yù)構(gòu)建的解決方案用作Saas應(yīng)用程序,到能夠在Kubernetes上運(yùn)行完整的機(jī)器學(xué)習(xí)堆棧。

AutoML和編排。AutoML簡(jiǎn)化了訓(xùn)練模型,提供了一種自動(dòng)的方法來進(jìn)行數(shù)據(jù)準(zhǔn)備,特征工程,超參數(shù)優(yōu)化或模型的選擇。

可解釋且可重復(fù)的ML。在過去幾年中,出現(xiàn)了一些庫和工具來幫助理解模型預(yù)測(cè)及其背后的權(quán)重并賦予其含義。如whatiftools,Lime,Shap或Manifold之類的工具可以幫助數(shù)據(jù)科學(xué)家來實(shí)現(xiàn)這一目標(biāo)。

基于云的機(jī)器學(xué)習(xí)

向云和Kubernetes的遷移是時(shí)下的主流方向,這推動(dòng)了機(jī)器學(xué)習(xí)工程師對(duì)更多DevOps或數(shù)據(jù)操作功能的需求。

深度學(xué)習(xí)的快速發(fā)展推動(dòng)了機(jī)器學(xué)習(xí)的進(jìn)步,但深度學(xué)習(xí)需要更多的計(jì)算資源,它的利用率隨工作負(fù)載變化很大,這迫使Tensorflow執(zhí)行程序在Kubernetes上運(yùn)行來支持更彈性和可擴(kuò)展的基礎(chǔ)架構(gòu)。

另一個(gè)因素是機(jī)器學(xué)習(xí)在生產(chǎn)環(huán)境中的重要性日益提高。這種轉(zhuǎn)變又增加了在原型堆棧和生產(chǎn)之間緊密結(jié)合的需求,并借助各種云的平臺(tái),比如AWS SageMaker、Google Cloud ML Engine。這些工具提供了如模型部署和API配置之類的功能,從而簡(jiǎn)化了流程將模型推向生產(chǎn)的過程。

AutoML和機(jī)器學(xué)習(xí)工作流程

具有生產(chǎn)型機(jī)器學(xué)習(xí)系統(tǒng)的重要性的提高反過來加速了從培訓(xùn)到部署的整個(gè)機(jī)器學(xué)習(xí)價(jià)值鏈對(duì)自動(dòng)化的需求。自動(dòng)化允許更快地迭代和改進(jìn)模型。

AutoML提供了圍繞模型訓(xùn)練過程的自動(dòng)化層,可以處理其一些重復(fù)的任務(wù)。它可以處理如超參數(shù)優(yōu)化,功能和模型選擇之類的任務(wù)?,F(xiàn)在,像Tpot或AutoKeras之類的庫,以及大多數(shù)云提供商的機(jī)器學(xué)習(xí)即服務(wù)都將AutoML作為其解決方案的一部分。

對(duì)自動(dòng)化的需求也增加了對(duì)工具進(jìn)行編排的不同部分的需求。工作流工具如,Airflow,Kubeflow,MLFlow和MetaFlow是用于幫助實(shí)現(xiàn)這一目標(biāo)的一些關(guān)鍵工具。他們負(fù)責(zé)將整個(gè)機(jī)器學(xué)習(xí)過程作為一條流水線來處理,幫助協(xié)調(diào)從數(shù)據(jù)采集到模型服務(wù)的端到端流程。

可解釋且可重復(fù)的ML

合規(guī)和監(jiān)管影響了我們構(gòu)建機(jī)器學(xué)習(xí)模型的方式。他們推動(dòng)了可解釋和可復(fù)制的模型。

在可解釋的方面,已經(jīng)出現(xiàn)了一系列工具,可以幫助數(shù)據(jù)科學(xué)家從其模型中獲得意義。這些工具評(píng)估不同的方案,分析變量如何互操作,并提供儀表板以幫助解釋模型預(yù)測(cè)。whatiftools,Lime,Shap或Manifold是應(yīng)對(duì)這一挑戰(zhàn)的工具。

除了提供可靠的方法來調(diào)試模型的優(yōu)點(diǎn)外,可復(fù)制性是受法規(guī)影響的另一個(gè)方面??傆锌赡苁褂霉ぷ髁鞴ぞ邉?chuàng)建可重復(fù)的機(jī)器學(xué)習(xí)管道,但仍出現(xiàn)了一些特定的工具來簡(jiǎn)化這個(gè)過程。

DVC,Dolt,Weight and Biases(WANDB)和Dags Hub等是一些專門的工具,使構(gòu)建模型,可重復(fù)的方式更簡(jiǎn)單。DVC負(fù)責(zé)模型和數(shù)據(jù)集的版本控制,而Dolt嚴(yán)格限于數(shù)據(jù)集本身。WANDB和Dags Hub則專注于跟蹤模型構(gòu)建/訓(xùn)練的權(quán)重和結(jié)果。

總結(jié)

機(jī)器學(xué)習(xí)工具,已經(jīng)不僅僅局限于利用一些預(yù)測(cè)庫和Jupyter筆記本?,F(xiàn)在,進(jìn)行數(shù)據(jù)科學(xué)需要掌握更廣泛的工具集,其中包括云,工作流工具,解釋和版本控制工具。這些增加的現(xiàn)代化工具應(yīng)有助于數(shù)據(jù)科學(xué)開展更多的工程或業(yè)務(wù)功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【米爾NXP i.MX 93開發(fā)板試用評(píng)測(cè)】3、NXP的MCU工程目錄結(jié)構(gòu)和源碼分析

    環(huán)境無縫集成。 而NXP的項(xiàng)目工程,可以說是CMake工程的優(yōu)秀示范。 目錄結(jié)構(gòu) 這種目錄結(jié)構(gòu)有助于提高軟件開發(fā)的效率和質(zhì)量,特別是在大型項(xiàng)目和團(tuán)隊(duì)合作的環(huán)境中。通過合理的組織和模塊
    發(fā)表于 09-21 21:11

    關(guān)于一些有助于優(yōu)化電源設(shè)計(jì)的新型材料

    眾所周知,人們對(duì)更高電源效率的追求正在推動(dòng)性能的全方位提升。材料科學(xué)的進(jìn)步對(duì)于優(yōu)化電源設(shè)計(jì)和開發(fā)更高效、更緊湊和更可靠的解決方案發(fā)揮著關(guān)鍵作用。下文列出了一些有助于優(yōu)化電源設(shè)計(jì)的新材料。
    的頭像 發(fā)表于 08-29 15:26 ?276次閱讀

    MSPM0-高級(jí)控制計(jì)時(shí)器有助于實(shí)現(xiàn)更好的控制和更好的數(shù)字輸出

    電子發(fā)燒友網(wǎng)站提供《MSPM0-高級(jí)控制計(jì)時(shí)器有助于實(shí)現(xiàn)更好的控制和更好的數(shù)字輸出.pdf》資料免費(fèi)下載
    發(fā)表于 08-28 11:30 ?0次下載
    MSPM0-高級(jí)控制計(jì)時(shí)器<b class='flag-5'>有助于</b>實(shí)現(xiàn)更好的控制和更好的數(shù)字輸出

    現(xiàn)代化農(nóng)業(yè)生產(chǎn)中,立柱機(jī)器人不同規(guī)格肥料碼垛

    現(xiàn)代化農(nóng)業(yè)生產(chǎn)中,立柱機(jī)器人被應(yīng)用于不同規(guī)格肥料的碼垛作業(yè),其效高、準(zhǔn)確、靈活的特點(diǎn)為農(nóng)業(yè)生產(chǎn)帶來了顯著的變革。以下是對(duì)立柱機(jī)器人在不同規(guī)格肥料碼垛中的具體應(yīng)用的詳細(xì)分析: 一、立柱機(jī)器
    的頭像 發(fā)表于 08-26 15:08 ?158次閱讀
    <b class='flag-5'>現(xiàn)代化</b>農(nóng)業(yè)生產(chǎn)中,立柱<b class='flag-5'>機(jī)器</b>人不同規(guī)格肥料碼垛

    有助于提高網(wǎng)絡(luò)設(shè)備性能的FRAM SF25C20(MB85RS2MT)

    有助于提高網(wǎng)絡(luò)設(shè)備性能的FRAM SF25C20(MB85RS2MT)
    的頭像 發(fā)表于 07-25 09:49 ?201次閱讀
    <b class='flag-5'>有助于</b>提高網(wǎng)絡(luò)設(shè)備性能的FRAM SF25C20(MB85RS2MT)

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

    機(jī)器學(xué)習(xí)的整個(gè)流程中,數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進(jìn)而影響模型的訓(xùn)練效果和泛能力。本文將從
    的頭像 發(fā)表于 07-09 15:57 ?234次閱讀

    愛普生的高精度傳感技術(shù)有助于監(jiān)控自動(dòng)

    Epson、JREast和NaganoKeiki聯(lián)合開發(fā)了一種適用于鐵路運(yùn)營(yíng)商的實(shí)用撓度監(jiān)測(cè)設(shè)備-愛普生的高精度傳感技術(shù)有助于監(jiān)控自動(dòng)-SeikoEpsonCorporation(TSE:6724
    的頭像 發(fā)表于 06-27 10:53 ?262次閱讀
    愛普生的高精度傳感技術(shù)<b class='flag-5'>有助于</b>監(jiān)控自動(dòng)<b class='flag-5'>化</b>

    LORA、UNB無線網(wǎng)關(guān)物聯(lián)網(wǎng)鎖助力人才公寓智慧管理

    天誠LoRa、UNB雙模式通信物聯(lián)網(wǎng)鎖的應(yīng)用,將有助于構(gòu)建智慧人才公寓,租住行業(yè)現(xiàn)代化發(fā)展以及智慧管理。
    的頭像 發(fā)表于 06-17 10:27 ?352次閱讀
    LORA、UNB無線網(wǎng)關(guān)物聯(lián)網(wǎng)鎖助力人才公寓智慧<b class='flag-5'>化</b>管理

    在微芯片上使用3D反射器堆棧有助于加快6G通信的發(fā)展

    一項(xiàng)新的研究發(fā)現(xiàn),在微芯片上使用3D反射器堆??梢允篃o線鏈路的數(shù)據(jù)速率提高三倍,從而有助于加快6G通信的發(fā)展。
    的頭像 發(fā)表于 03-13 16:31 ?575次閱讀

    為微電子設(shè)施現(xiàn)代化提供資金

    公告,該法案旨在加強(qiáng)美國的制造業(yè)、供應(yīng)鏈和國家安全。對(duì)BAE系統(tǒng)公司的微電子中心進(jìn)行現(xiàn)代化改造有助于支持這一愿景以及尖端技術(shù)的持續(xù)開發(fā)和制造,以服務(wù)于客戶的使命。 BAE系統(tǒng)公司的微電子中心是一個(gè)占地110,000 平方英尺、獲得國防部 (DoD) 認(rèn)證的半
    的頭像 發(fā)表于 12-28 16:24 ?305次閱讀

    喜報(bào)!華為云金融PaaS3.0榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)

    摘要:近日,中國軟件行業(yè)協(xié)會(huì)首屆“應(yīng)用現(xiàn)代化產(chǎn)業(yè)實(shí)踐優(yōu)秀案例”評(píng)選結(jié)果揭曉,華為云金融PaaS3.0榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)。 中國軟件行業(yè)協(xié)會(huì)近期啟動(dòng)了2023“應(yīng)用現(xiàn)代化產(chǎn)業(yè)實(shí)踐
    的頭像 發(fā)表于 11-25 17:34 ?530次閱讀
    喜報(bào)!華為云金融PaaS3.0榮獲“2023年應(yīng)用<b class='flag-5'>現(xiàn)代化</b>典型案例”稱號(hào)

    ADI全新集成電路有助于監(jiān)測(cè)心率

    電子發(fā)燒友網(wǎng)站提供《ADI全新集成電路有助于監(jiān)測(cè)心率.pdf》資料免費(fèi)下載
    發(fā)表于 11-24 10:38 ?0次下載
    ADI全新集成電路<b class='flag-5'>有助于</b>監(jiān)測(cè)心率

    多層pcb生產(chǎn),更有助于高精度布線

    多層pcb生產(chǎn),更有助于高精度布線
    的頭像 發(fā)表于 11-15 11:02 ?465次閱讀

    軟通動(dòng)力應(yīng)用現(xiàn)代化平臺(tái)工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)

    的應(yīng)用現(xiàn)代化平臺(tái)工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)。該評(píng)選旨在加快推動(dòng)應(yīng)用現(xiàn)代化發(fā)展與推廣應(yīng)用,形成行業(yè)應(yīng)用帶動(dòng)和示范作用,打造應(yīng)用
    的頭像 發(fā)表于 11-14 16:50 ?591次閱讀
    軟通動(dòng)力應(yīng)用<b class='flag-5'>現(xiàn)代化</b>平臺(tái)<b class='flag-5'>工程</b>產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用<b class='flag-5'>現(xiàn)代化</b>典型案例”稱號(hào)

    喜報(bào)丨軟通動(dòng)力應(yīng)用現(xiàn)代化平臺(tái)工程產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用現(xiàn)代化典型案例”稱號(hào)

    在數(shù)字經(jīng)濟(jì)時(shí)代,應(yīng)用現(xiàn)代化正在成為一個(gè)共識(shí)。 近日,中國軟件行業(yè)協(xié)會(huì)首屆“應(yīng)用現(xiàn)代化產(chǎn)業(yè)實(shí)踐優(yōu)秀案例”評(píng)選結(jié)果揭曉, 軟通動(dòng)力應(yīng)用現(xiàn)代化研究中心打造的應(yīng)用現(xiàn)代化平臺(tái)
    的頭像 發(fā)表于 11-13 19:30 ?637次閱讀
    喜報(bào)丨軟通動(dòng)力應(yīng)用<b class='flag-5'>現(xiàn)代化</b>平臺(tái)<b class='flag-5'>工程</b>產(chǎn)品及服務(wù)解決方案榮獲“2023年應(yīng)用<b class='flag-5'>現(xiàn)代化</b>典型案例”稱號(hào)