0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

排序算法merge-sort的基礎(chǔ)知識

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:Richmond Alake ? 2022-04-07 17:54 ? 次閱讀

數(shù)據(jù)科學(xué)家每天都在處理算法。然而,數(shù)據(jù)科學(xué)學(xué)科作為一個整體已經(jīng)發(fā)展成為一個不涉及復(fù)雜算法實現(xiàn)的角色。盡管如此,從業(yè)者仍然可以從對算法的理解和掌握中獲益。

本文介紹、解釋、評估和實現(xiàn)了排序算法merge-sort 。本文的目的是為您提供有關(guān)合并排序算法的可靠背景信息,該算法是更復(fù)雜算法的基礎(chǔ)知識。

盡管合并排序不被認為是復(fù)雜的,但是理解該算法將有助于您認識到選擇最有效的算法來執(zhí)行與數(shù)據(jù)相關(guān)的任務(wù)時需要考慮的因素。創(chuàng)建于 1945 年的 約翰·馮·諾依曼 使用分治方法開發(fā)了合并排序算法。

分而治之

要理解合并排序算法,您必須熟悉分治范式,以及遞歸的編程概念。計算機科學(xué)領(lǐng)域中的遞歸是指定義用于解決問題的方法在其實現(xiàn)體中調(diào)用自身。

換句話說,函數(shù)會反復(fù)調(diào)用自身。

poYBAGJOtXKAPxgQAAAqvv39_RU043.png

圖 1 。遞歸的視覺圖解——作者的圖像 .

分治算法(合并排序是一種)在其方法中使用遞歸來解決特定問題。分治算法將復(fù)雜問題分解為更小的子部分,其中定義的解決方案遞歸地應(yīng)用于每個子部分。然后分別求解每個子部分,并重新組合解決方案以解決原始問題。

分而治之的算法設(shè)計方法結(jié)合了三個主要元素:

將較大的問題分解為較小的子問題。(分開)

遞歸使用函數(shù)來解決每個較小的子問題。(征服)

最終的解決方案是對較大問題的較小子問題的解決方案的組合。(合并)

其他算法使用分治范式,如快速排序、二進制搜索和 Strassen 算法。

合并排序

在按升序?qū)α斜碇械脑剡M行排序的上下文中, merge-sort 方法將列表分成兩半,然后迭代新的兩半,不斷地將它們進一步分成更小的部分。

隨后,對較小的一半進行比較,并將結(jié)果組合在一起,形成最終的排序列表。

步驟和實施

合并排序算法的實現(xiàn)分為三步。分而治之,然后結(jié)合。

分而治之方法的分而治之部分是第一步。這個初始步驟將整個列表分成兩個較小的部分。然后,列表被進一步分解,直到它們不能再被分割,在每個減半的列表中只留下一個元素項。

合并排序的第二階段中的遞歸循環(huán)與按特定順序排序的列表元素有關(guān)。在這種情況下,初始數(shù)組按升序排序。

在下圖中,您可以看到合并排序算法中涉及的分割、比較和組合步驟。

poYBAGJOtWuAAqNRAAB0QxnjTUg246.png

圖 2 。按作者劃分合并排序算法圖像的組件插圖。

pYYBAGJOtWWAFxt2AABUOZMpew4102.png

圖 3 。征服和結(jié)合的組成部分形象的作者。

要自己實現(xiàn)這一點:

創(chuàng)建一個名為 merge _ sort 的函數(shù),該函數(shù)接受整數(shù)列表作為參數(shù)。以下所有說明均在此功能范圍內(nèi)。

首先把清單分成兩半。記錄列表的初始長度。

檢查記錄的長度是否等于 1 。如果條件的計算結(jié)果為 true ,則返回列表,因為這意味著列表中只有一個元素。因此,不需要劃分清單。

獲取元素數(shù)大于 1 的列表的中點。使用 Python 語言時,//執(zhí)行除法,不帶余數(shù)。它將除法結(jié)果四舍五入到最接近的整數(shù)。這也被稱為樓層劃分。

使用中點作為參考點,將列表拆分為兩半。這是分而治之算法范例的分而治之的一面。

Recursion is leveraged at this step to facilitate the division of lists into halved components. The variables ‘left_half’ and ‘right_half’ are assigned to the invocation of the ‘ merge_sort’ function, accepting the two halves of the initial list as parameters.

“ merge_sort ”函數(shù)返回對一個函數(shù)的調(diào)用,該函數(shù)將兩個列表合并,以返回一個組合的排序列表。

  • 序列表。
def merge_sort(list: [int]): list_length = len(list) if list_length == 1: return list mid_point = list_length // 2 left_half = merge_sort(list[:mid_point]) right_half = merge_sort(list[mid_point:]) return merge(left_half, right_half)
  • 創(chuàng)建一個‘merge’函數(shù),該函數(shù)接受兩個整數(shù)列表作為其參數(shù)。此函數(shù)包含分治算法范例的征服和合并方面。以下所有步驟均在此函數(shù)體中執(zhí)行。
  • 為保存已排序整數(shù)的變量“ output ”分配一個空列表。
  • 指針‘i’‘j’分別用于為左列表和右列表編制索引。
  • 在 while 循環(huán)中,對左列表和右列表的元素進行比較。每次比較后,輸出列表將填充在兩個比較的元素中。追加元素列表的指針遞增。
  • 要添加到排序列表的其余元素是從當(dāng)前指針值到相應(yīng)列表末尾的元素。
def merge(left, right): output = [] i = j = 0 while (i < len(left) and j < len(right)): if left[i] < right[j]: output.append(left[i]) i +=1 else: output.append(right[j]) j +=1 output.extend(left[i:]) output.extend(right[j:]) return output unsorted_list = [2, 4, 1, 5, 7, 2, 6, 1, 1, 6, 4, 10, 33, 5, 7, 23]
sorted_list = merge_sort(unsorted_list)
print(unsorted_list)
print(sorted_list)

性能和復(fù)雜性

大 O 表示法是一種標(biāo)準(zhǔn),用于定義和組織算法在空間需求和執(zhí)行時間方面的性能。

合并排序算法在最佳、最差和平均情況下的時間復(fù)雜度相同。對于大小為 n 的列表,合并排序算法要完成的預(yù)期步驟數(shù)、最小步驟數(shù)和最大步驟數(shù)都是相同的。

正如本文前面提到的,合并排序算法分為三個步驟:劃分、征服和合并?!胺指睢辈襟E涉及到列表中點的計算,無論列表大小如何,它都只需要一個操作步驟。因此,該操作的符號表示為 O(1) 。

“征服”步驟包括劃分和遞歸求解子數(shù)組—— logn 表示這一點?!昂喜ⅰ辈襟E包括將結(jié)果合并到最終列表中;此操作執(zhí)行時間取決于列表大小,并表示為 O(n) 。

平均、最佳和最差時間復(fù)雜度的合并排序表示法是 log n * n * O ( 1 ) 。在大 O 表示法中,低階項和常數(shù)可以忽略不計,這意味著合并排序算法的最終表示法是 O ( n 日志 n ) 。有關(guān)合并排序算法的詳細分析,請參閱 article 。

評價

合并排序在對大型列表進行排序時表現(xiàn)良好,但在較小列表上使用時,其操作時間比其他排序解決方案慢。合并排序的另一個缺點是,即使初始列表已經(jīng)排序,它也會執(zhí)行操作步驟。在鏈表排序的用例中,合并排序是最快的排序算法之一。合并排序可用于外部存儲系統(tǒng)(如硬盤)中的文件排序。

關(guān)鍵外賣

本文描述了合并排序技術(shù),將其分解為組成操作和逐步過程。

合并排序算法是常用的,與其他排序算法相比,該算法背后的直覺和實現(xiàn)相當(dāng)簡單。本文包括 Python 中合并排序算法的實現(xiàn)步驟。

您還應(yīng)該知道,在不同情況下,合并排序方法的執(zhí)行時間的時間復(fù)雜度在最佳、最差和平均情況下保持不變。建議在以下情況下使用合并排序算法:

處理較大的數(shù)據(jù)集時,請使用合并排序算法。與其他排序算法相比,合并排序在小數(shù)組上的性能較差。

鏈表中的元素引用了列表中的下一個元素。這意味著在合并排序算法操作中,指針是可修改的,使得元素的比較和插入具有恒定的時間和空間復(fù)雜性。

確定數(shù)組是未排序的。即使在排序的數(shù)組上, Merge-sort 也會執(zhí)行其操作,這是對計算資源的浪費。

當(dāng)考慮到數(shù)據(jù)的穩(wěn)定性時,使用合并排序。穩(wěn)定排序涉及保持數(shù)組中相同值的順序。與未排序的數(shù)據(jù)輸入相比,穩(wěn)定排序中整個數(shù)組中相同值的順序在排序后的輸出中保持在相同的位置。

關(guān)于作者

Richmond Alake 是一名機器學(xué)習(xí)計算機視覺工程師,他與多家初創(chuàng)公司和公司合作,整合深度學(xué)習(xí)模型,以解決商業(yè)應(yīng)用中的計算機視覺任務(wù)。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4816

    瀏覽量

    102633
收藏 人收藏

    評論

    相關(guān)推薦

    時間復(fù)雜度為 O(n^2) 的排序算法

    作者:京東保險 王奕龍 對于小規(guī)模數(shù)據(jù),我們可以選用時間復(fù)雜度為 O(n2) 的排序算法。因為時間復(fù)雜度并不代表實際代碼的執(zhí)行時間,它省去了低階、系數(shù)和常數(shù),僅代表的增長趨勢,所以在小規(guī)模數(shù)據(jù)情況下
    的頭像 發(fā)表于 10-19 16:31 ?650次閱讀
    時間復(fù)雜度為 O(n^2) 的<b class='flag-5'>排序</b><b class='flag-5'>算法</b>

    負載開關(guān)基礎(chǔ)知識

    電子發(fā)燒友網(wǎng)站提供《負載開關(guān)基礎(chǔ)知識.pdf》資料免費下載
    發(fā)表于 10-08 09:56 ?1次下載
    負載開關(guān)<b class='flag-5'>基礎(chǔ)知識</b>

    品質(zhì)管理基礎(chǔ)知識

    品質(zhì)管理基礎(chǔ)知識
    的頭像 發(fā)表于 09-24 11:04 ?157次閱讀
    品質(zhì)管理<b class='flag-5'>基礎(chǔ)知識</b>

    手把手教你排序算法怎么寫

    今天以直接插入排序算法,給大家分享一下排序算法的實現(xiàn)思路,主要包含以下部分內(nèi)容:插入排序介紹插入排序
    的頭像 發(fā)表于 06-04 08:03 ?594次閱讀
    手把手教你<b class='flag-5'>排序</b><b class='flag-5'>算法</b>怎么寫

    Linux的sort命令介紹

    時,只考慮可打印字符,忽略不可打印字符 -m, --merge 合并多個已排序的文件 -n, --numeric-sort 按數(shù)值大小排序 -o, --output=FILE 將
    發(fā)表于 04-08 07:16

    FPGA實現(xiàn)雙調(diào)排序算法的探索與實踐

    雙調(diào)排序(BitonicSort)是數(shù)據(jù)獨立(Data-independent)的排序算法,即比較順序與數(shù)據(jù)無關(guān),特別適合并行執(zhí)行。在了解雙調(diào)排序
    發(fā)表于 03-14 09:50 ?446次閱讀
    FPGA實現(xiàn)雙調(diào)<b class='flag-5'>排序</b><b class='flag-5'>算法</b>的探索與實踐

    C語言實現(xiàn)經(jīng)典排序算法概覽

    冒泡排序(英語:Bubble Sort)是一種簡單的排序算法。它重復(fù)地走訪過要排序的數(shù)列,一次比較兩個元素,如果他們的順序(如從大到小、首字
    的頭像 發(fā)表于 02-25 12:27 ?393次閱讀
    C語言實現(xiàn)經(jīng)典<b class='flag-5'>排序</b><b class='flag-5'>算法</b>概覽

    FPGA基礎(chǔ)知識介紹

    電子發(fā)燒友網(wǎng)站提供《FPGA基礎(chǔ)知識介紹.pdf》資料免費下載
    發(fā)表于 02-23 09:45 ?27次下載

    射頻與微波基礎(chǔ)知識

    射頻與微波基礎(chǔ)知識
    的頭像 發(fā)表于 01-16 10:05 ?740次閱讀
    射頻與微波<b class='flag-5'>基礎(chǔ)知識</b>

    十大排序算法總結(jié)

    排序算法是最經(jīng)典的算法知識。因為其實現(xiàn)代碼短,應(yīng)該廣,在面試中經(jīng)常會問到排序算法及其相關(guān)的問題。
    的頭像 發(fā)表于 12-20 10:39 ?1046次閱讀

    電氣技術(shù)基礎(chǔ)知識

    電氣技術(shù)基礎(chǔ)知識
    的頭像 發(fā)表于 12-14 09:11 ?1427次閱讀
    電氣技術(shù)<b class='flag-5'>基礎(chǔ)知識</b>

    電子元器件的基礎(chǔ)知識

    電子元器件的基礎(chǔ)知識
    的頭像 發(fā)表于 12-04 10:42 ?4746次閱讀
    電子元器件的<b class='flag-5'>基礎(chǔ)知識</b>

    sort函數(shù)python用法

    sort()函數(shù)是Python中的內(nèi)置函數(shù)之一,用于對可迭代對象進行排序??傻鷮ο蟀斜怼⒃M和字符串等。sort()函數(shù)是一個靈活而強大的函數(shù),在數(shù)據(jù)分析、算法實現(xiàn)等方面有著廣泛
    的頭像 發(fā)表于 11-21 15:15 ?1128次閱讀

    SPI協(xié)議基礎(chǔ)知識

    電子發(fā)燒友網(wǎng)站提供《SPI協(xié)議基礎(chǔ)知識.pdf》資料免費下載
    發(fā)表于 11-16 10:32 ?1次下載
    SPI協(xié)議<b class='flag-5'>基礎(chǔ)知識</b>

    電池的基礎(chǔ)知識

    電子發(fā)燒友網(wǎng)站提供《電池的基礎(chǔ)知識.doc》資料免費下載
    發(fā)表于 11-15 11:29 ?1次下載
    電池的<b class='flag-5'>基礎(chǔ)知識</b>