1、來自C語言的%方式
print('%s %s' % ('Hello', 'world')) >>> Hello world
%號格式化字符串的方式繼承自古老的C語言,這在很多編程語言都有類似的實現(xiàn)。上例的%s是一個占位符,它僅代表一段字符串,并不是拼接的實際內(nèi)容。實際的拼接內(nèi)容在一個單獨的%號后面,放在一個元組里。
類似的占位符還有:%d(代表一個整數(shù))、%f(代表一個浮點數(shù))、%x(代表一個16進制數(shù)),等等。%占位符既是這種拼接方式的特點,同時也是其限制,因為每種占位符都有特定意義,實際使用起來太麻煩了。
2、format()拼接方式
# 簡潔版 s1 = 'Hello {}! My name is {}.'.format('World', 'Python貓') print(s1) >>>Hello World! My name is Python貓. # 對號入座版 s2 = 'Hello {0}! My name is {1}.'.format('World', 'Python貓') s3 = 'Hello {name1}! My name is {name2}.'.format(name1='World', name2='Python貓') print(s2) >>>Hello World! My name is Python貓. print(s3) >>>Hello World! My name is Python貓.
這種方式使用花括號{}做占位符,在format方法中再轉(zhuǎn)入實際的拼接值。容易看出,它實際上是對%號拼接方式的改進。這種方式在Python2.6中開始引入。
上例中,簡潔版的花括號中無內(nèi)容,缺點是容易弄錯次序。對號入座版主要有兩種,一種傳入序列號,一種則使用key-value的方式。實戰(zhàn)中,我們更推薦后一種,既不會數(shù)錯次序,又更直觀可讀。
3、() 類似元組方式
s_tuple = ('Hello', ' ', 'world') s_like_tuple = ('Hello' ' ' 'world') print(s_tuple) >>>('Hello', ' ', 'world') print(s_like_tuple) >>>Hello world type(s_like_tuple) >>>str
注意,上例中s_like_tuple并不是一個元組,因為元素間沒有逗號分隔符,這些元素間可以用空格間隔,也可以不要空格。使用type()查看,發(fā)現(xiàn)它就是一個str類型。我沒查到這是啥原因,猜測或許()括號中的內(nèi)容是被Python優(yōu)化處理了。
這種方式看起來很快捷,但是,括號()內(nèi)要求元素是真實字符串,不能混用變量,所以不夠靈活。
# 多元素時,不支持有變量 str_1 = 'Hello' str_2 = (str_1 'world') >>> SyntaxError: invalid syntax str_3 = (str_1 str_1) >>> SyntaxError: invalid syntax # 但是下面寫法不會報錯 str_4 = (str_1)
4、面向?qū)ο竽0迤唇?/strong>
from string import Template s = Template('${s1} ${s2}!') print(s.safe_substitute(s1='Hello',s2='world')) >>> Hello world!
說實話,我不喜歡這種實現(xiàn)方式。濃濃的一股被面向?qū)ο笏枷攵竞Φ某粑丁?/p>
就不多說了。
5、常用的+號方式
str_1 = 'Hello world! ' str_2 = 'My name is Python貓.' print(str_1 + str_2) >>>Hello world! My name is Python貓. print(str_1) >>>Hello world!
這種方式最常用、直觀、易懂,是入門級的實現(xiàn)方式。但是,它也存在兩處讓人容易犯錯的地方。
首先,新入門編程的同學(xué)容易犯錯,他們不知道字符串是不可變類型,新的字符串會獨占一塊新的內(nèi)存,而原來的字符串保持不變。上例中,拼接前有兩段字符串,拼接后實際有三段字符串。
其次,一些有經(jīng)驗的老程序員也容易犯錯,他們以為當(dāng)拼接次數(shù)不超過3時,使用+號連接符就會比其它方式快(ps:不少Python教程都是如此建議),但這沒有任何合理根據(jù)。
事實上,在拼接短的字面值時,由于CPython中的 常數(shù)折疊 (constant folding)功能,這些字面值會被轉(zhuǎn)換成更短的形式,例如'a'+'b'+'c' 被轉(zhuǎn)換成'abc','hello'+'world'也會被轉(zhuǎn)換成'hello world'。這種轉(zhuǎn)換是在編譯期完成的,而到了運行期時就不會再發(fā)生任何拼接操作,因此會加快整體計算的速度。
常數(shù)折疊優(yōu)化有一個限度,它要求拼接結(jié)果的長度不超過20。所以,當(dāng)拼接的最終字符串長度不超過20時,+號操作符的方式,會比后面提到的join等方式快得多,這與+號的使用次數(shù)無關(guān)。
題外話:你是否覺得20這個數(shù)字很熟悉呢?沒錯,我們之前在《Python中的“特權(quán)種族”是什么?》中提到過,字符串類的特權(quán)種族也是以20為限。當(dāng)時也有一個例子,展示了編譯期和運行期的區(qū)別,建議你去回看。
6、join()拼接方式
str_list = ['Hello', 'world'] str_join1 = ' '.join(str_list) str_join2 = '-'.join(str_list) print(str_join1) >>>Hello world print(str_join2) >>>Hello-world
str對象自帶的join()方法,接受一個序列參數(shù),可以實現(xiàn)拼接。拼接時,元素若不是字符串,需要先轉(zhuǎn)換一下??梢钥闯?,這種方法比較適用于連接序列對象中(例如列表)的元素,并設(shè)置統(tǒng)一的間隔符。
當(dāng)拼接長度超過20時,這種方式基本上是首選。不過,它的缺點就是,不適合進行零散片段的、不處于序列集合的元素拼接。
7、f-string方式
name = 'world' myname = 'python_cat' words = f'Hello {name}. My name is {myname}.' print(words) >>> Hello world. My name is python_cat.
f-string方式出自PEP 498(Literal String Interpolation,字面字符串插值),從Python3.6版本引入。其特點是在字符串前加 f 標(biāo)識,字符串中間則用花括號{}包裹其它字符串變量。
這種方式在可讀性上秒殺format()方式,處理長字符串的拼接時,速度與join()方法相當(dāng)。
盡管如此,這種方式與其它某些編程語言相比,還是欠優(yōu)雅,因為它引入了一個 f 標(biāo)識。而其它某些程序語言可以更簡練,比如shell:
name="world" myname="python_cat" words="Hello ${name}. My name is ${myname}." echo $words >>>Hello world. My name is python_cat.
總結(jié)一下,我們前面說的“字符串拼接”,其實是從結(jié)果上理解。若從實現(xiàn)原理上劃分的話,我們可以將這些方法劃分出三種類型:
格式化類:%、format()、template
拼接類:+、()、join()
插值類:f-string
當(dāng)要處理字符串列表等序列結(jié)構(gòu)時,采用join()方式;拼接長度不超過20時,選用+號操作符方式;長度超過20的情況,高版本選用f-string,低版本時看情況使用format()或join()方式。
One more thing:
你以為這就要結(jié)束了?
圖樣!這不是我的風(fēng)格!
我的風(fēng)格是發(fā)散思考、系統(tǒng)思考、以及追求編程哲學(xué)的思考。
最近,我在讀《黑客與畫家》,保羅?格雷厄姆在書中提出了這個問題:
從語義上看,字符串或多或少可以理解成列表的一個子集,其中的每一個元素都是字符。那么,為什么還需要把字符串單列為一種數(shù)據(jù)結(jié)構(gòu)呢?
作者認(rèn)為“編程語言設(shè)置字符串似乎就是一個過早優(yōu)化的例子”,這個觀點令我大為震撼!前文提到的七種拼接字符串的方法瞬間變成紙,薄得似乎一觸就破。
但是,作者認(rèn)為這還不夠,他還有更驚人想法:
還有比這更驚人的預(yù)言。在邏輯上其實不需要對整數(shù)設(shè)置單獨的表示法,因為可以把它們也看作列表,整數(shù)n可以用一個n元素的列表表示?!?編程語言會發(fā)展到放棄基本數(shù)據(jù)類型之一的整數(shù)這一步嗎?
不知道你讀完這段話,有何感想。我在閱讀時,雖然有上下文語境的鋪墊,還是驚嘆不已。
編輯:hfy
評論
查看更多