因?yàn)樽值涫峭ㄟ^鍵來索引的,關(guān)聯(lián)到相對的值,理論上他的查詢復(fù)雜度是O(1)。
創(chuàng)新互聯(lián)公司專注于曲水網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供曲水營銷型網(wǎng)站建設(shè),曲水網(wǎng)站制作、曲水網(wǎng)頁設(shè)計(jì)、曲水網(wǎng)站官網(wǎng)定制、小程序制作服務(wù),打造曲水網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供曲水網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。
哈希表(也叫散列表),根據(jù)關(guān)鍵值對(Key-value)而直接進(jìn)行訪問的數(shù)據(jù)結(jié)構(gòu)。它通過把key和value映射到表中一個(gè)位置來訪問記錄,這種查詢速度非???,更新也快。而這個(gè)映射函數(shù)叫做哈希函數(shù),存放值的數(shù)組叫做哈希表。 哈希函數(shù)的實(shí)現(xiàn)方式?jīng)Q定了哈希表的搜索效率。
1. PIL.Image.open
代碼在這里:Pillow/Image.py at 3.1.x · python-pillow/Pillow · GitHub
open() 函數(shù)打開圖像,但并不讀入,直到有操作發(fā)生。
具體的讀取操作是在 ImageFile.py 寫的。大體流程是先檢測文件類型,整塊地讀入文件內(nèi)容,然后調(diào)用解碼器解碼,做了很多優(yōu)化,效率應(yīng)該還是很高的。
2. scipy.ndimage.imread
代碼在這里:scipy/io.py at v0.17.1 · scipy/scipy · GitHub
imread 調(diào)用 scipy.misc.pilutil.imread。從名字就能看出來其實(shí)調(diào)用的還是 Pillow。
根據(jù) pilutil 代碼:scipy/pilutil.py at v0.17.1 · scipy/scipy · GitHub
確實(shí)是調(diào)用 pil.image.open(),然后返回一個(gè) fromimage()。
3. scipy.misc.imread
misc 的 __init__.py 在這里:scipy/__init__.py at v0.17.1 · scipy/scipy · GitHub
調(diào)用的還是 pilutil 中的 imread
相關(guān)代碼如下
try:
from .pilutil import *
from . import pilutil
__all__ += pilutil.__all__
del pilutil
except ImportError:
pass
也算是學(xué)了一招,從 pilutil 導(dǎo)入其所有函數(shù)添加到當(dāng)前空間,然后又刪除了 pilutil 消除影響。
4. skimage.io.imread
代碼在這里:scikit-image/_io.py at master · scikit-image/scikit-image · GitHub
是通過插件 plugin 來讀入不同的文件,而且會(huì)試用幾個(gè)不同的 plugins 來找到合適的。
使用 call_plugin 來調(diào)用,代碼在這里:scikit-image/manage_plugins.py at master · scikit-image/scikit-image · GitHub
可以根據(jù)如下代碼查看插件調(diào)用的優(yōu)先級
# For each plugin type, default to the first available plugin as defined by
# the following preferences.
preferred_plugins = {
# Default plugins for all types (overridden by specific types below).
'all': ['pil', 'matplotlib', 'qt', 'freeimage'],
'imshow': ['matplotlib'],
'imshow_collection': ['matplotlib']
}
plugins 的源代碼在這里:scikit-image/skimage/io/_plugins at master · scikit-image/scikit-image · GitHub。可以看到 pil 的 imread,是用 open 打開圖像之后,再轉(zhuǎn)換成 ndarray。
5. cv2.imread
這里是調(diào)用的 CV::imread(),代碼在這里:opencv/loadsave.cpp at master · opencv/opencv · GitHub。一般來說 C\C++ 的實(shí)現(xiàn),應(yīng)該比 python 速度快一點(diǎn)。
6. matplotlib.image.imread
matplotlib 的文檔里面說,matplotlib 原生只可以讀取 PNG 文件,有 PIL 的時(shí)候,可以讀取其他類型的文件。如果使用 URL 打開在線圖像文件,需要符合 PIL 的文檔要求。
matplotlib.image.imread 的代碼在這里:matplotlib/image.py at master · matplotlib/matplotlib · GitHub。matplotlib 的原生 PNG 讀取和寫入,是用 C 實(shí)現(xiàn)的,代碼在這里:matplotlib/_png.cpp at master · matplotlib/matplotlib · GitHub。
matplotlib 是先用 pil 的 open 打開圖像,如果格式是 png,就用原生方法打開。相關(guān)代碼如下:
handlers = {'png': _png.read_png, }
if format is None:
if cbook.is_string_like(fname):
parsed = urlparse(fname)
# If the string is a URL, assume png
if len(parsed.scheme) 1:
ext = 'png'
else:
basename, ext = os.path.splitext(fname)
ext = ext.lower()[1:]
elif hasattr(fname, 'name'):
basename, ext = os.path.splitext(fname.name)
ext = ext.lower()[1:]
else:
ext = 'png'
else:
ext = format
if ext not in handlers:
im = pilread(fname)
if im is None:
raise ValueError('Only know how to handle extensions: %s; '
'with Pillow installed matplotlib can handle '
'more images' % list(six.iterkeys(handlers)))
return im
聲明的處理器只有 png。如果是 png 文件,調(diào)用 _png.read_png。如果不是 png 直接使用 pilread(就是用 pil 的 Image.open 然后 pil_to_array)。
matplotlib 的源碼確實(shí)比較復(fù)雜,一大部分主體是用 C 寫的,改動(dòng)很激進(jìn),功能更新猛烈。
super()函數(shù)的用處是調(diào)用當(dāng)前類的父類函數(shù)。在要調(diào)用父類的函數(shù)之外,還需要加一點(diǎn)別的操作的時(shí)候,特別有用。
例:
結(jié)果是:
上面是單繼承的例子,用super()而不是直接用父類的名字去調(diào)用父類函數(shù)的好處是不用管父類的名字。即使父類改名了,super()的調(diào)用依然有效。
多重繼承的時(shí)候需要根據(jù)MRO來決定調(diào)用順序。詳見官方文檔:
Python中有許多內(nèi)置函數(shù),不像print、len那么廣為人知,但它們的功能卻異常強(qiáng)大,用好了可以大大提高代碼效率,同時(shí)提升代碼的簡潔度,增強(qiáng)可閱讀性
Counter
collections在python官方文檔中的解釋是High-performance container datatypes,直接的中文翻譯解釋高性能容量數(shù)據(jù)類型。這個(gè)模塊實(shí)現(xiàn)了特定目標(biāo)的容器,以提供Python標(biāo)準(zhǔn)內(nèi)建容器 dict , list , set , 和 tuple 的替代選擇。在python3.10.1中它總共包含以下幾種數(shù)據(jù)類型:
容器名簡介
namedtuple() 創(chuàng)建命名元組子類的工廠函數(shù)
deque 類似列表(list)的容器,實(shí)現(xiàn)了在兩端快速添加(append)和彈出(pop)
ChainMap 類似字典(dict)的容器類,將多個(gè)映射集合到一個(gè)視圖里面
Counter 字典的子類,提供了可哈希對象的計(jì)數(shù)功能
OrderedDict 字典的子類,保存了他們被添加的順序
defaultdict 字典的子類,提供了一個(gè)工廠函數(shù),為字典查詢提供一個(gè)默認(rèn)值
UserDict 封裝了字典對象,簡化了字典子類化
UserList 封裝了列表對象,簡化了列表子類化
UserString 封裝了字符串對象,簡化了字符串子類化
其中Counter中文意思是計(jì)數(shù)器,也就是我們常用于統(tǒng)計(jì)的一種數(shù)據(jù)類型,在使用Counter之后可以讓我們的代碼更加簡單易讀。Counter類繼承dict類,所以它能使用dict類里面的方法
舉例
#統(tǒng)計(jì)詞頻
fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']
result = {}
for fruit in fruits:
if not result.get(fruit):
result[fruit] = 1
else:
result[fruit] += 1
print(result)
#{'apple': 2, 'peach': 3, 'lemon': 1}下面我們看用Counter怎么實(shí)現(xiàn):
from collections import Counter
fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']
c = Counter(fruits)
print(dict(c))
#{'apple': 2, 'peach': 3, 'lemon': 1}顯然代碼更加簡單了,也更容易閱讀和維護(hù)了。
elements()
返回一個(gè)迭代器,其中每個(gè)元素將重復(fù)出現(xiàn)計(jì)數(shù)值所指定次。元素會(huì)按首次出現(xiàn)的順序返回。如果一個(gè)元素的計(jì)數(shù)值小于1,elements()將會(huì)忽略它。
c = Counter(a=4, b=2, c=0, d=-2)
sorted(c.elements())
['a', 'a', 'a', 'a', 'b', 'b']most_common([n])
返回一個(gè)列表,其中包含n個(gè)最常見的元素及出現(xiàn)次數(shù),按常見程度由高到低排序。如果n被省略或?yàn)镹one,most_common()將返回計(jì)數(shù)器中的所有元素。計(jì)數(shù)值相等的元素按首次出現(xiàn)的順序排序:
Counter('abracadabra').most_common(3)
[('a', 5), ('b', 2), ('r', 2)]這兩個(gè)方法是Counter中最常用的方法,其他方法可以參考 python3.10.1官方文檔
實(shí)戰(zhàn)
Leetcode 1002.查找共用字符
給你一個(gè)字符串?dāng)?shù)組words,請你找出所有在words的每個(gè)字符串中都出現(xiàn)的共用字符(包括重復(fù)字符),并以數(shù)組形式返回。你可以按任意順序返回答案。
輸入:words = ["bella", "label", "roller"]
輸出:["e", "l", "l"]
輸入:words = ["cool", "lock", "cook"]
輸出:["c", "o"]看到統(tǒng)計(jì)字符,典型的可以用Counter完美解決。這道題是找出字符串列表里面每個(gè)元素都包含的字符,首先可以用Counter計(jì)算出每個(gè)元素每個(gè)字符出現(xiàn)的次數(shù),依次取交集最后得出所有元素共同存在的字符,然后利用elements輸出共用字符出現(xiàn)的次數(shù)
class Solution:
def commonChars(self, words: List[str]) - List[str]:
from collections import Counter
ans = Counter(words[0])
for i in words[1:]:
ans = Counter(i)
return list(ans.elements())提交一下,發(fā)現(xiàn)83個(gè)測試用例耗時(shí)48ms,速度還是不錯(cuò)的
sorted
在處理數(shù)據(jù)過程中,我們經(jīng)常會(huì)用到排序操作,比如將列表、字典、元組里面的元素正/倒排序。這時(shí)候就需要用到sorted(),它可以對任何可迭代對象進(jìn)行排序,并返回列表
對列表升序操作:
a = sorted([2, 4, 3, 7, 1, 9])
print(a)
# 輸出:[1, 2, 3, 4, 7, 9]對元組倒序操作:
sorted((4,1,9,6),reverse=True)
print(a)
# 輸出:[9, 6, 4, 1]使用參數(shù):key,根據(jù)自定義規(guī)則,按字符串長度來排序:
fruits = ['apple', 'watermelon', 'pear', 'banana']
a = sorted(fruits, key = lambda x : len(x))
print(a)
# 輸出:['pear', 'apple', 'banana', 'watermelon']all
all() 函數(shù)用于判斷給定的可迭代參數(shù)iterable中的所有元素是否都為 TRUE,如果是返回 True,否則返回 False。元素除了是 0、空、None、False外都算True。注意:空元組、空列表返回值為True。
all(['a', 'b', 'c', 'd']) # 列表list,元素都不為空或0
True
all(['a', 'b', '', 'd']) # 列表list,存在一個(gè)為空的元素
False
all([0, 1,2, 3]) # 列表list,存在一個(gè)為0的元素
False
all(('a', 'b', 'c', 'd')) # 元組tuple,元素都不為空或0
True
all(('a', 'b', '', 'd')) # 元組tuple,存在一個(gè)為空的元素
False
all((0, 1, 2, 3)) # 元組tuple,存在一個(gè)為0的元素
False
all([]) # 空列表
True
all(()) # 空元組
Trueany函數(shù)正好和all函數(shù)相反:判斷一個(gè)tuple或者list是否全為空,0,F(xiàn)alse。如果全為空,0,F(xiàn)alse,則返回False;如果不全為空,則返回True。
F-strings
在python3.6.2版本中,PEP 498提出一種新型字符串格式化機(jī)制,被稱為 “字符串插值” 或者更常見的一種稱呼是F-strings,F(xiàn)-strings提供了一種明確且方便的方式將python表達(dá)式嵌入到字符串中來進(jìn)行格式化:
s1='Hello'
s2='World'
print(f'{s1} {s2}!')
# Hello World!在F-strings中我們也可以執(zhí)行函數(shù):
def power(x):
return x*x
x=4
print(f'{x} * {x} = {power(x)}')
# 4 * 4 = 16而且F-strings的運(yùn)行速度很快,比傳統(tǒng)的%-string和str.format()這兩種格式化方法都快得多,書寫起來也更加簡單。
本文主要講解了python幾種冷門但好用的函數(shù),更多內(nèi)容以后會(huì)陸陸續(xù)續(xù)更新~
pairplot函數(shù)。7在python中快速瀏覽數(shù)據(jù)集調(diào)用pairplot函數(shù),此函數(shù)使用散點(diǎn)圖和直方圖,還可以在非對角線上繪制回歸圖,在對角線上繪制核密度估計(jì)圖。
1.把range全部換成xrange
2.生成器,如 list=(item for item in fp)
3.利用psyco庫,提高函數(shù)和類的運(yùn)行效率。
4.字符串拼接:盡量少用“+”的方式,而采用''.join ,還有"%s"%i這樣賦值的手段
5.函數(shù)的開銷很大。盡量把循環(huán)放在函數(shù)內(nèi)進(jìn)行。而不要讓每次迭代都調(diào)用函數(shù)。
6.“前提工作”先做好,比如該賦值,該拼接的,然后再引入到函數(shù)中,或者進(jìn)行下面的循環(huán)。
7.盡量使用內(nèi)置方法,因?yàn)閮?nèi)置的是C寫的,效率肯定高很多
8.每當(dāng)要對序列中的內(nèi)容進(jìn)行循環(huán)處理時(shí),就應(yīng)當(dāng)嘗試用列表解析來代替它,如:[i for i in xrang(10) if i%2==0]
9.學(xué)會(huì)使用itertools模塊。當(dāng)python中添加了迭代器后,就為常見模式提供了一個(gè)新的模塊,因?yàn)樗且訡語言編寫,所以提供了最高效的迭代器。
--多記錄一些。列表,字符串,字典,xrange,類文件對象,這些都是可迭代對象,換句話說,都可以直接用在for循環(huán)中進(jìn)行迭代,如for item in open('1.txt')
--直接使用速度會(huì)快。另外,我對比了itertools里工具和xrange,比如都循環(huán)100000次打印數(shù)字,使用islice(count(),100000)均要比xrange(100000)快
--而xrange還要比range快。
10.用列表解析取代for循環(huán)。列表解析的效率等于或高于map。
11.垃圾回收機(jī)制,會(huì)對列表的操作有重大影響,如列表的append,或者列表解析。import gc,然后在數(shù)據(jù)載入模塊前gc.disable(),結(jié)束后再gc.enable()。
名稱欄目:python速度快的函數(shù),python 加快計(jì)算速度
網(wǎng)站路徑:http://vcdvsql.cn/article12/hsjpgc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作、微信小程序、外貿(mào)建站、網(wǎng)站設(shè)計(jì)、小程序開發(fā)、標(biāo)簽優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)