确定网站风格,成都小学网站建设,好玩的网页游戏传奇,专业做app软件开发价格缓存是一种用于提高应用程序性能的技术#xff0c;它通过临时存储程序获得的结果#xff0c;以便在以后需要时重用它们。
在本文中#xff0c;我们将学习Python中的不同缓存技术#xff0c;包括functools模块中的 lru_cache和 cache装饰器。
简单示例#xff1a;Python缓…缓存是一种用于提高应用程序性能的技术它通过临时存储程序获得的结果以便在以后需要时重用它们。
在本文中我们将学习Python中的不同缓存技术包括functools模块中的 lru_cache和 cache装饰器。
简单示例Python缓存实现
要在Python中创建缓存我们可以使用functools模块中的cache装饰器。在下面的代码中注意print()函数只执行一次
import functoolsfunctools.cache
def square(n):print(fCalculating square of {n})return n * n# Testing the cached function
print(square(4)) # Output: Calculating square of 4 \n 16
print(square(4)) # Output: 16 (cached result, no recalculation)输出
Calculating square of 4
16
16Python中的缓存是什么
假设我们需要解决一个数学问题花一个小时得到正确的答案。如果第二天我们必须解决同样的问题那么重用我们以前的工作而不是从头开始会很有帮助。
Python中的缓存遵循类似的原则–它在函数调用中计算值时存储这些值以便在再次需要时重用它们。这种类型的缓存也称为记忆化。
让我们看一个简短的例子它计算了两次大范围的数字之和
output sum(range(100_000_001))
print(output)
output sum(range(100_000_001))
print(output)输出
5000000050000000
5000000050000000计算两次运行时间
import timeitprint(timeit.timeit(sum(range(100_000_001)),globalsglobals(),number1,)
)print(timeit.timeit(sum(range(100_000_001)),globalsglobals(),number1,)
)输出
1.2157779589979327
1.1848394999979064输出显示两个调用所花费的时间大致相同取决于我们的设置我们可能会获得更快或更慢的执行时间。
但是我们可以使用缓存来避免多次计算相同的值。我们可以使用内置functools模块重新定义
import functools
import timeitsum functools.cache(sum)print(timeit.timeit(sum(range(100_000_001)),globalsglobals(),number1,)
)print(timeit.timeit(sum(range(100_000_001)),globalsglobals(),number1,)
)输出
1.2760689580027247
2.3330067051574588e-06第二个调用现在需要几微秒的时间而不是一秒钟因为从0到100000000的数字之和的结果已经计算并缓存了-第二个调用使用之前计算和存储的值。
functools.cache()装饰器是在Python 3.9版本中添加的但我们可以在旧版本中使用functools.lru_cache()。
Python缓存不同的方法
Python的functools模块有两个装饰器用于将缓存应用于函数。让我们通过一个示例来探索functools.lru_cache()和functools.cache()。
让我们编写一个函数sum_digits()它接受一个数字序列并返回这些数字的位数之和。例如如果我们使用元组23438作为输入那么
23的数字之和是543的数字之和是78的数字之和是8因此总和为20。
这是我们可以编写sum_digits函数的一种方式
def sum_digits(numbers):return sum(int(digit) for number in numbers for digit in str(number))numbers 23, 43, 8print(sum_digits(numbers))输出
20让我们使用这个函数来探索创建缓存的不同方法。
Python手动缓存
让我们首先手动创建该高速缓存。虽然我们也可以很容易地自动化但手动创建缓存有助于我们理解这个过程。
让我们创建一个字典并在每次使用新值调用函数时添加键值对来存储结果。如果我们用一个已经存储在这个字典中的值调用函数函数将返回存储的值而不会再次计算
import random
import timeitdef sum_digits(numbers):if numbers not in sum_digits.my_cache:sum_digits.my_cache[numbers] sum(int(digit) for number in numbers for digit in str(number))return sum_digits.my_cache[numbers]
sum_digits.my_cache {}numbers tuple(random.randint(1, 1000) for _ in range(1_000_000))print(timeit.timeit(sum_digits(numbers),globalsglobals(),number1)
)print(timeit.timeit(sum_digits(numbers),globalsglobals(),number1)
)输出
0.28875587500078836
0.0044607500021811575第二次调用sum_digitsnumbers比第一次调用快得多因为它使用了缓存的值。
现在让我们更详细地解释上面的代码。首先请注意我们在定义函数后创建了字典sum_digits.my_cache即使我们在函数定义中使用了它。
函数的作用是检查传递给函数的参数是否已经是sum_digits.my_cache字典中的键之一。仅当参数不在该高速缓存中时才计算所有数字的和。
由于我们在调用函数时使用的参数作为字典中的键因此它必须是可散列数据类型。列表是不可散列的所以我们不能将它用作字典中的键。例如让我们尝试用列表而不是元组来替换数字-这将引发TypeError
# ...numbers [random.randint(1, 1000) for _ in range(1_000_000)]# ...输出
Traceback (most recent call last):
...
TypeError: unhashable type: list手动创建缓存非常适合学习但现在让我们探索更快的方法。
使用functools.lru_cache()进行Python缓存
Python从3.2版开始就有了lru_cache()装饰器。函数名开头的“lru”代表“least recently used”。我们可以把缓存看作是一个用来存储经常使用的东西的盒子–当它填满时LRU策略会扔掉我们很长时间没有使用过的东西为新的东西腾出空间。
让我们用functools.lru_cache来装饰sum_digits函数
import functools
import random
import timeitfunctools.lru_cache
def sum_digits(numbers):return sum(int(digit) for number in numbers for digit in str(number))numbers tuple(random.randint(1, 1000) for _ in range(1_000_000))print(timeit.timeit(sum_digits(numbers),globalsglobals(),number1)
)print(timeit.timeit(sum_digits(numbers),globalsglobals(),number1)
)输出
0.28326129099878017
0.002184917000704445多亏了缓存第二个调用的运行时间大大缩短。
默认情况下该高速缓存存储计算的前128个值。一旦所有128个位置都满了算法就会删除最近最少使用的LRU值为新值腾出空间。
当我们使用maxsize参数修饰函数时我们可以设置不同的最大缓存大小
import functools
import random
import timeitfunctools.lru_cache(maxsize5)
def sum_digits(numbers):return sum(int(digit) for number in numbers for digit in str(number))# ...在这种情况下该高速缓存仅存储5个值。如果我们不想限制该高速缓存的大小也可以将maxsize参数设置为None。
使用functools.cache()进行Python缓存
Python 3.9包含了一个更简单、更快速的缓存装饰器——functools. cache()。这个装饰器有两个主要特点
它没有最大大小-这类似于调用functools.lru_cachemaxsizeNone。它存储所有函数调用及其结果它不使用LRU策略。这适用于输出相对较小的函数或者当我们不需要担心缓存大小限制时。
让我们在sum_digits函数上使用functools.cache装饰器
import functools
import random
import timeitfunctools.cache
def sum_digits(numbers):return sum(int(digit) for number in numbers for digit in str(number))numbers tuple(random.randint(1, 1000) for _ in range(1_000_000))print(timeit.timeit(sum_digits(numbers),globalsglobals(),number1)
)print(timeit.timeit(sum_digits(numbers),globalsglobals(),number1)
)输出
0.16661812500024098
0.0018135829996026587使用functools.cache修饰sum_digits()等效于将sum_digits赋值给functools.cache()
# ...def sum_digits(numbers):return sum(int(digit) for number in numbers for digit in str(number))sum_digits functools.cache(sum_digits)请注意我们也可以使用不同的导入方式
from functools import cache这样我们就可以只使用cache来装饰我们的函数。
其他缓存策略
Python自己的工具实现了LRU缓存策略删除最近最少使用的条目为新值腾出空间。 让我们来看看其他一些缓存策略
先进先出FIFO当该高速缓存已满时删除添加的第一个项为新值腾出空间。LRU和FIFO之间的区别在于LRU将最近使用的项保存在该高速缓存中而FIFO丢弃最旧的项而不管是否使用。后进先出LIFO当该高速缓存已满时删除最近添加的项。想象一下自助餐厅里的一堆盘子。我们最近放入堆栈的盘子最后一个是我们将首先取出的盘子第一个。Most-recently usedMRU当该高速缓存中需要空间时将丢弃最近使用的值。随机替换RR该策略随机丢弃一个项目为新项目腾出空间。
这些策略还可以与有效生存期的度量相结合有效生存期指的是该高速缓存中的一段数据被认为有效或相关的时间。想象一下缓存中的一篇新闻文章。它可能经常被访问LRU会保留它但一周后新闻可能会过时。
Python中缓存时的常见挑战
我们已经了解了Python中缓存的优点。在实现缓存时还需要记住一些挑战和缺点
缓存失效和一致性数据可能会随着时间而变化。因此存储在缓存中的值也可能需要更新或删除。内存管理在缓存中存储大量数据需要内存如果缓存无限增长这可能会导致性能问题。复杂性添加缓存会在创建和维护该高速缓存时给系统带来复杂性。通常好处大于这些成本但这种增加的复杂性可能会导致难以发现和纠正的错误。
结论
当对同一数据重复执行计算密集型操作时我们可以使用缓存来优化性能。
Python有两个装饰器在调用函数时创建缓存functools模块中的lru_cache和cache。
但是我们需要确保该高速缓存保持最新并正确管理内存。