Filter

filter函数用于过滤序列。

和map()类似,filter函数也接收一个函数和序列。和map()不同的是,filter()把传入的函数作用于序列的每个元素,然后根据返回值是True还是False决定丢弃还是保留该元素。 True为丢弃。

例如,在一个list中,删掉偶数,只保留奇数:

def is_odd(n):

    return n % 2 == 1

list(filter(is_odd,[1,2,3,4,5,6,7,8,9,10]))

#结果是:[1,3,5,7,9]

把一个序列中的空字符去掉,可以这么写:

def not_empty(s):

    return s and s.strip()

list(filter(not_empty,['A','B',None,'C',' ']))

#结果:['A','B','C']

可见用filter()这个高阶函数,关键在于正确实现一个“筛选”函数。

注意到filter()函数返回的是一个Iterator,也就是一个惰性序列,所以强迫filter()完成计算结果, 必须使用list()函数获得所有结果并返回list。

用filter求素数

计算素数的一个方法是埃氏筛选法,它的算法理解起来非常简单:

首先列出从2开始的所有自然数,构造一个序列:
2,3,4,5,6,7,8,9,...

取序列的第一个数2,它一定是素数,然后用2把2的倍数都过滤掉:

3,5,7,9,11,13,15,17,19,...

取新序列的第一个数3,它一定是素数,然后用3把3的倍数都过滤掉:

5,7,11,13,17,19,...

取新序列的第一个数5,然后用5把5的倍数过滤掉:

7,11,13,19,...

不断筛选下去,就可以得到全体素数。

用Python实现这个算法,可以先构造一个从3开始的奇数列:

def _odd_iter():
    n =1

    while True:

        n = n+2

        yield n

注意这是一个生成器,并且是无限的。

然后定义一个筛选函数:

def _not_divisible(n):

    return lambda x: x % n >0

最后定义一个生成器,不断返回素数:

def primes():
    yield 2

    it = _odd_iter()

    while True:

        n =next(it)

       yield n

        it = filter(_not_divisible(n),it)

这个生成器先返回第一个素数2,然后利用filter()不断产生筛选后的新的序列。

由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:

for n in primes():
    if n < 1000:

        print (n)

    else:

        break

注意Iterator是惰性计算的序列,所以我们可以使用Python表示全体自然数,全体素数这样的序列。而且代码非常简洁。