正则匹配，但过滤某些字符串 · Python爬虫

~~~ s= '<div>abcde</div><div>bbbba</div><div> fdsfdsa</div>' In [15]: re.findall("<div>((?!abcde).*?)</div>",s) Out[15]: ['bbbba', ' fdsfdsa'] ~~~ 含有abcde的就不匹配 ~~~ re.findall("<div>(((?!abcde).)*?)</div>",s) ~~~ ~~~ .*里面不包含 "<a" (?!<a).* ~~~ ~~~ In [148]: buf Out[148]: '<a href=""></a> <a class="view"></a>' In [149]: re.findall('<a.*?class="view".*?</a>',buf) Out[149]: ['<a href=""></a> <a class="view"></a>'] In [150]: re.findall('(<a((?!<a).)*?class="view".*?</a>)',buf) Out[150]: [('<a class="view"></a>', ' ')] ~~~