IT虾米网

python去除html标签

developer 2018年06月24日 编程语言 1011 0
python去除html标签,自己写的,若有不足请指正:
#! /usr/bin/env python 
#coding=utf-8 
# blueel 2013-01-19 
from HTMLParser import HTMLParser 
   
class MLStripper(HTMLParser): 
    def __init__(self): 
        self.reset() 
        self.fed = [] 
    def handle_data(self, d): 
        self.fed.append(d) 
    def get_data(self): 
        return ''.join(self.fed) 
   
def strip_tags(html): 
    s = MLStripper() 
    s.feed(html) 
    return s.get_data()

评论关闭
IT虾米网

微信公众号号:IT虾米 (左侧二维码扫一扫)欢迎添加!