中胜智库网

 找回密码
 立即注册
查看: 55|回复: 0

python除去html标签

[复制链接]
发表于 2017-9-10 20:04:45 | 显示全部楼层 |阅读模式
python除去html标签
                                               
               
使用html">python自带的HTMLParser 实现。
#! usr bin env html">python
# -*- coding: utf-8 -*-
import urllib2,re
import time,sys
from HTMLParser import HTMLParser
#设置默认编码
type = sys.getfilesystemencoding()
class MyHTMLParser(HTMLParser):
def __init__(self):
self.reset()
self.fed = []
def handle_data(self, d):
self.fed.append(d)
def get_data(self):
return ''.join(self.fed)
def main():
        parser = MyHTMLParser()
        parser.feed('')
        print parser.get_data().strip()
if __name__ == '__main__':
        main()
输出:
#python { color: green }
,站群软件
企业建站2800元起,携手武汉肥猫科技,做一个有见地的颜值派!更多优惠请戳:上海做网站
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|中胜网 ( 辽ICP备13009155号 )

GMT+8, 2017-10-23 14:07 , Processed in 0.623908 second(s), 16 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表