什么是网页解析器,有几种网页解析器

网页解析器:从网页中提取有价值数据的工具

html网页字符串->网页解析器->价值数据和新url列表

有几种网页解析器

  1. 正则表达式
  2. html.parser
  3. beautifulSoup
  4. lxml

正则是模糊匹配,另外三种是结构化解析

结构化解析-DOM(Document Object Model)树

HTTPROOT | 自学PHP | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 石头哥 |微信小程序 |木讯 |备案
Copyright © 1998 - 2016 HTTPROOT.COM. All Rights Reserved httproot.com 版权所有