ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
##HtmlCleaner介绍 <div>htmlcleaner 开源地址:<a href="http://htmlcleaner.sourceforge.net/" style="line-height: 1.5;">http://htmlcleaner.sourceforge.net/</a></div><div><br></div><div><h2> <span>简介</span></h2> <div>HtmlCleaner是一个开源的Java语言的Html文档解析器。HtmlCleaner能够重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的 HTML 文档。默认它遵循的规则是类似于大部份web浏览器为创<a href="http://baike.baidu.com/view/758570.htm" target="_blank">文档</a>对象模型所使用的规则。然而,用户可以提供自定义tag和规则组来进行过滤和匹配。它被设计的小,快速,灵活而且独立。HtmlCleaner也可用在Java代码 中,当命令行工具或Ant任务。 解析后编程轻量级文档对象,能够很容易的被转换到DOM或者JDom标准文档,或者通过各种方式(压缩,打印)连续输出XML。</div><br></div><div><br></div><div>Maven 最新版本引用地址&nbsp;</div><div><br></div><div><div>&lt;dependency&gt;</div><div>&nbsp;&nbsp;&nbsp;&nbsp;&lt;groupId&gt;net.sourceforge.htmlcleaner&lt;/groupId&gt;</div><div>&nbsp;&nbsp;&nbsp;&nbsp;&lt;artifactId&gt;htmlcleaner&lt;/artifactId&gt;</div><div>&nbsp;&nbsp;&nbsp;&nbsp;&lt;version&gt;2.16&lt;/version&gt;</div><div>&lt;/dependency&gt;</div></div><div><br></div><div><br></div><div><br></div>