ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
网站中常用的数据分类如下: 1. 非结构化数据:HTML ——> 处理方法:re模块,或lxml模块,或Beautiful Soup模块,或driver定位 2. 结构化数据:json ——> 处理方法:re模块,或json模块,或jsonpath模块 3. 结构化数据:xml ——> 处理方法:re模块,或lxml模块,或Beautiful Soup模块