ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
# 读取UTF8-BOM多出字符 * * * * * --: 作者:Fuzz 时间:2018年8月31日 * * * * * ### BOM头是什么 BOM头是放在UTF-8编码的文件的头部的,占用三个字节,用来标识该文件属于UTF-8编码。现在已经有很多软件识别BOM头,但是还有些不能识别BOM头,比如PHP就不能识别BOM头,这也是用记事本编辑UTF-8编码后执行就会出错的原因了。 ### 对应的二进制与Unicode #### Unicode字符 Unicode字符("\uFEFF") #### 二进制 FE FF UTF16BE FF FE UTF16LE EF BB BF UTF8 ### 出现原因 如果用windows自带的文本编辑器编辑过文件,就会自动添加上BOM头。 ### 解决办法 读取文件时候去除 \uFEFF 内容