ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
## 问题 现在有50亿个电话号码,现有10W个电话号码,要快速准确判断这些电话号码是否存在? 1. 通过数据库查询:实现快速有点难; 2. 数据预放在集合中:50亿 * 8字节 ==40GB(内存浪费或不够); 3. hyperloglog:准确有点难; ## 相似的问题还有很多 1. 垃圾邮件过滤 2. 文字处理软件(例如Word)错误单词检测; 3. 网络爬虫重复URL检测; 4. Hbase行过滤;