ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
### 一,有问题的代码 CleverCode发现在mysql有分页丢失数据的问题。如下面的代码,system_user表有400万行数据,这时候需要把这张表里面的所有的userid取出来。这时候只能分页取,一次取2万。 ~~~ //系统用户表(400万行的数据) $systemUserTable = new systemUserTable(); // 每次取20000 $pageSize = 20000; for($curPage = 1;; $curPage++) { $sql = "select userid from system_user order by userid asc limit " . (($curPage - 1) * $pageSize) . "," . $pageSize; //取数据 $rows = $systemUserTable->fetchAll($sql); // 没有数据了,结束 if (empty($rows)) { break; } // 遍历数据 foreach ( $rows as $key => $val ) { $userid = $val['userid']; echo $userid."\r\n"; } } ~~~ ### 二,问题分析 1)假如system_user只有10行数据(u1,u2,u3,u4,u5,u6,u7,u8,u9,u10)。 2) 这时候每次取5行。分2两次取。 3)正常情况第一页取(u1,u2,u3,u4,u5),正常情况第二页取(u6,u7,u8,u9,u10)。 4)如果在第一页去完,第二页取之前的时间间隙里面。u2,u3被删除了。 5)那么第二页取的时候。数据变成了(u1,u4,u5,u6,u7,u8,u9,u10)。 6)那么取出来第二页的数据就变成了(u8,u9,u10)。 7)u6,u7被丢失了。 ### 三,解决方案 每次取的时候where带着最大偏移量。如下面的代码。 ~~~ $systemUserTable = new systemUserTable(); // 每次取20000 $pageSize = 20000; // 每页最大编号 $pageMaxId = 0; while ( 1 ) { $sql = "select userid from system_user where userid > ${pageMaxId} order by userid asc limit " . $pageSize; //取数据 $rows = $fyHouse->fetchAll($sql); // 没有数据,结束 if (empty($rows)) { break; } // 遍历数据 foreach ( $rows as $key => $val ) { $userid = $val['userid']; // 记录当前最大分页编号 if ($userid > $pageMaxId) { $pageMaxId = $userid; } echo $userid."\r\n"; } } ~~~ 过程分析: 1)system_user只有10行数据(u1,u2,u3,u4,u5,u6,u7,u8,u9,u10)。 2) 第一次取,最大偏移量0,limit 5;则取出(u1,u2,u3,u4,u5)。记录最大的偏移量u5的值。 4)如果在第一页去完,第二页取之前的时间间隙里面。u2,u3被删除了。 5)那么第二页取的时候。数据变成了(u1,u4,u5,u6,u7,u8,u9,u10)。 3)第二次取,最大偏移量u5,limit 5;则取出(u6,u7,u8,u9,u10)。记录最大的偏移量u10的值。 ![](https://box.kancloud.cn/2016-03-29_56fa2a0c7acf5.jpg)