企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
![](https://box.kancloud.cn/18b82e4c6e0c2eca838c796f35e38c40_1152x261.png) ![](https://box.kancloud.cn/ff092eacc759377b9a91db80e4933ac2_856x396.png) 进行分词 ![](https://box.kancloud.cn/121037742c1cb72aed35b2075f2f6412_1068x299.png) 然后我们根据这个单词集合和文档集合它们进行运算,就能得到一个矩阵 ![](https://box.kancloud.cn/bd4778c8bf7c460a5b6334bb6022fff8_1529x630.png) 这个结果其实是个数据结构, 可以用这样的表来表示 ![](https://box.kancloud.cn/dc21235ba1b7c4d1792c1eae174762c8_1098x664.png) 上面的第一行(1,<3,11>)意思是乔布斯这个单词在文档1中出现过,并且在文档1中的3和11位置 第二张表有TF,表示出现的频率,第二张表是额外记录出现的频率 把关键词文档还有出现的位置,一条条记录下来 ![](https://box.kancloud.cn/6e219aad91670b3b459a2c9eab2fddd3_1168x508.png)