solr的相关概念
基本存储单元:文档
顺序扫描法:根据需求挨个比较文档找出所有符合要求的数据效率低。
全文检索法:基于字段的代拍索引表的检索方式 效率高适合大量数据
倒排索引:根据某个字段分词后产生的关键字和对应的文档之间的映射关系表
倒排表:存储了关键字和文档之间的映射关系的表
词频:关键字在该文档中出现的次数
组词:词条化工具
solr的运行流程:
数据存储流程:
1存储数据到solr索引库
2给字段创建索引目录
3调用分词工具将字段的值进行分词
4创建倒排索引表
数据的检索流程:
1solr调用分词工具,对检索关键字进行分词
2根据关键字分词后的结果 查询倒排索引表获得对应的id
3将符合要求的数据返回
还没有评论,来说两句吧...