本发明公开了一种针对密文域的形近汉字全文模糊检索方法,该方法基于对称可搜索加密方案以及倒排索引结构实现中文密文域模糊搜索,支持字形相似汉字在密文状态下的模糊搜索且保证搜索结果有序,支持多关键词逻辑连接模糊搜索。本发明采用分布式搜索引擎Lucene和中文分词器IKAnalyzer对文档进行全文分词,通过建立的3755个常用汉字的形近字字库构建包含形近字的明文倒排索引,考虑倒排索引结构的安全,将明文倒排索引中的每一个关键词及其对应的文档编号构造成加密链形式,并采用B+树结构来加速搜索。本发明在无误检和无漏检的情况下实现了半可信云服务器的中文全文密文域模糊搜索。
咨询热线:020-38033421
传真号码:020-38061201
电子邮箱:jm@jiaquanip.cn
Copyright © 嘉权专利商标事务所 All Rights Reserved. 粤ICP备2023151901号