1. 搜索
1.1. sphinx
c++开发,简单高性能
1.2. Apache Lucene
java开发,包括solr和elasticsearch
Lucene更像是一个SDK。 有完整的API族以及对应的实现。你可以利用这些在自己的应用里实现高级查询(基于倒排索引技术的)
1.3. solr
Solr是一个有HTTP接口的基于Lucene的查询服务器
1.3.1. 数据同步 DIH
- DIH全量同步(全表数据)(一般做第一次数据同步)
- DIH增量同步(新增数据)(常用模式)
参考
- solr系列3——solr数据同步(全量、增量)
- Data Import Request Handler
- Uploading Structured Data Store Data with the Data Import Handler
局部更新
1.4. ElasticSearch
基于Lucene这个非常成熟的索引方案
1.4.1. 数据库同步到 ES 问题
用 river 同步到 ES