Может ли Lucene использоваться для хранения непрерывных потоков данных и действовать как хранилище данных для Google Analytics.!

95
7

Может ли Apache lucene использоваться в качестве базы данных, я хочу сказать, что я выполнил POC и увидел, что он может индексировать данные очень быстро, а поиск также очень быстрый в Lucene.

Предположим, что моя проблема заключается в следующем: у меня есть непрерывные входящие потоки данных, которые я хочу хранить в хранилище данных, и запрос из этого хранилища, чтобы получить аналитику в реальном времени. Что я сделал, это то, что я буферизую данные и создаю индексы lucene (буферизованный интервал данных, скажем, 2-5 секунд), а затем использовать этот индекс для выполнения операций чтения данных.

Будет ли Lucene работать правильно для Google Analytics, если я буду продолжать индексировать данные, скажем, 5 МБ в секунду (69 ГБ в день) поверх данных exisitng и одновременно выполнять чтение по индексированным данным..??? Я пытаюсь использовать cassandra, чтобы проверить этот сценарий, но я знаю, что у Lucene есть хорошие данные о скорости поиска и индексировании довольно быстро.. tooo. Поэтому я могу использовать его в качестве базы данных для подключения трафика, а затем запрашивать этот входящий трафик для получения данных для отчетов.???

Пожалуйста, дайте мне знать о доступных альтернативных технологиях, если есть, на рынке. (лучше, если он открыт с открытым исходным кодом)

Спасибо заранее. Улыбки. !!!

спросил(а) 2015-03-09T12:32:00+03:00 5 лет, 11 месяцев назад
0
Ваш ответ
Введите минимум 50 символов
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема