Показатели производительности в базах данных NoSQL

Я пытаюсь сравнить базу данных NoSQL (т.е. Cassandra) с помощью инструмента тестирования YCSB. Для этого мне, очевидно, нужно установить показатели производительности, в которых я буду измерять производительность. Я решаю выбрать Read, write и update. Теперь я совершенно не уверен, что это правильные показатели для выбора, или, может быть, стоит выбрать что-то вроде Scale-up и/или elastic speedup? Пожалуйста, дайте мне какое-нибудь предложение.


person Jabir    schedule 07.08.2016    source источник
comment
если вы хотите протестировать cassandra, сначала обратитесь к сообщению в блоге, созданному datastax datastax.com/dev/blog/how-not-to-benchmark-cassandra   -  person bkowalczyyk    schedule 07.08.2016


Ответы (1)


Вы упомянули задержку операции (чтение, запись, обновление). Это, безусловно, очень важная метрика, поэтому вам следует разработать тесты, которые покажут, как изменяется задержка в следующих сценариях:

  • Задержка операции для различных нагрузок (операций в секунду).
  • Задержка операции для различных рабочих нагрузок (рассмотрите различные комбинации или процентное соотношение операций в рабочей нагрузке).
  • (Менее важно) Задержка операции для различных ключевых распределений популярности.

Кроме того, другие вещи, которые вы можете проверить:

  • Эластичное ускорение: влияние (на задержку операции) добавления серверов в сеть.
  • Отказоустойчивость: влияние (на задержку операции) случайного отказа серверов.
  • Баланс нагрузки: насколько хороша БД в балансировке нагрузки между серверами с учетом различных ключевых распределений популярности и разной временной локализации рабочих нагрузок.
  • Масштабируемость: как наличие большего или меньшего количества узлов влияет на задержку операции. В этом случае серверы НЕ добавляются онлайн (это был бы эксперимент по эластичному ускорению).
  • Если вы проводите свои эксперименты на EC2, то как выбор типа инстанса EC2 (средний, большой и т. д.) влияет на производительность.

Кроме того, рассмотрите возможность использования гистограмм или коробчатых диаграмм для наблюдения за влиянием на задержку, поскольку построение только средних значений не позволяет измерять изменчивость задержки.

Наконец, взгляните на эту статью VLDB, чтобы найти дополнительные идеи.

person cabad    schedule 09.08.2016