Учитывая следующую проблему:
"Сохранение 5000 самых больших номеров из потока номеров"
Решение, которое приходит на ум, — это двоичное дерево поиска, поддерживающее подсчет количества узлов в дереве и ссылку на наименьший узел, когда количество достигает 5000. Когда количество достигает 5000, каждое новое добавляемое число можно сравнить с самый маленький элемент в дереве. Если больше, можно добавить новое число, затем удалить наименьшее и вычислить новое наименьшее (что должно быть очень просто, уже имея предыдущее наименьшее).
Меня беспокоит это решение, потому что бинарное дерево, естественно, будет искажено (поскольку я удаляю только одну сторону).
Есть ли способ решить эту проблему, который не приведет к созданию сильно перекошенного дерева?
Если кому-то это нужно, я включил псевдокод для своего решения ниже:
process(number)
{
if (count == 5000 && number > smallest.Value)
{
addNode( root, number)
smallest = deleteNodeAndGetNewSmallest ( root, smallest)
}
}
deleteNodeAndGetNewSmallest( lastSmallest)
{
if ( lastSmallest has parent)
{
if ( lastSmallest has right child)
{
smallest = getMin(lastSmallest.right)
lastSmallest.parent.right = lastSmallest.right
}
else
{
smallest = lastSmallest.parent
}
}
else
{
smallest = getMin(lastSmallest.right)
root = lastSmallest.right
}
count--
return smallest
}
getMin( node)
{
if (node has left)
return getMin(node.left)
else
return node
}
add(number)
{
//standard implementation of add for BST
count++
}