Я работаю над большим проектом, я не буду обобщать его здесь, но этот раздел проекта должен взять очень большой текстовый документ (минимум около 50 000 слов (не уникальный)), и вывести каждый уникальный слово в порядке от наиболее часто используемого к наименее используемому (вероятно, первые три будут «a», «an» и «the»).
Мой вопрос, конечно, какой алгоритм сортировки лучше всего использовать? Я читал о сортировке по счету, и мне это нравится, но меня беспокоит то, что диапазон значений будет слишком большим по сравнению с количеством уникальных слов.
Какие-либо предложения?