Вход в систему

Афтырь мудак, креатив говно.

Рейтинг: 0 ( 0 за, 0 против).

Каркун про Салтыков-Щедрин: Господа Головлевы (Классическая проза)

Прекраснейший текст! Не текст, а горький мёд. Лучшее, из того, что написал Михаил Евграфович. Литературный язык - чистое наслаждение. Жемчужина отечественной словесности. А прочесть эту книгу, нужно уже поживши. Будучи никак не моложе тридцати.
Школьникам эту книгу не "прожить". Не прочувствовать, как красива родная речь в этом романе.

Рейтинг: +4 ( 4 за, 0 против).

Каркун про Кук: Огненная тень (Фэнтези: прочее)

Интереснейшая история в замечательном переводе. Можжевельник. Мрачный северный город, где всегда зябко и сыро. Маррон Шед, жалкий никудышный человек. Тварь дрожащая, что право имеет. Но... ему сочувствуешь и сопереживаешь его рефлексиям. Замечательный текст!

Рейтинг: 0 ( 0 за, 0 против).

Каркун про Кук: Десять поверженных. Первая Летопись Черной Гвардии: Пенталогия (Фэнтези: прочее)

Первые два романа "Чёрной гвардии" - это жемчужины тёмной фэнтези. И лучше Шведова никто историю Каркуна не перевёл. А последующий "Чёрный отряд" - третья книга и т. д., в других переводах - просто ремесловщина без грана таланта. Оригинальный текст автора реально изуродовали поденщики. Сюжет тащит, но читать не очень. Лишь первые две читаются замечательно.

Рейтинг: 0 ( 0 за, 0 против).

Каркун про Вэнс: Планета риска (Космическая фантастика)

Безусловно лучший перевод, одного из лучших романов Вэнса (Не считая романов цикла "Умирающая земля"). Всегда перечитываю с наслаждением.

Рейтинг: 0 ( 0 за, 0 против).

Все впечатления

Авторы : [А] [Б] [В] [Г] [Д] [Е] [Ж] [З] [И] [Й] [К] [Л] [М] [Н] [О] [П] [Р] [С] [Т] [У] [Ф] [Х] [Ц] [Ч] [Ш] [Щ] [Э] [Ю] [Я]
[Все] [A] [B] [C] [D] [E] [F] [G] [H] [I] [J] [K] [L] [M] [N] [O] [P] [Q] [R] [S] [T] [U] [V] [W] [X] [Y] [Z] [Прочее] [І] [Є] [Ґ]

Хеш-таблицы [Иван Кисляков Программист] (fb2) читать постранично, страница - 2

- Хеш-таблицы 299 Кб, 10с. скачать: (fb2) читать: (полностью) - (постранично) - Иван Кисляков (Программист)

[Настройки текста] [Cбросить фильтры]

struct HashFunction2

{

int operator()(const std::string& s, int table_size) const

{

return HashFunctionHorner(s, table_size, table_size + 1);

}

};

Чтобы идти дальше, нам необходимо разобраться с проблемой: что же будет, если мы удалим элемент из таблицы? Так вот, его нужно пометить флагом deleted, но просто удалять его безвозвратно нельзя. Ведь если мы так сделаем, то при попытке найти элемент (значение хеш-функции которого совпадет с ее значением у нашего удаленного элемента) мы сразу наткнемся на пустую ячейку. А это значит, что такого элемента и не было никогда, хотя, он лежит, просто где-то дальше в массиве. Это основная сложность использования данного метода решения коллизий.

Помня о данной проблеме построим наш класс.

template <class T, class THash1 = HashFunction1, class THash2 = HashFunction2>

class HashTable

{

static const int default_size = 8; // начальный размер нашей таблицы

constexpr static const double rehash_size = 0.75; // коэффициент, при котором произойдет увеличение таблицы

struct Node

{

T value;

bool state; // если значение флага state = false, значит элемент массива был удален (deleted)

Node(const T& value_) : value(value_), state(true) {}

};

Node** arr; // соответственно в массиве будут хранится структуры Node*

int size; // сколько элементов у нас сейчас в массиве (без учета deleted)

int buffer_size; // размер самого массива, сколько памяти выделено под хранение нашей таблицы

int size_all_non_nullptr; // сколько элементов у нас сейчас в массиве (с учетом deleted)

};

На данном этапе мы уже более-менее поняли, что у нас будет храниться в таблице. Переходим к реализации служебных методов.

...

public:

HashTable()

{

buffer_size = default_size;

size = 0;

size_all_non_nullptr = 0;

arr = new Node*[buffer_size];

for (int i = 0; i < buffer_size; ++i)

arr[i] = nullptr; // заполняем nullptr - то есть если значение отсутствует, и никто раньше по этому адресу не обращался

}

~HashTable()

{

for (int i = 0; i < buffer_size; ++i)

if (arr[i])

delete arr[i];

delete[] arr;

}

Из необходимых методов осталось еще реализовать динамическое увеличение, расширение массива — метод Resize.

Увеличиваем размер мы стандартно вдвое.

void Resize()

{

int past_buffer_size = buffer_size;

buffer_size *= 2;

size_all_non_nullptr = 0;

size = 0;

Node** arr2 = new Node * [buffer_size];

for (int i = 0; i < buffer_size; ++i)

arr2[i] = nullptr;

std::swap(arr, arr2);

for (int i = 0; i < past_buffer_size; ++i)

{

if (arr2[i] && arr2[i]->state)

Add(arr2[i]->value); // добавляем элементы в новый массив

}

// удаление предыдущего массива

for (int i = 0; i < past_buffer_size; ++i)

if (arr2[i])

delete arr2[i];

delete[] arr2;

}

Немаловажным является поддержание асимптотики O(1) стандартных операций. Но что же может повлиять на скорость работы? Наши удаленные элементы (deleted). Ведь, как мы помним, мы ничего не можем с ними сделать, но и окончательно обнулить их не можем. Так что они тянутся за нами огромным балластом. Для ускорения работы нашей хеш-таблицы воспользуемся рехешем (как мы помним, мы уже выделяли под это очень странные переменные).

Теперь воспользуемся ими, если процент реальных элементов массива стал меньше 50, мы производим Rehash, а именно делаем то же самое, что и при увеличении таблицы (resize), но не увеличиваем. Возможно, это звучит глуповато, но попробую сейчас объяснить. Мы вызовем наши хеш-функции от всех элементов, переместим их в новых массив. Но с deleted-элементами это не произойдет, мы не будем их перемещать, и они удалятся вместе со старой таблицей.

Но к чему слова, код все разъяснит:

void Rehash()

{

size_all_non_nullptr = 0;

size = 0;

Node** arr2 = new Node * [buffer_size];

for (int i = 0; i < buffer_size; ++i)

arr2[i] = nullptr;

std::swap(arr, arr2);

for (int i = 0; i < buffer_size; ++i)

{

if (arr2[i] && arr2[i]->state)

Add(arr2[i]->value);

}

// удаление предыдущего массива

for (int i = 0; i < buffer_size; ++i)

if (arr2[i])

delete arr2[i];

delete[] arr2;

}

Ну теперь мы уже точно на финальной, хоть и длинной, и полной колючих кустарников, прямой. Нам необходимо реализовать вставку (Add), удаление (Remove) и поиск (Find) элемента.

Начнем с самого простого — метод Find элемент по значению.

bool Find(const T& value, const THash1& hash1 = THash1(), const THash2& hash2 = THash2())

{

int h1 = hash1(value, buffer_size); // значение, отвечающее за начальную позицию

int h2 = hash2(value, buffer_size); // значение, ответственное за "шаг" по таблице

int i = 0;

while (arr[h1] != nullptr && i < buffer_size)

{

if (arr[h1]->value == value && arr[h1]->state)

return true; // такой элемент есть

h1 = (h1 + h2) % buffer_size;

++i; // если у нас i >= buffer_size, значит мы уже обошли абсолютно все ячейки, именно для этого мы считаем i, иначе мы могли бы

Навигация

Вход в систему

Последние комментарии

Новое на форуме

Последние записи в блогах

Впечатления

Хеш-таблицы [Иван Кисляков Программист] (fb2) читать постранично, страница - 2