Стр. 62 - Основы алгоритмов и структур данных

Упрощенная HTML-версия

Содержание

ОСНОВЫ АЛГОРИТМОВ И СТРУКТУР ДАННЫХ

Таким образом, неизбежны так называемые коллизии, когда для двух

различных ключей

≠

значения хэш - функций равны

h(x)=h(y)

. Ключи

в этом случае называются коллизирующими. Чем равномернее хэш-функция

использует пространство адресов, тем реже будут происходить коллизии, хотя

они будут происходить неизбежно.

Хэш-функцию следует выбирать, исходя из имеющегося пространства

адресов (

) и предполагаемого размера таблицы (

), таким образом, чтобы:

1) пространство

использовалось равномерно.

2) коллизии возникали как можно реже.

3) когда коллизии возникнут, их можно было разрешить.

Прежде чем переходить к методам построения

-функций и методам

разрешения коллизий, рассмотрим несколько тривиальных примеров.

Пример:

Пусть доступна память из 10 ячеек, т.е.

=10 и

, …,

}

Пусть имена

состоят из двух букв.

Причём букве

соответствует код 00000

00001

00010

…………………………………………………………….

Пусть в таблицу входят имена:

AN,AT,NO,ON,PI

Рассмотрим их двоичное представление:

0 0 0 1 0 1 1 1 1 0

1 0 1 1 0 0 1 1 1 0

0 1 1 1 0 1 0 1 1 0

1 1 0 0 1 0 0 0 0 0

1 0 1 1 0 0 0 0 0 0

9 8 7 6 5 4 3 2 1

→

b b b b b b b b b b

биты

Таким образом, каждое имя представляется десятью битами. Заметим, что

двоичная цепочка

однозначно определяет каждое из пяти имён и, кроме

того, если рассматривать

как двоичное число, то оно лежит в заданном

пространстве адресов.

Таким образом,

-функцию можно определить следующим образом:

(

)=(

)

Например:

(

)=(001)

=1, т.е. для

выделяем ячейку

(

)=(100)

=4, т.е. для

выделяем ячейку

Попытка включить в таблицу новое имя

приведёт к коллизии, так как

(

)=(100)

=4=

(

Стр. 63

Стр. 61

НГТУ им. Р.Е. Алексеева

1...,52,53,54,55,56,57,58,59,60,61 63,64,65,66,67,68,69,70,71,72,...106