Энциклопедия Turbo Pascal. Главы 1-4
Страница 28. Двоичные деревья


Двоичные деревья

     В этом разделе рассматривается четвертая  структура  данных,
которая называется двоичным деревом.  Имеется много типов деревь-
ев.  Однако, двоичные деревья занимают особое положение. Если та-
кие деревья упорядочить,  то операции поиска,  вставки и удаления
будут выполняться очень быстро.  Каждый элемент двоичного  дерева
имеет информационные поля, связь с левым элементом и связь с пра-
вым элементом. На рис.14 показано небольшое дерево.
     При описании деревьев используется специальная терминология.
Первый элемент дерева называется его корнем. Каждый элемент назы-
вают вершиной /или листом/ дерева,  а часть дерева носит название
поддерева. Вершина, которая не имеет поддеревьев, называется тер-
минальной  вершиной.  Высота  дерева равна числу уровней вершин в
дереве. В дальнейшем при рассмотрении деревьев можно считать, что
в памяти они располагаются так же,  как на бумаге. Однако следует
помнить, что деревья представляют собой лишь способ представления
данных в памяти,  а память в действительности имеет линейную фор-
му.
                                       Root Node 1

                        --------¬
                        ¦2 info ¦
                        +---T---+
                        ¦   ¦   ¦
     3                  L---+----                     4
 Left Subtree                                    Righl Subtree

             --------¬            --------¬
             ¦ 2 info¦            ¦2 info ¦
             +---T---+            +---T---+
             ¦   ¦   ¦           5¦nil¦   ¦
             L---+----            L---+----

    --------¬           --------¬          --------¬
    ¦2 info ¦           ¦2 info ¦          ¦2 info ¦
    +---T---+           +---T---+          +---T---+
   5¦nil¦nil¦5         5¦nil¦nil¦5        5¦nil¦nil¦5
    L---+----           L---+----          L---+----

                         6
                   Terminal Nodes

     Рис.14. Пример двоичного дерева:

     1 - корневая вершина;  2 - информационные поля;  3  -  левое
поддерево;  5  - указатель связи с нулевым значением;  6 - терми-
нальные вершины.
     Двоичное дерево представляет собой особую  форму  связанного
списка.  Доступ  к элементам,  их вставка и удаление могут выпол-
няться в любом порядке. Кроме того, операция поиска не носит раз-
рушительный характер.  Хотя деревья легко представляются образно,
для программирования они представляют достаточно непростую  зада-
чу. Поэтому они стали рассматриваться лишь в этом разделе.
     Большинство функций над деревьями носят  рекурсивный  харак-
тер,  поскольку дерево само по себе является рекурсивной структу-
рой данных. /Т.е. каждое поддерево само является деревом/. Поэто-
му представленные в этом разделе программы являются, как правило,
рекурсивными.  Имеются нерекурсивные версии этих функций,  однако
разобраться в них значительно труднее.
     Упорядоченность дерева зависит от порядка доступа  к дереву.
Процесс  доступа к каждой вершине дерева называется обходом дере-
ва.
     Имеется три способа обхода дерева:  во внутреннем порядке, в
прямом порядке и в обратном порядке.  При прохождении  дерева  во
внутреннем порядке сначала посещается левое поддерево,  затем ко-
рень и затем посещается правое дерево.  При прохождении дерева  в
прямом порядке сначала посещается корень, затем левое поддерево и
затем правое поддерево. При прохождении дерева в обратном порядке
сначала посещается левое поддерево,  затем правое поддерево и за-
тем корень.
     Порядок прохождения ds, выбранного в качестве примера дерева
будет следующим:
     - при прохождении во внутреннем порядке: a b c d e f g;
     - при прохождении в прямом порядке:      d b a c f e g;
     - при прохождении в обратном порядке:    a c b e g f d.
     Хотя дерево не обязательно должно быть упорядочено,  в боль-
шинстве случаев оно должно быть таким. Упорядоченность дерева за-
висит от того,  как вы будете проходить дерево. В приводимых ниже
примерах используется внутренний порядок прохода по дереву. В от-
сортированном  двоичном  дереве левое поддерево содержит вершины,
которые меньше или равны корню, а вершины правого поддерева боль-
ше  или равны корню.  Ниже приводится функция,  которая выполняет
построение отсортированного двоичного дерева:

     type
       TreePointer = ^tree;
       tree = record
         data: char;
         left: TreePointer;
         right:TreePointer;
       end;

     { добавить элемент в двоичное дерево }
     function Stree(root,r:TreePointer;data:char);TreePointer;
     begin
       if r=nil then
       begin
         new(r); { получить новую вершину }
         r^.left:=nil;
         r^right:=nil;
         r^.data:=data;
         if data<root^.data then root^.left:=r
         else root^.right:=r;
         STree:=r;
       end else
       begin
         if data<r^.data then STree:=STree(r, r^.left, data)
         else STree:=STree(r, r^.right, data);
       end;
     end; { конец функции добавления элемента в двоичное
                         дерево }


     В этом алгоритме выполняется просто  прохождение  по  связям
дерева,  двигаясь  вправо или влево в зависимости от поля данных.
При применении этой функции необходимо  предусмотреть  глобальную
переменную  для  корня дерева.  Вначале эта глобальная переменная
должна быть установлена в нулевое значение.  Указатель на  корень
будет  установлен при первом обращении к указанной функции.  Пос-
кольку при последующих обращениях к этой функции нет необходимос-
ти делать новую установку корня,  то используется фиктивная пере-
менная.  Если глобальной переменной будет "rt",  то  обращение  к
указанной функции может иметь следующий вид:

     {call STree}
     if rt=nil rt:=STree(rt, rt, info)
     else dummy := STree(rt, rt, info);

     При таком  обращении к функции вставка и первого и последую-
щих элементов будет выполняться корректно.
     Указанная функция  является  рекурсивной,  как и большинство
других процедур с деревьями.  Если этот  алгоритм  преобразовать,
используя  прямой  метод перехода рекурсивных алгоритмов в цикли-
ческую форму,  то программа будет в несколько раз длинее. При об-
ращении  к  функции  задается  указатель на корень и указатель на
поддерево,  а также помещаемые в дерево данные. Здесь в качкестве
вставляемых в дерево данных используется символьное данное. Одна-
ко,  в качестве такого данного можно использовать  данное  любого
типа.
     Для обхода дерева с использованием указанной функции и выда-
чи на печать поля данных каждой вершины можно использовать следу-
ющую функцию:

     procedure InOrder(root:TreePointer);
     begin
       if root<>nil then
       begin
       InOrder(root^.left);
       Write(root^.data);
       InOrder(root^.right);
     end;
   end.
     Эта функция делает обход дерева во внутреннем порядке и  за-
вершается  при обнаружении терминального листа /указателя о нуле-
вом завершении/.  Ниже показаны функции для прохождения дерева  в
прямом и обратном порядке:
     procedure PreOrder(root:TreePointer);
     begin
       if root<>nil then
       begin
         write(root^.data);
         preorder(root^.left);
         preorder(root^.right);
       end;
     end.

     procedure PostOrder(root:TreePointer);
     begin
       if root<>nil then
       begin
         postorder(root^.left);
         postorder(root^.right);
         Write(root^.data);
       end;
     end.
     Вы можете составить короткую программу,  которая строит упо-
рядоченное двоичное дерево и,  кроме того, печатает его на экране
вашего  компьютера.  Для  этого требуется выполнить лишь незначи-
тельные изменения в процедуре прохода дерева во внутреннем поряд-
ке.  Ниже приводится программа,  которая выдает вершины дерева во
внутреннем порядке:

  { вывод на экран вершин дерева /слева направо/ }
        programm DisplayTree;

        uses Crt;

        type
          TreePointer = ^tree
          tree = record
            data: char;


Энциклопедия по Турбо-Паскалю  ч.1                        = 72 =

            left: TreePointer;
            right: TreePointer;
            end;
        var
          root, dummy: TreePointer;
          ch:char;

        function STree(root, r:TreePointer; data: char):
                 TreePointer;
        begin
          if r = nil then
          begin
            new(r); { получить новую вершину }
            r^.left := nil;
            r^.right := nil;
            r^.data := data;
            if data < root^.data then root^.left := r
            else root^.right := r;
           STree := r;
         end else
         begin
           if data<r^.data then STree := STree(r, r^.left, data)
           else STree := STree(r, r^.right, data)
         end;
        end; { конец процедуры STree }

        procedure PrintTree(r: TreePointer; n: integer);
        var
          i:integer;
        begin
          if r<>nil then begin
             PrintTree(r.^left, n+1);
             for i := 1 to n do Write('   ');
             Writeln(r^.data);
             PrintTree(r^.right, n+1);
           end;
        end; { конец процедуры PrintTree }

        begin
          root := nil;
          repeat
            Write('enter a letter (Q to quit): ');
            ch := ReadKey; Writeln(ch);
            if root= nil then root := STree(root, root, ch)
            else dummy := STree(root, root, ch);
            ch := UpCase(ch);
         until ch ='Q';

        PrintTree(root, 0);
      end;

    В этой программе фактически  делается  сортировка  полученной
информации.  В  данном  случае  используется  вариант  сортировки
вставкой,  которая описывается в предыдущей главе.  Для  среднего
случая сортировка вставкой имеет достаточно хорошие характеристи-
ки, однако быстрая сортировка все же является лучшим методом сор-
тировки, так как она требует меньше оперативной памяти и выполня-
ется  быстрее.   Однако,   если   дерево   строится   на   основе
использования  других  деревьев или если вам приходится поддержи-
вать упорядоченное дерево,  то новые элементы всегда будут встав-
ляться с использованием функции STree.
     Если вы воспользуетесь программой вывода на  экран двоичного
дерева,  то возможно вы заметите, что некоторые деревья сбаланси-
рованы /т.е. все поддеревья имеют одинаковую или почти одинаковую
высоту/, а другие сильно несбалансированы. Если вы введете дерево
"abcd", то оно примет следующий вид:
           a
            \
             \
              b
               \
                \
                 c
                  \
                   \
                    d
     В этом случае левых поддеревьев не будет. Это дерево называ-
ется вырожденным,  поскольку оно выродилось в линейный список.  В
общем случае,  если используемые для построения дерева данные яв-
ляются в достаточной мере случайными, дерево будет приближаться к
сбалансированному.  Однако, если информация уже упорядочена, то в
результате будет получаться вырожденное дерево.  /Имеется возмож-
ность переупорядочивать дерево,  сохраняя при каждой вставке  его
балансировку.  Однако  такой алгоритм достаточно сложен и если он
вас заинтересовал,  то следует воспользоваться книгами по усовер-
шенствованным методам составления алгоритмов программ/.
     Функции поиска для двоичных деревьев составляются легко. Ни-
же приводится функция,  результатом которой является указатель на
вершину дерева,  которая совпадает с ключем.  В противном  случае
возвращается нулевое значение.

     { поиск элемента в дереве }
    function Search(root:TreePointer;
                    key:DataItem):TreePointer;

    begin
      if root <> nil
      begin
        while (root^.data <> key) and (root <> nil) do
        begin
          if key < root^.data then root := root^.left
          else root := root^.right;
        end;
        end;
       Search := root;
    end; { конец процедуры поиска элемента }

     К сожалению,  удаление  вершины  дерева  выполняется  не так
просто,  как поиск вершины. Удаленной вершиной может быть корень,
левая  вершина  или правая вершина.  Вершина может также иметь от
нуля до двух поддеревьев. Необходимость изменения указателей при-
водит, например, к следующему рекурсивному алгоритму

           { удаление элемента из дерева }
          function DTree(root:TreePointer;key:char):TreePointer;
          var
            temp,temp2:TreePointer;

         begin
           if root^.data = key then
           begin
             if root^.left=root^.right tnen
             begin
               dispose(root)
               DTree := nil;
             end
             else  if root^.left=nil tnen
             begin
               temp := root^.right
               dispose(root)
               DTree := temp;
             end
             else  if root^.right=nil tnen
             begin
               temp := root^.left
               dispose(root)
               DTree := temp;
             end
             else
             begin  { имеются два листа }
               temp2 := root^.right
               temp := root^.right
               while temp^.left <> nil do temp := temp^.left;
               temp^.left := root^.left
               dispose(root);
               DTree := temp2
             end;
             else
             begin
               if root^.data < key
               then root^.right :=  DTree(root^.right, key)
               else root^.left :=  DTree(root^.left, key)
               DTree := root;
             end;
           end; { конец функции DTree }

    Следует помнить,  что в основной программе необходимо  обнов-
лять указатель на корень дерева,  так как удаленная вершина может
оказаться корнем дерева.
    Использование двоичных  деревьев  позволяет создавать мощные,
гибкие и эффективные программы по управлению баз данных. Информа-
ция в этом случае может находиться на диске и поэтому важное зна-
чение может иметь время доступа.  Число сравнений при использова-
нии  сбалансированных  двоичных деревьев для худшего случая равно
log2(n).  Поэтому в этом  случае  поиск  выполняется  значительно
быстрее, чем поиск в связанном списке, который посуществу являет-
ся последовательным поиском.

 
« Предыдущая статья