Модель типизации Хиндли — Милнера

Моде́ль типиза́ции Хи́ндли — Ми́лнера — механизм вывода типов выражений, который реализован в некоторых строгих функциональных языках программирования. Обычно этот механизм реализуется именно в рамках функциональной парадигмы программирования, хотя и не ограничен только ей. Примеры языков, которые используют модель типизации Хиндли — Милнера: Haskell, ML, OCaml, Scala, Fortress и Boo.

Механизм вывода типов основан на возможности автоматически полностью или частично выводить тип выражения, полученного при помощи вычисления некоторого выражения. Так как этот процесс систематически производится во время трансляции программы, транслятор часто может вывести тип переменной или функции без явного указания типов этих объектов. Во многих случаях можно опускать явные декларации типов — это можно делать для достаточно простых объектов, либо для языков с простым синтаксисом. Например, в языке Haskell реализован достаточно мощный механизм вывода типов, а сам синтаксис языка достаточно простой, поэтому указание типов функций в этом языке программирования не требуется. Программист может указать тип функции явно для того, чтобы ограничить её использование только для конкретных типов данных, либо для более структурированного оформления исходного кода.

Для того, чтобы получить информацию для корректного вывода типа выражения в условиях отсутствия явной декларации типа этого выражения, транслятор либо собирает такую информацию из явных деклараций типов подвыражений (переменных, функций), входящих в изучаемое выражение, либо использует неявную информацию о типах атомарных значений. Такой алгоритм не всегда помогает определить тип выражения, особенно в случаях использования функций высших порядков и параметрического полиморфизма достаточно сложной природы. Поэтому в сложных случаях, когда есть необходимость избежать неоднозначностей, рекомендуется явно указывать тип выражений.

Сама модель типизации основана на алгоритме вывода типов выражений, который имеет своим источником механизм получения типов выражений, используемый в типизированном λ-исчислении, который был предложен в 1958 г. Х. Карри и Р. Фейсом. Далее уже́ Рождер Хиндли в 1969 г. расширил сам алгоритм и доказал, что он выводит наиболее общий тип выражения. В 1978 г. Робин Милнер независимо от Р. Хиндли доказал свойства эквивалентного алгоритма. И, наконец, в 1985 г. Луис Дамас окончательно показал, что алгоритм Милнера является законченным и может использоваться для полиморфных типов. В связи с этим алгоритм Хиндли — Милнера иногда называют также и алгоритмом Дамаса — Милнера.

Система типов определяется в модели Хиндли — Милнера следующим образом:

  1. Примитивные типы v v являются типами выражений.
  2. Параметрические переменные типов α являются типами выражений.
  3. Если σ 1 \sigma_{1} и σ 2 \sigma_{2} — типы выражений, то тип σ 1 σ 2 \sigma_{1} \rightarrow \sigma_{2} является типом выражений.
  4. Символ _|_ является типом выражений.

Выражения, типы которых вычисляются, определяются довольно стандартным образом:

  1. Константы являются выражениями.
  2. Переменные являются выражениями.
  3. Если e 1 e_{1} и e 2 e_{2} — выражения, то ( e 1 e 2 e_{1} e_{2} ) — выражение.
  4. Если v v — переменная, а e e — выражение, то λ v . e \lambda v.e — выражение.

Говорят, что тип σ 1 \sigma_{1} является экземпляром типа σ 2 \sigma_{2} , когда имеется некое преобразование ρ \rho такое, что:

σ 1 = ρ ( σ 2 ) \sigma_{1} = \rho(\sigma_{2})

При этом обычно полагается, что на преобразования типов ρ \rho накладываются ограничения, заключающиеся в том, что:

  1. ρ ( σ 1 σ 2 ) = ρ ( σ 1 ) ρ ( σ 2 ) \rho(\sigma_{1} \rightarrow \sigma_{2}) = \rho(\sigma_{1}) \rightarrow \rho(\sigma_{2})
  2. ρ ( v ) = v \rho(v) = v

Сам алгоритм вывода типов состоит из двух шагов — генерация системы уравнений и последующее решение этих уравнений.

Построение системы уравнений основано на следующих правилах:

  1. f Γ v = τ f \Gamma v = \tau — в том случае, если связывание v : τ v : \tau находится в Γ \Gamma .
  2. f Γ ( e f ) = τ f \Gamma (e f) = \tau — в том случае, если τ 1 = τ 2 τ \tau_{1} = \tau_{2} \rightarrow \tau , где τ 1 = f Γ e \tau_{1} = f \Gamma e и τ 2 = f Γ f \tau_{2} = f \Gamma f .
  3. f Γ ( λ v . e ) = τ e τ f \Gamma (\lambda v.e) = \tau_{e} \rightarrow \tau — в том случае, если τ e = f Γ e \tau_{e} = f \Gamma' e и Γ \Gamma' является расширением Γ \Gamma связыванием v : τ v : \tau .

В этих правилах под символом Γ \Gamma понимается набор связываний переменных с их типами:

Γ = v 1 : A 1 , v 2 : A 2 , , v n : A n \Gamma = v_{1} : A_{1}, v_{2} : A_{2}, \ldots, v_{n} : A_{n}

Решение построенной системы уравнений основано на процессе унификации. Это достаточно простой алгоритм. Имеется некоторая функция u u , которая принимает на вход уравнение типов и возвращает некоторую подстановку. Подстановка — это просто проекция переменных типов на сами типы. Такие подстановки могут вычисляться различными способами, котоые зависят от конкретнй реализации алгоритма Хиндли — Милнера.