J для смертных. Тацитное программирование

Предыдущая статья цикла J для смертных. Введение

Вопрос: Если функции изменяют данные, а операторы изменяют функции, тогда кто изменяет операторы? Ответ: Кен Айверсон
Chirag Pathak

В J используется идея тацитного (от слова «tacit», неявный) программирования, не требующего явного упоминания аргументов определяемой функции (программы). Работа в тацитном подходе происходит, как правило, с массивами данных, а не с отдельными их элементами.
Интересно заметить, что тацитное программирование было описано Бэкусом еще до APL и реализовано им в языке FP. Среди современных языков, поддерживающих такой подход, (кроме, естественно, J) можно назвать Форт и другие конкатенативные языки, а также Haskell (за счет point-free подхода).

Глаголы

Определим наш первый глагол. Для удобства, можно считать, что глагол – это функция с аргументами, заданными по умолчанию. Открываем интерпретатор J, вводим


xxxxxxxxxx
> neg =: -

где «neg» – имя нашего глагола, «=:» – оператор присваивания, «-» – собственно тело глагола, которое состоит из вызова встроенного глагола «-». Попробуем теперь применить наш глагол к значению (т.е. вызвать его). Например, к единице:


xxxxxxxxxx
> neg 1 
_1

Как видно из примера, в результате получилось число «-1» (в J для записи отрицательного числа используется знак подчеркивания, т.к. минус занят под встроенный глагол).

Теперь определим переменную (в J это называется «существительное») «x» и присвоим ей значение -1:


xxxxxxxxxx
> x =: _1

Мы ожидаем, что конструкция «neg x» вернет нам единицу. Это действительно так:


xxxxxxxxxx
> neg x 
1

Этот вызов аналогичен простому


xxxxxxxxxx
- x 1

Другой пример:


xxxxxxxxxx
> x 
_1 
> neg
-

Т.е. значением переменной «x» является «-1», а значением глагола - его тело. Изменить способ вывода значений на экран можно с помощью глагола «9!:3». Определим еще один глагол, который также будет простым синонимом для встроенного глагола:


xxxxxxxxxx
> twice =: +:

Этот глагол удваивает значение своего аргумента. Тут можно проследить закономерность в именовании глаголов – так, например, если глагол «+:» удваивает свой аргумент, то глагол «-:» свой аргумент уменьшает вдвое.


xxxxxxxxxx
NB. Ранее мы определили x =: _1 
NB. Кстати, после «NB.» следует однострочный комментарий. 
NB. Это сокращение от латинского «Nota Bene», что в переводе «обрати внимание». 
> twice x 
_2 
> twice (neg x)
2

И даже так:


xxxxxxxxxx
> twice (-: 2)
2

И так


xxxxxxxxxx
> +: (+: (- 2)) 
_8

Монады и диады

Этот раздел не имеет отношения к Haskell

Глаголы можно вызывать как с одним, так и с 2 аргументами. Глагол с одним аргументом (операндом) в терминах J называется монадой, а с двумя аргументами - диадой. В последнем случае аргументы записываются слева и справа (первый и второй аргумент соответственно) от вызываемого глагола. Вспомним нашу первую монаду:


xxxxxxxxxx
> minus =: - 
> minus 1 
_1 
> minus 7 
_7

Но определенный нами глагол можно вызвать и с двумя аргументами:


xxxxxxxxxx
> 4 minus 2 
2 
> 12 minus 5 
7

В таком случае глагол minus используется как диада и в результате подстановки вычисляется выражение «4 - 2» и «12 -5» соответственно.

Два аргумента - это максимум, который можно использовать при определении и вызове глагола. Можно представить себе, что, если бы язык J поддерживал двумерный синтаксис (как, например, эзотерический язык Befunge), то аргументы можно было бы записывать не только слева и справа, но сверху-снизу. К счастью, в J поддерживается только линейный синтаксис.

Приведем еще один пример - определим глагол «div» как синоним встроенному глаголу «%». Причем «%» - это оператор деления, более привычный нам символ «/» используется для других задач (позже мы покажем для чего).


xxxxxxxxxx
> div =: % 
> 1 div 2 
0.5 
> 4 div 3 
1.3333

В данном примере глагол вызван как диада и делит 1 на 2 и 4 на 3 соответственно. Причем обратите внимание, что хотя операнды - целые числа, результат деления - число с плавающей точкой.

Будучи вызванным с одним операндом глагол «%» по умолчанию делит единицу на этот операнд.


xxxxxxxxxx
> div 2 
0.5 
> div 4 
0.25

Приведенные выше выражение, можно было бы записать и как «1 % 2» и «1 % 4» соответственно.

В приведенном выше примере используется достаточно важная особенность языка - монадный и диадный вызовы одного и того же глагола могут совершать достаточно разные по смыслу действия. Так, например, глагол «*:» в монадном случае вычисляет квадрат своего аргумента, а в диадном - выполняет логическую операцию «Не-И»:


xxxxxxxxxx
> *: 3 
9 
> *: 4 
16 
> 0 *: 0 
1 
> 1 *: 1 
0 
> 0 *: 1 
1 
> 1 *: 0 
1

Для того, чтобы глагол явно использовал свой левый или правый аргумент предназначены глаголы «[» и «]». Первый из них возвращает свой левый аргумент , второй - правый. Например:


xxxxxxxxxx
> 11 [ 22 
11 
> 11 ] 22 
22 
> ] 33 
33 
[ 44 NB. как видим, если аргумент один, то [ возвращает правый аргумент. 
44

Дополним наш багаж константными глаголами «0:», «1:», «2:», …, «9:». Константными их называют потому, что с какими бы аргументами мы бы их не вызывали, они всегда вернут одно и тоже значение. «0:» вернет нуль, «1:» - единицу и т.д. Например:

Союзы

Предположим далее, что для одного и того же глагола надо определить различное поведение для монадного (с одним аргументом) и для диадного (с двумя аргументами) вызовов. Это вполне обоснованное желание, т.к. J - язык динамический, и наш код не застрахован от некорректного использования. Для того, чтобы разделить монадное и диадное поведение глагола, есть специальный союз «:».

Если мы говорим, что глагол – это функция с одним или двумя аргументами по умолчанию, а значением аргументов может быть как переменная, так и непосредственное значение, то, в таком случае, «союз» - это такая функция, которая в качестве двух (и только двух) аргументов принимает глаголы. Союзы, также как и глаголы, пользователь может определять самостоятельно.

Тут можно было бы провести аналогию с частями речи (в J, как мы увидим позже, есть еще и наречия), но автору кажется, что это приведет к лишней путанице.

Вернемся к нашим монадам. По левую сторону от союза «:» записывается монадный вызов глагола, по правую – диадный. Пример:

> v =: 1: : 2: 
> 11 v 22 
2 
> v 11 
1

Если вызвать глагол «v» как диаду (в примере - с аргументами «11» и «22»), то произойдет обращение к выражению «2:». Если как монаду (в примере - с аргументом «11»), то к «1:». А это константные глаголы, которые всегда возвращают свое значение: «2» - в первом случае и «1» - во втором.

До сих пор мы оперировали только численными значениями. На сей раз воспользуемся строками, которые записываются в одинарных кавычках (двойные кавычки в J – это союз). Переопределим описанный ранее глагол «v»:

> v =: 'monadic call' : 'dyadic call' 
> v 11 
|domain error 
> 11 v 22 
|domain error

Как мы видим, в нашем определении ошибка. Строка – это значение, а не глагол, и она, следовательно, не производит никакого действия. А при тацитном определении глагола требуется указать только порядок применения глаголов и их комбинаций.

Работать со строками в J можно также, как и с массивами (с которыми мы познакомимся несколько позже). Например, глагол «#» в монадном вызове возвращает длину массива:

> # 23 
1 
> # '12ab' 
4 
> # '012345' 
6 
> # '' 
0

Ранее мы определяли глагол neg, который меняет знак у своего аргумента. Однако, если вызвать этот глагол в диадном варианте, то случится следующее:

> neg =: - 
> 1 neg 2 
_1

Т.е. после подстановки наш глагол сработал как вычитание «1 – 2». Целесообразно было бы, ограничить область применения глагола только монадным вызовом. Как уже говорилось ранее, динамическая природа J принуждает нас проводить подобные проверки во время исполнения программы. Как, пожалуй, и все остальное в J, такая проверка записывается максимально коротко:

neg =: - : [:

Мы воспользовались новым для нас глаголом «[:». В книге «J for C programmers» этот глагол назван «глаголом-самоубийцей» за то, что будучи вызванным, приводит к аварийному останову программы:

> neg 1 
_1 
> 1 neg 2 NB. Здесь срабатывает правая часть определения - глагол-самоубийца 
|domain error

Для того, чтобы отлавливать подобные ситуации можно использовать т.н. «ловушки». В J нет исключений (exceptions) в привычном понимании этого слова, вместо этого используется союз «::».

Союз «::» выполняет выражение слева от себя, а если оно завершилось с ошибкой, то исполняет выражение справа. Пример:

> v =: [: :: 3: 
> 1 v 2 
3 
> v 7
3

Этот глагол всегда будет возвращать 3, потому что, как мы сказали, сначала выполнится выражение слева. А слева мы поставили глагол-самоубийцу. Следовательно, союз «::» при каждом вызове глагола «v» отлавливает самоубийцу «[:» и передает все аргументы глаголу, который мы записали справа, т.е. глаголу-константе «3:».

Союзы для последовательных вычислений

До сих пор мы использовали только одиночные глаголы. Для того, чтобы проводить последовательные вычисления используется союз «@» либо специальный глагол «[:», который, будучи первым элементом в композиции глаголов, пропускается и позволяет выполниться последовательному вычислению:

> ([: +: +:) 10 NB. эквивалентно (+: (+: 10)) 
40 
> (+: @ +:) 10 NB. эквивалентно (+: (+: 10)) 
40

Следующий союз в нашу коллекцию «&.», принцип работы которого следующий.

u&.v y NB. эквивалентно v_инверсия u v y 
x u&.v y NB. эквивалентно v_инверсия (v x) u (v y).

> +:&.*: 10 
14.1421 
> %: @: +: (*: 10) NB. аналогично примеру выше 
14.1421 
> %: (+: (*: 10)) NB. или так 
14.1421

где «v_инверсия» — значит глагол, обратный «v». В выражении «+:&.: » глагол, от которого берется инверсия — это «:» (т.к. он стоит справа от союза «&.»). А глагол, обратный «*:» — это «%:». Т.е. операция, обратная возведению в квадрат — это взятие квадратного корня.

Другой полезный для нас союз «&», который делает из диадного вызова монадный, присоединяя к глаголу существительное (операнд-значение). С определенным допущением можно сказать, что этот союз осуществляет каррирование. Например:

> inc =: 1&+ NB. инкремент 
> inc 41 
42 
> inc _3 
_2 
> div3 =: %&3 
> div3 9 
3 
> div3 12 
4

Определим инкремент только для монадного случая:

> inc =: 1&+ : [: 
> inc 1 
2 
> 1 inc 2 
|domain error: inc
| 1 inc 2

Наречия

Ранее мы уже упомянули о наречиях. В терминах языка J наречие – это выражение, которое принимает в качестве аргумента глагол и формирует их него новый глагол с другим поведением.

Приведем наречие «~», которое меняет местами аргументы в своем диадном вызове («x u~ y» подставляется на «y u x») и заменяет монадный вызов глагола - диадным, копируя операнд («u~ y»подставляется на «y u y»).

> % 2 NB. Как мы помним, это аналогично вызову «1 % 2» 
0.5
> %~ 2 NB. аналогично «2 % 2» 
1 
> 2 % 3 
0.666667 
> 2 %~ 3 NB. аналогично «3 % 2» 
1.5

Одним из самых часто используемых наречий является наречие / («между»), рассмотрение которого мы отложим до раздела о массивах.

Хуки и форки

В J весьма своеобразный способ композиции функций - если указаны два подряд идущих глагола, то это не означает, что они будут применяться последовательно. У них будет свой специальный порядок вызова отдельно для диадного и для монадного вызовов. Такая композиция для двух глаголов называется хуком(крюком). Определим глагол v, который является хук-вызовом глаголов f и g:

v =: f g

Если вызвать v как монаду на некотором существительном y:

v y

то этот вызов будет эквивалентен:

y f (g y)

Необходимо отметить, что, несмотря на монадный вызов глагола v, один из элементов хука (а именно f) вызывается как диада с дублированием слева единственного операнда.

Если же вызвать v как диаду на некоторых существительных x и y:

x v y

то этот вызов будет эквивалентен:

x f (g y)

Вспомним глагол решетку «#», который в монадном вызове возвращает длину строки/массива, а в диадном копирует правый операнд столько раз, сколько указано в левом операнде. Определим диаду:

v =: # #

Разложим диадный вызов глагола v по приведенной выше схеме:

х # (# y)

Как видно, v копирует число, равное длине операнда y, х раз. Например:

> v =: # #  
> 2 v '1234' 
4 4

Можно было бы предположить, что три подряд идущих глагола являются хуком от хука. Однако это не так – вместо этого реализуется форк-композиция (т.н. «вилка»). Так, монадный вызов форка

(f g h) y

равнозначен следующему вызову:

(f y) g (h y)

Примером такого выражения можно привести известный уже нам глагол, высчитывающий среднее от массива чисел:

> mean =: +/%# 
> mean 0 1 2 3 4 5 
2.5

Такое выражение равнозначно следующему:

> ((+/ @ [ )%(# @ ])) 0 1 2 3 4 5 
2.5

Рассмотрим еще один пример форка:

> v =: # # # 
> v '12345' 
5 5 5 5 5

Как видно, это выражение копирует число, равное длине операнда, столько раз, какая длина операнда.

Предыдущей глагол можно было бы переписать и без использования форков:

> ((#@]) # (#@])) '12345' 
5 5 5 5 5

Определим на диадном вызове форк на существительных x и y:

x (f g h) y

который будет равнозначен следующему выражению:

(x f y) g (x h y)

Проиллюстрируем диадный форк с помощью нашего старого знакомого – глагола mean:

> 2 mean 3 
1.66667 1.66667

Раскроем данное выражение:

(2 +/ 3) % (2 # 3)

Получим, что правая часть выражения копирует 2 раза тройку. А левая вычисляет сумму левого и правого операндов. Т.о. получим:

> 5 % 3 3 
1.66667 1.66667

Особенно важно понимать, что в J если указаны 4 глагола, то это выражение будет хуком от форка, если 5 – то форком от форка, 6 - хуком от форка от форка и т.д. Т.е. выражения «(# # # # # #)» и «(# (# # (# # #)))» равнозначны.

Покажем, как с помощью круглых скобок можно изменять порядок вычислений. Например:

> (# # #) 3 
1

Но

> (# (# #)) 3 
1 1 1 1 1 1 1 1 1

Последнее выражение равнозначно следующим:

3 # (3 # (# 3) 
3 # 1 1 1 NB. Повторить 3 раза правый операнд.

Покажем более сложный пример с композицией функций

> (* + - %) 3 
8

Это выражение равнозначно следующему:

3 * ((+ 3) - (% 3))

Комбинация из 5 глаголов может выглядеть так:

> (>: * + - %) 3 
10.6667

Последнее выражение равнозначно следующим:

(>: 3) * ((+ 3) - (% 3)) 
4 * (3 – 0.333)

Следующая статья цикла J для смертных. Массивы

18 октября 2013