Про динамическую типизацию
Oct. 11th, 2012 01:33 pmПоразжигал немного в комментах у ребе Б. рознь к социальной группе "ленивые авторы языков". Чтобы не излагать свою позицию каждый раз заново, сохраню сюда.
Знаете, некоторые печальные даты надолго остаются в памяти людей: 11 сентября, 17 августа, 1917-й год, 1941-й. К ним стоит добавить 1995-й - год появления JavaScript, PHP, Ruby, ну и Java тоже. Кому-то захотелось по-быстрому добавить динамизма в веб-странички, и он за пару недель наговнякал интерпретатор, встроив его в браузер Netscape. Кому-то захотелось оживить свою домашнюю страничку, добавить счетчик посетителей, еще что-то, и он на коленке сделал такой вот изменятель страничек на стороне сервера. О больших проектах тогда никто не думал, personal home page назывался тот изменятель. А когда делаешь интерпретатор, проще всего сделать его на динамической типизации. Это банально очень просто. О системе типов вообще можно не задумываться, не говоря уже об их выводе. К сожалению, на фоне тогдашнего мейнстрима (Си, ранние плюсы, что там еще было?) эти скриптовые языки выглядели очень выигрышно, писать мелкие куски кода на них было намного проще. Что такое нормальная система типов тогда мало кто знал: хаскель был еще в пеленках, ML'и традиционно не выходили из университетов. Так что люди эти скрипты подхватили, стали добавлять все новые функции. Менять систему типов стало поздно. В итоге выросло то, что выросло. С тех пор одна масса людей занята тем, чтобы делать все более сложные интерпретаторы, которые бы не так тормозили, другая масса придумывает 121-й способ добавить в JS типы, а третья на динамических языках пишет и плачет в бложиках о том, как грустно им делается. И проблема не только и не столько в скорости, сколько в maintainability кода и усилиях на необходимые тестирование и отладку при росте проектов.
Единственная реальная причина появления динамически типизированных языков - лень и недальновидность авторов. Эволюционно динамические языки - тупиковая ветвь, хоть они и обречены рождаться вновь и вновь просто потому что их делать проще, а делать языки люди любят. Сегодняшняя популярность некоторых из них - случайность, исторический казус, следствие контраста между этими языками и мейнстримом начала 90-х. То, что много идиотов используют идиотские языки, говорит лишь о том, что идиотов много. Сегодня, когда есть языки с нормальной статической системой типов, никаких реальных преимуществ у динамической больше нет. Только я имею в виду действительно нормальные статически типизированные языки - как минимум с параметрическим и ad hoc полиморфизмами, с выводом типов. Не Си с джавой. Хаскель, окамл, скала - такого уровня. У этих конкретных языков могут быть свои проблемы, часто инфраструктурные, но речь сейчас не о них, речь о динамической vs. статической типизации в целом.
Знаете, некоторые печальные даты надолго остаются в памяти людей: 11 сентября, 17 августа, 1917-й год, 1941-й. К ним стоит добавить 1995-й - год появления JavaScript, PHP, Ruby, ну и Java тоже. Кому-то захотелось по-быстрому добавить динамизма в веб-странички, и он за пару недель наговнякал интерпретатор, встроив его в браузер Netscape. Кому-то захотелось оживить свою домашнюю страничку, добавить счетчик посетителей, еще что-то, и он на коленке сделал такой вот изменятель страничек на стороне сервера. О больших проектах тогда никто не думал, personal home page назывался тот изменятель. А когда делаешь интерпретатор, проще всего сделать его на динамической типизации. Это банально очень просто. О системе типов вообще можно не задумываться, не говоря уже об их выводе. К сожалению, на фоне тогдашнего мейнстрима (Си, ранние плюсы, что там еще было?) эти скриптовые языки выглядели очень выигрышно, писать мелкие куски кода на них было намного проще. Что такое нормальная система типов тогда мало кто знал: хаскель был еще в пеленках, ML'и традиционно не выходили из университетов. Так что люди эти скрипты подхватили, стали добавлять все новые функции. Менять систему типов стало поздно. В итоге выросло то, что выросло. С тех пор одна масса людей занята тем, чтобы делать все более сложные интерпретаторы, которые бы не так тормозили, другая масса придумывает 121-й способ добавить в JS типы, а третья на динамических языках пишет и плачет в бложиках о том, как грустно им делается. И проблема не только и не столько в скорости, сколько в maintainability кода и усилиях на необходимые тестирование и отладку при росте проектов.
Единственная реальная причина появления динамически типизированных языков - лень и недальновидность авторов. Эволюционно динамические языки - тупиковая ветвь, хоть они и обречены рождаться вновь и вновь просто потому что их делать проще, а делать языки люди любят. Сегодняшняя популярность некоторых из них - случайность, исторический казус, следствие контраста между этими языками и мейнстримом начала 90-х. То, что много идиотов используют идиотские языки, говорит лишь о том, что идиотов много. Сегодня, когда есть языки с нормальной статической системой типов, никаких реальных преимуществ у динамической больше нет. Только я имею в виду действительно нормальные статически типизированные языки - как минимум с параметрическим и ad hoc полиморфизмами, с выводом типов. Не Си с джавой. Хаскель, окамл, скала - такого уровня. У этих конкретных языков могут быть свои проблемы, часто инфраструктурные, но речь сейчас не о них, речь о динамической vs. статической типизации в целом.
no subject
Date: 2012-10-12 09:39 pm (UTC)Насчёт production. Я считаю, что волен рассказывать столько о своей работе, сколько хочу. И ещё. Как вы думаете, есть ли такая вещь, как NDA? Могу ли я быть ей связан?
Насчёт семантики сообщений я сам не хочу с вами спорить. Поспорьте лучше с Duncan Coutts.
Я основываю своё понимание семантики передачи сообщений Эрлангом на информации Duncan Coutts (плюс то, что читал до этого). Он, в свою очередь, основывался на чтении документации Эрланга, чтении исходного кода его системы времени выполнения и общении с разработчиками Эрланга. Вы сможете опровергнуть его слова? Время в докладе 20:35. Процесс, которому послали m1, m2 и m3 может получить и m1, m3 (без m2).
Я также процитировал Duncan Coutts, когда говорил о неправильности семантики Эрланга. Вы сможете опровергнуть его слова? Это уже упомянутое выше время 20:35 и 21:25, где говорится о новой, более правильной семантике посылки сообщений.
Я считаю, что способность Эрланга жить с такой реализацией передачи сообщений была гарантирована только подходом let it fail. Это не fail самого Эрланга. Не то, чтобы наоборот, но это отодвинуло необходимость в изменениях на длительное время. Сыграло свою роль в выборе реализации.
И наконец, вы же не считаете, что мы тут с вами только вдвоём общаемся? Моё мнение, что нас будут читать и перечитывать, именно поэтому я стараюсь писать с учётом будущих читателей. А упоминаю я их, чтобы вы не восприняли мои слова, как обидные и направленные именно вам. Мне просто надо донести своё мнение до читателей.
no subject
Date: 2012-10-12 10:33 pm (UTC)Зачем тогда вы написали весь этот шмат рассуждений после этой фразы? Если это опять игра на публику, а «поспорьте лучше с...» должно как бы заткнуть меня, то зачем там внутри расставлены вопросы якобы ко мне? Я просто не могу определиться, стоит ли мне отвечать или нет. Вы же не Duncan Coutts, вроде.
>И наконец, вы же не считаете, что мы тут с вами только вдвоём общаемся?
Нет, конечно. Тут рядом со мной сидят Наполеон и Эйнштейн, ну и Иисус на огонёк зашёл. Мне кажется, что, если вы отвечаете на мой комментарий, то предполагать, что ваш ответ направлен именно мне, нормально. Если же вы хотите доносить мнение до каких-то читателей, то зачем вам для этого комментарии? У вас для этого вроде блог есть.
no subject
Date: 2012-10-12 10:47 pm (UTC)Действительно, у меня есть блог. Но я также могу использовать и комментарий. Я считаю, что у меня есть свобода выбора. На данный момент я выбрал комментарий, ибо не считаю тему достаточно заметной. Либо наоборот, достаточно заметной помещения комментария в эти рассуждения.
no subject
Date: 2012-10-12 11:22 pm (UTC)>Процесс, которому послали m1, m2 и m3 может получить и m1, m3 (без m2).
...если это сообщение, посланное между нодами по сети, причём m2 попадёт на момент реконнекта между нодами по причине фейла сети.
Нужно ли пояснять то различие восприятия вероятности подобного события, которое возникает из опущеной вами подробности? Мне с трудом верится, что вы, явно пересмотрев это видео несколько раз (в конце концов, вряд ли вы запомнили эти цифры времени с первого раза), не обратили внимания на эту «мелкую деталь». Добавляет же идиотизма изначальной претензии решение, которое предлагается на следующем слайде: дожидаться ответа для важных сообщений, гарантируя их доставку. Конечно же, никто в Erlang community не додумался до этого, это невозможно сделать средствами Erlang и поэтому нужно срочно переписать всё на Cloud Haskell, который принципиально улучшит семантику сообщений.
Кстати, упомянутый Duncan Coutts:
-не писал на Erlang'е сам;
-судя по http://www.well-typed.com/people/duncan, не имеет production опыта, исключительно academy+opensource.
Поэтому приводить его в качестве авторитета относительно профессионального применения Erlang или Haskell достаточно странно.
Безусловно, у вас есть свобода хамить окружающим, устраивая цирковое представление «для читателей» из диалога.
no subject
Date: 2012-10-13 12:25 am (UTC)Итак, дворянин ли вы?
Другое значение "хама" - преклоняющийся перед властью и тп. Не думаю, что это мой случай. Как и остальные.
Вы как-то уж очень напираете на production опыт. Мне напомнить, что Эрланг создавался в компьютерной лаборатории высоколобыми учёными? Я подозреваю, что у Джо Армстронга на момент создания Эрланга не было production опыта. Есть ли у вас опровергающие моё подозрение факты?
Я предпочитаю опираться на ум и опыт разработчика, желательно, чтобы опыт был обширен. Эрланг создавался умными людьми, так и создатели Cloud Haskell не хуже. С обоими я знаком лично, правда, в разной степени. Jeff Epstein работает в Parallel Scientific, соответственно, я общался с ним много больше.
Поэтому я смотрю на CH много оптимистичней, чем вы.
У меня широкий production опыт встраиваемых систем, от шумомера до банкомата. Более 16 лет в сумме. Я не люблю ошибки, ибо поправить их я, обычно, не мог и они стоили больших денег работодателям. Я также не люблю ошибки, ибо мне "лень" их править - цена исправления пропорциональна времени между внесением и обнаружением, поэтому чем позже ошибка обнаружена, чем тяжелее придётся трудиться. "Лень" в кавычках, конечно, ибо я исправлю свою ошибку, и чужую тоже. Просто мне нравится их не допускать, есть в этом что-то такое, даже вы, я думаю, согласитесь.
Я думаю, вам просто нравится адреналин "исправления после тестирования на зеркале production системы". Так, чтобы заметно было, чтобы все восторгались вокруг, какой вы молодец.
Ибо я не вижу других причин в хвастовстве пропущенной ошибкой, кроме как повторения столь приятного воспоминания. В её исправлении как можно более быстрым способом также нет никакой особой доблести. И рассказ об этом также несёт исключительно психологическую нагрузку. И уж совсем нет вашей заслуги в том, что вы воспользовались при этом Эрлангом. Как нет заслуги Эрланга во всей этой феерии, ибо он всего лишь инструмент.
Broken window fallacy, вот ближайшее понятие, которое приходит на ум при чтении историй о горячей подмене кода.
no subject
Date: 2012-10-13 12:42 am (UTC)-про «Erlang теряет сообщения, Cloud Haskell это фиксит» мы вроде выяснили, что это ложь, причём ваша, а не автора презентации;
-про «Cloud Haskell это Erlang версии 2, done right» мы вроде тоже выяснили, что на версию 2 ни по фичам, ни по «багфиксам» не тянет.
Таким образом, я не совсем понимаю, к чему это полотно текста. К вашему гигантскому, но бесследному опыту? Ну так сами же говорите — эмбеддед, это очень узкая ниша, из которой делать заявления про программирование вообще немного странно и самонадеянно. К «не люблю делать ошибки» и диагностике по аватарке? Ну, видимо, вам приятнее верить в код без ошибок. Мне не жалко, у нас свобода вероисповедания пока. Если вам хочется просто выговориться, зачем вы делаете это в ответе мне?
no subject
Date: 2012-10-13 12:48 am (UTC)no subject
Date: 2012-10-14 09:54 am (UTC)1. кто выбирает, где находятся акторы - локально или распределённо?
2. как система знает, что m2 безнадёжно утрачен, когда отдаёт m3 до m2?
(ну и как "читатель", скажу, что так да, обоих вас читают :))
no subject
Date: 2012-10-24 01:35 pm (UTC)2. Я не совсем понял вопрос.
no subject
Date: 2012-10-24 07:48 pm (UTC)В противном случае если система не знает, что m2 утрачен, она не должна отдавать m3 до m2. Так?
no subject
Date: 2012-10-24 10:22 pm (UTC)-m1, m2 и m3 это *атомарные* сообщения уровня платформы. Т.е. речь не идёт о «получить невалидный терм на вход» — если терм вообще передался, то он валиден. Подобные гарантии предоставляет нам TCP, плюс это контролируется протоколом общения нод;
-т.к. ноды, действительно, могут быть рассоединены аппаратно, а после этого снова соединены, при этом в буфере на отправку может лежать некоторое количество сообщений — возможна ситуация, когда из очереди на посылку потеряется какое-то *целое* количество сообщений (хотя и *крайне* маловероятна). Однако любые решения относительно таких вопросов на уровне платформы будут крайне неэффективными, т.к. это не логика уровня платформы, это логика уровня приложения. Насколько важен порядок и полнота доставки? Сколько мы можем ждать прихода подтверждения о получении? Что делать, если потерялось подтверждение о получении, но фактически сообщение получено? Всё это вопросы, специфичные для конкретного приложения; поэтому в рамках Erlang'а это тривиально решается программистом. Более того, пример, который приводится там в презентации Cloud Haskell как «решение проблемы» — откровенно идиотский, т.к. это просто примитивное ожидание подтверждения получения сообщения без какой-либо логики вроде таймаутов и «а что делать, если потерялось именно подтверждение», и он ровно так же присутствует в Erlang'е (впрочем, хотя бы с таймаутами).
Кстати, я как-то забыл ещё один момент: очень заметно, что тот товарищ — дилетант в Erlang'е, потому как Cloud Haskell не имеет одной из главных (и, имхо, даже более важных, чем межнодное взаимодействие) фич: супервизоров и их деревьев. Проект, который заявляет о том, что он «Erlang-inspired», при отсутствии супервизоров можно закапывать сразу.
no subject
Date: 2012-10-25 12:37 am (UTC)Прав ли я, что супервизоры и их деревья (которые, если мне не изменяет память, обычно являются чем-то вроде расчёски, ибо количество уровней чаще всего 1) выполняются в виде библиотеки поверх сообщений от VM? Если я прав, то сообщения от VM об отключении процесса есть, насколько я понимаю в состоянии дел. Если я не прав, то не затруднит ли вас показать, где в языке Эрланг, без OTP, присутствует этот функционал?
no subject
Date: 2012-10-25 08:39 am (UTC)>количество уровней чаще всего 1
Нет
>супервизоры и их деревья выполняются в виде библиотеки поверх сообщений от VM
Нет
>не затруднит ли вас показать, где в языке Эрланг, без OTP, присутствует этот функционал
links/monitors/trap_exit
no subject
Date: 2012-10-25 11:47 am (UTC)Мои сведения про количество уровней взяты из диссертации Джо Армстронга.
Поскольку вы сказали категорическое "нет", я хотел бы попросить вас дать статистику по проектам на Эрланге, которая бы подтвердила бы "не чаще всего". Ибо мои сведения взяты из устаревшей, наверное, диссертации Джо Армстронга.
Спасибо за links/monitors/trap_exit. Это отлично подтвердило ваши слова. Более чем. Любой, кто прочитает links/monitors/trap_exit способен уверовать в отсутствие супервизоров на сообщениях от VM. Ибо зачем ему проверять? И вам не стоит давать ссылки, ибо вдруг кто проверит, не станет верить на слово.
У меня позиция много слабей. Я всего лишь могу предоставить ссылку на код на GitHub: https://github.com/haskell-distributed/distributed-process/blob/master/distributed-process/src/Control/Distributed/Process.hs
Там нет магических слов links/monitors/trap_exit. Там есть вот такой кусочек кода:Это декларации для удобного импорта. На мой взгляд, присутствует весь необходимый функционал. Реализация функций находится вот здесь: https://github.com/haskell-distributed/distributed-process/blob/master/distributed-process/src/Control/Distributed/Process/Internal/Primitives.hs
Хочу вернуться к диссертации Джо. Вот она: http://www.sics.se/~joe/thesis/armstrong_thesis_2003.pdf
Да, описание мониторов находится в описании Эрланга.
Однако, есть и страница 41: "Viewed as a concurrent language, Erlang is very simple. Since there are no shared data structures, no monitors or synchronised methods etc there is very little to learn."
Получается, что в самом Эрланге нет мониторов, но они есть в его VM.
А вот описание деревьев супервизоров начинается на странице 118, в разделе "Programming Fault Tolerant Systems". То есть, к Эрлангу, как языку и его VM, это отношение не имеет. А я, вроде, об этом спрашивал.
Ну, и страница 175: "There were a total of 141 .app files the AXD sodware. These 141 files represent 11 disjoint supervision trees. Most of the supervision trees are very flat and do not have a complex structure." Далее страница 176: "There are two main sub-nodes in the tree, and the supervisor structure underneath the sub-nodes is flat.".
То есть, как минимум poster child project Эрланга имеет структуру супервизоров, как описал я.
no subject
Date: 2012-10-25 12:07 pm (UTC)Именно так, просто я хотел слегка смягчить указание на то, что возвращаться после хлопка дверью несколько убого.
>хотел бы попросить вас дать статистику по проектам на Эрланге, которая бы подтвердила бы "не чаще всего"
Статистику, будьте добры, посчитайте как-нибудь сами, я же приведу в пример пару приложений — системный kernel и сверхпопулярный ranch (ex-cowboy):
http://i.imgur.com/xpFLc.png
http://i.imgur.com/kPrPb.png
Тезисы Армстронга с 2003 года это мило, но с тех пор прошло почти 10 лет.
>Получается, что в самом Эрланге нет мониторов, но они есть в его VM.
Пожалуйста, изучайте вопрос полнее перед тем, как делать какие-либо утверждения и выводы.
https://en.wikipedia.org/wiki/Monitor_%28synchronization%29
http://www.erlang.org/doc/man/erlang.html#monitor-2
Это принципиально разные вещи. На странице 41 идёт речь о первом, я говорил о втором.
Я не совсем понял, в чём вы попытались меня уличить, кстати, но в целом ситуация меня крайне забавляет всю ветку: вам никак не надоедает учить меня Erlang'у, хотя казалось бы, с чего б вам это делать.
no subject
Date: 2012-10-25 12:20 pm (UTC)>вам никак не надоедает учить меня Erlang'у, хотя казалось бы, с чего б вам это делать.
Что вы! Я делюсь известной мне информацией и получаю неизвестную мне. Параллельно пробуя разобраться с увиденными мной логическими ошибками.
Вопрос про деревья супервизоров. Зачем делать глубокие деревья? Как я понимаю, они менее устойчивы.
no subject
Date: 2012-10-25 01:50 pm (UTC)Erlang and OTP in Action, Martin Logan, Eric Merritt, and Richard Carlsson, 2010
>Как я понимаю, они менее устойчивы
Неправильно понимаете.
(no subject)
From:no subject
Date: 2012-10-25 12:24 pm (UTC)Вот, в чём.
Вы воспринимаете Эрланг вместе с его VM и OTP. Если вы отделите Эрланг от VM и OTP, вас ждёт много интересного. Например, открытие, что Эрланг - очень плохой язык. Потому, что простой.
В частности, в самом Эрланге нет мониторов ни в одном из указанных вами смыслов.
Далее, вы обвинили автора distributed-process в отсутствии мониторов процессов, когда они там есть. Достаточно было посмотреть на основной файл с экспортами. Аналога супервизоров OTP нет, есть такое. Но средства сделать это есть.
А это означает второе замечательное открытие - OTP переносима.
no subject
Date: 2012-10-25 02:03 pm (UTC)Спасибо за крайне весомое экспертное заключение. Как ни странно, не только я, но и Лев Валкин, основной бизнес которого построен на Erlang'е, считает простоту Erlang'а одним из основных его плюсов. Равно как и тысячи других людей, пишущих на Erlang'е работоспособные продукты. Равно как и люди из Эриксона, которые создали Erlang. Но, безусловно, все мы просто глупы.
>вы обвинили автора distributed-process в отсутствии мониторов процессов, когда они там есть
Это снова ваша фантазия. Цитирую себя же:
>Cloud Haskell не имеет одной из главных (и, имхо, даже более важных, чем межнодное взаимодействие) фич: супервизоров и их деревьев
Где вы увидели тут что-то про «отсутствие мониторов процессов»?
>OTP переносима
...но не на Haskell. В соседней ветке вы уже высказались по поводу «рантайм дебаг и интроспекция не нужны, у настоящих профессионалов не бывает ошибок и всё сразу работает без багов», однако это по-прежнему одни из основных фич OTP. Поэтому для того, чтобы состязаться с OTP, неплохо бы для начала придумать, как сконструировать сходный рантайм с горячими обновлениями и динамической интроспекцией. В противном же случае вы вольны называть свои любимые продукты как угодно, но не «новая версия Erlang'а» и не «OTP поверх Haskell».
(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:(no subject)
From:no subject
Date: 2012-10-25 08:20 am (UTC)no subject
Date: 2012-10-25 09:01 am (UTC)no subject
Date: 2012-10-25 12:23 pm (UTC)Если m1/m2/m3 уходят по одному соединению, их порядок гарантирован TCP.
На видео речь идёт о совершенно ортогональной вещи. Речь о strict ordering vs reliable delivery. Так вот, Duncan всего лишь пожаловался, что в спецификации Эрланга не очень уточняется, что именно означает reliable delivery, а отсюда вытекают всякие вещи. И что в более поздних работах "кого-то там" именно этот вопрос уточняется. Из чего вытекает фокус с возможным reordering сообщений, которые переданы в cloud haskell по разным соединениям, хотя из program order должен бы выводиться total order сообщений.
У меня совершенно не сложилось впечатления, что де хаскель эту задачу решает "правильнее Эрланга", а лишь объясняется, почему они делают так, и что Эрланг тоже так поступает / будет поступать / столпы благословили такой подход.
Должен заметить, что ждать response совершенно не обязательно для гарантий reliable delivery. В Эрланге есть механизм Unit Of Order? Вот в Java Messaging Service есть.
В двух словах, Reliable delivery не отличается от такого упорядочивания, когда сообщения, отправленные в program order после отправки сообщения X, могут обозреваться получателем только после обозревания сообщения X. Unit of order создаёт такие ребра в partial order всех сообщений, получаемых агентом, что акторы работают как в reliable delivery.
Обращаю внимание на важный пункт: unit of order решается сугубо локальной логикой, не требующий синхронизации с удалёнными агентами, и всего лишь отражает локальную out of bounds синхронизацию, которую очередь сообщений не может наблюдать. Однако, это решение не может быть реализовано без примитивного барьера в системе передачи сообщений.
no subject
Date: 2014-09-24 12:05 pm (UTC)no subject
Date: 2012-10-25 08:51 am (UTC)link p;
send p "hi!";
unlink p;
link p;
send p "bye!";
unlink p;
в каком порядке доставка "hi!" vs "bye!"? Логически два соединения разные и порядок между сообщениями этих соединений отсутствует.
no subject
Date: 2012-10-25 09:02 am (UTC)