Haskell, Parsec 2 и тормоза
Apr. 26th, 2010 01:14 amПомня о том, какое бурление вызвало сравнение скорости Лиспа с другими языками в прошлом номере ПФП, прошу помощи зала не допустить несправедливости. Я сейчас доделываю сравнение скорости разных методов парсинга, сделал вариант на Хаскеле на базе Parsec2, и получившаяся скорость мне совсем не нравится. До этого на Хаскеле не писал, поэтому наверняка мог сильно налажать. Исходник (~70 строк) выложил здесь.
Суть программы - чтение карты формата OpenStreetMap и вычисление ее реальных границ - минимальных и максимальных значений широты и долготы встреченных точек. Собирал ее с GHC 6.8.3 и 6.10.1, Parsec 2.1.0.1, команда для сборки:
Сейчас скорость получается около 3 МБ/с.
Пример простой карты тут. Скорость тестировал на карте Сингапура (архив 1.2 МБ).
Прошу более опытных товарищей глянуть на исходник и указать на явные косяки. Можно ли заметно ускорить программу без сильных изменений описанной там грамматики?
Суть программы - чтение карты формата OpenStreetMap и вычисление ее реальных границ - минимальных и максимальных значений широты и долготы встреченных точек. Собирал ее с GHC 6.8.3 и 6.10.1, Parsec 2.1.0.1, команда для сборки:
ghc -O2 -package parsec bounds.hs -o bounds
Сейчас скорость получается около 3 МБ/с.
Пример простой карты тут. Скорость тестировал на карте Сингапура (архив 1.2 МБ).
Прошу более опытных товарищей глянуть на исходник и указать на явные косяки. Можно ли заметно ускорить программу без сильных изменений описанной там грамматики?
no subject
Date: 2010-04-25 07:10 pm (UTC)no subject
Date: 2010-04-25 07:29 pm (UTC)Сейчас готовы цифры по таким вариантам:
OcamlYacc, классические парсер-комбинаторы на Окамле, их модификация без списков, оптимизирующие парсер-комбинаторы на Окамле (это тема статьи), C#/System.Xml, Haskell/Parsec2.
Планируется еще добавить Boost.Spirit. Если есть еще предложения - буду рад услышать.
no subject
Date: 2010-04-25 07:29 pm (UTC)no subject
Date: 2010-04-25 07:35 pm (UTC)no subject
Date: 2010-04-26 01:06 am (UTC)no subject
Date: 2010-04-26 03:33 am (UTC)no subject
Date: 2010-04-26 07:22 am (UTC)no subject
Date: 2010-04-26 07:51 am (UTC)Кстати, в Haskell можно работать со структурами аналогично OCaml:
update_lat lat bnd = bnd { minlat = min lat (minlat bnd), maxlat = max lat (maxlat bnd) }no subject
Date: 2010-04-26 07:55 am (UTC)no subject
Date: 2010-04-26 08:11 am (UTC)Про структуры спасибо за хинт, поправлю.
no subject
Date: 2010-04-26 08:13 am (UTC)Документация говорит, что комбинатор альтернативы не делает сам откат в случае неудачи первого варианта, а для корректной работы откаты эти нужны, поэтому я в непоследние альтернативы повставлял try.
no subject
Date: 2010-04-26 08:40 am (UTC)Проблема в том, что в ленивом языке комбинатор, аналогичный <|>, в случае удачи с первой альтернативой должен идти дальше и возвращаться к следующими альтернативам в случаях обломов. Для этого он должен все помнить. Что бы избежать этой проблемы, <|> находит первый сработавший парсер и забывает про остальные.
"Идеологически правильное" поведение можно востановить с помощью try (как именно уже не помню), но нужно это сравнительно редко.
no subject
Date: 2010-04-26 09:01 am (UTC)Возьмем простой пример. Файл состоит из XML тэгов, тэг может быть node, а может быть какой-то другой, нам не интересный. Сейчас это описано как
try p_node <|> p_tag
Если убрать try, то парсер попробует разобрать очередной тэг как node, и если не получилось, то с _текущей_ позиции будет пытаться разбирать tag, но часть символов (как минимум открывающая скобка) уже будет съедена, что приведет к ошибке. Т.е. нужно вернуться на начало тэга, для этого и try. Или я все неправильно понял?
По идее, try можно убрать из тех мест, где начала альтернатив точно не пересекаются, например при разборе флоатов. Попробую.
no subject
Date: 2010-04-26 09:12 am (UTC)Что занятно, гораздо большее ускорение получилось после добавления ключика -threaded при компиляции. Без него программа частенько падала в конце, будучи собрана GHC 6.10.1 (из-за этого бага, похоже)
no subject
Date: 2010-04-26 09:13 am (UTC)no subject
Date: 2010-04-26 09:22 am (UTC)Проблема будет если написать p_tag <|> p_node. Здесь p_node распознается как p_tag и как p_node его разобрать не попробуют.
no subject
Date: 2010-04-26 10:59 am (UTC)Loading package parsec-2.1.0.1 ... linking ... done.
*Main> :t prs
prs :: GenParser Char st String
*Main> runParser prs () "" "<node>"
Right "<node>"
*Main> runParser prs () "" "<way>"
Left (line 1, column 1):
unexpected "w"
expecting "<node>"
Съел открывающую скобку, и альтернативу стал применять к остатку строки, а не с ее начала. Потому и нужен try.
no subject
Date: 2010-04-26 11:09 am (UTC)"Grammar 1" - более-менее честный XML парсер, "Grammar 2" оптимизирован
в предложенном стиле (стал раза в 2 быстрее).
Код на Github (http://gist.github.com/379183)
no subject
Date: 2010-04-26 11:24 am (UTC)Попробую запустить и включить в сравнение.
no subject
Date: 2010-04-26 01:03 pm (UTC)Вот собсно код http://www.everfall.com/paste/id.php?br3cu0ui8ere
(61 строка). Собиралось 10м экспрессом (в пустой проект добавить этот файл и все 4 файлика пуги. Время работы релиза со статикой ~0.17 сек. Результат практически такой же ( другая точность распечатки плавучки ) и я поленился на мессаджи :)
no subject
Date: 2010-04-26 01:19 pm (UTC)после гугления нашлось вот такое:
http://www.serpentine.com/blog/2010/03/03/whats-in-a-parsing-library-1/
http://www.serpentine.com/blog/2010/03/03/whats-in-a-parser-attoparsec-rewired-2/
http://hackage.haskell.org/package/attoparsec
может стоит сравнить? :)
no subject
Date: 2010-04-26 03:10 pm (UTC)no subject
Date: 2010-04-26 04:23 pm (UTC)no subject
Date: 2010-04-26 08:37 pm (UTC)import Text.ParserCombinators.Parsec import qualified Text.ParserCombinators.Parsec.Token as Token import Text.ParserCombinators.Parsec.Language (emptyDef) import System.CPUTime import System.Environment data Bounds = Bounds { minlat, maxlat, minlon, maxlon :: !Double } deriving (Show) update_lat lat bnd = bnd { minlat = min lat (minlat bnd), maxlat = max lat (maxlat bnd) } update_lon lon bnd = bnd { minlon = min lon (minlon bnd), maxlon = max lon (maxlon bnd) } lexer = Token.makeTokenParser emptyDef p_positive_float = Token.float lexer p_float = ((char '-' >> return negate) <|> (return id)) >>= \f -> p_positive_float >>= (return . f) latlon = do param <- do name <- many1 letter char '=' char '"' return name case param of "lat" -> p_float >>= (updateState . update_lat) "lon" -> p_float >>= (updateState . update_lon) _ -> (many $ noneOf "\"") >> return () char '"' return () p_param = do many1 letter string "=\"" many $ noneOf "\"" char '"' return () p_node_param = latlon p_endnode = try (string "/>") <|> manyTill anyChar (try (string "")) p_ws = many $ oneOf " \t\n" p_node = do string ">import Text.ParserCombinators.Parsec
import qualified Text.ParserCombinators.Parsec.Token as Token
import Text.ParserCombinators.Parsec.Language (emptyDef)
import System.CPUTime
import System.Environment
data Bounds = Bounds { minlat, maxlat, minlon, maxlon :: !Double } deriving (Show)
update_lat lat bnd = bnd {
minlat = min lat (minlat bnd), maxlat = max lat (maxlat bnd) }
update_lon lon bnd = bnd {
minlon = min lon (minlon bnd), maxlon = max lon (maxlon bnd) }
lexer = Token.makeTokenParser emptyDef
p_positive_float = Token.float lexer
p_float = ((char '-' >> return negate) <|> (return id)) >>= \f -> p_positive_float >>= (return . f)
latlon = do
param <- do
name <- many1 letter
char '='
char '"'
return name
case param of
"lat" -> p_float >>= (updateState . update_lat)
"lon" -> p_float >>= (updateState . update_lon)
_ -> (many $ noneOf "\"") >> return ()
char '"'
return ()
p_param = do
many1 letter
string "=\""
many $ noneOf "\""
char '"'
return ()
p_node_param = latlon
p_endnode =
try (string "/>") <|> manyTill anyChar (try (string "</node>"))
p_ws = many $ oneOf " \t\n"
p_node = do
string "<node"
many (p_ws >> p_node_param)
p_endnode
p_tag = between (char '<') (char '>') (many (noneOf ">"))
p_osm = do
many $ (try p_node <|> p_tag) >> p_ws
bnd <- getState
return $ show bnd
bnd0 = Bounds 1000.0 (-1000.0) 1000.0 (-1000.0)
parse_osm_file fname = do
input <- readFile fname
case runParser p_osm bnd0 fname input of
Right str -> putStrLn str
Left err -> do
putStr "parse error at "
print err
main = do
args <- getArgs
case args of
[] -> putStrLn "usage: bounds osmfile"
fname:_ -> do
t0 <- getCPUTime
parse_osm_file fname
t1 <- getCPUTime
putStrLn $ show $ 1.0e-12 * (fromInteger $ t1 - t0)
</pre
>Вот такой вариант.
ghc -O3 -o bounds --make -fvia-C -funbox-strict-fields -optc-ffast-math -optc-O3 -optc-mfpmath=sse b.hs
ghc 6.10.1
+10..15% к скорости. Правда, ругается, что SSE отключен.
Есть у меня подозрение, что дело в работе с плавающей точкой, а не в самом разборщике.
no subject
Date: 2010-04-26 09:09 pm (UTC)Parse 3 дает скорость примерно в 3-10 раз меньше (долго рассказывать, почему).
Если надо парсить не-UTF8 (или сравнивать с решениями, которые парсят байтовый поток), то стоит смотреть на attoparsec или его аналоги.
no subject
Date: 2010-04-27 03:58 am (UTC)no subject
Date: 2010-04-27 08:40 am (UTC)no subject
Date: 2010-04-27 09:12 am (UTC)Попробуй вот эту версию http://community.haskell.org/~aslatter/code/parsec/cps/ (см. тред http://www.mail-archive.com/haskell-cafe@haskell.org/msg67893.html )
no subject
Date: 2010-04-27 01:23 pm (UTC)no subject
Date: 2010-04-27 01:25 pm (UTC)no subject
Date: 2010-04-28 07:14 am (UTC)Краткий диагноз - хаскель cpu bound. плюсы IO bound.
Дальше речь идет о хрюшке x86 тк померять линупс на работе лениво - туда еще хаскель через одминов пропихивать, семерку дома лениво - надо дома сползти с дивана. Макось меня послала скачивать новый xcode иначе haskell platform из портов не ставится - так что тоже лениво.
На холодном файловом кэше код который я привел побить неудается.
С более точным таймером (timeBeginPeriod(1),timeGetTime()) предложенный код работает ~167ms (собранный целиком статикой с stlport и тп)(горячий кэш). На холодном 170-200ms.
На горячем кеше предел мечтаний в районе 115-130ms но дергается - антивирус может быть а может и еще какая ерунда. Имхо написание потокового парсера может оправдать только требование кушать реально большие файлы. Как показало вскрытие pugixml делает fread( filesize ) что быстро удаляется от оптимума при росте размера xml файлов дальше десятков мб.
Вот собсно и все про перформанс _этого_ примера - спасибо пост и комментарии про lpeg и от thesz были весьма интересны - я даже полистал доки spirita - там возможно решение на PEG портируется без переделок алгоритма.
no subject
Date: 2010-04-28 08:20 am (UTC)разумеется для горячего файлового кэша плюсы тоже сpu bound - так что можно еще в пару раз.
перф. для меня это хобби для отдыха :) Если вспомню с какой стороны парсеры можно будет пойти на спортивный результат :D
no subject
Date: 2010-04-28 08:49 am (UTC)no subject
Date: 2010-04-28 12:49 pm (UTC)правда и хаскельный вариант на хрюше 32 упал с
bounds.exe: out of memory
интересно под Win64 есть возможность собрать ваш пример на хаскеле? или только 32 ?
no subject
Date: 2010-04-28 01:23 pm (UTC)no subject
Date: 2010-05-02 11:18 am (UTC)Если захотеть поглумиться над industrial c++ то нужно выманить на спор деятелей с xerces или msxml на потоковый парсинг. пусть заюзают какой-нибудь sax2 и почувствуют разницу с каким-нибудь фп-yacc :).
no subject
Date: 2010-05-03 10:54 am (UTC)no subject
Date: 2010-05-05 07:57 am (UTC)http://thedeemon.livejournal.com/15606.html
no subject
Date: 2010-05-05 08:00 am (UTC)no subject
Date: 2010-05-05 08:06 am (UTC)no subject
Date: 2010-05-07 05:53 pm (UTC)Если с ним собирать программу без изменений, то работает в 2 раза медленней, чем c 2.1.0.1.
Если переписать на использование ByteString, то в 3 раза медленней.