http://thedeemon.livejournal.com/ ([identity profile] thedeemon.livejournal.com) wrote in [personal profile] thedeemon 2009-10-23 11:36 am (UTC)

Парсеру пофиг что за кодировка, хоть суахили. В окамле есть тип char размером в 1 байт, его можно перевести в int и получить число от 0 до 255. Что именно это число будет означать когда оно больше 127 окамлу все равно. Исходник программы тоже в 8-битной кодировке. Если используешь конкретные значения, например, русские буквы, то надо следить за тем, чтобы кодировка исходника соответствовала кодировке разбираемого текста (или конвертить при чтении), короче как обычно это бывает с неюникодными программами. Если хочется парсить символы в UTF8 или 16-битном юникоде, то нужно вместо char использовать что-то другое, но на алгоритм это не влияет.

Post a comment in response:

This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting