Парсеру пофиг что за кодировка, хоть суахили. В окамле есть тип char размером в 1 байт, его можно перевести в int и получить число от 0 до 255. Что именно это число будет означать когда оно больше 127 окамлу все равно. Исходник программы тоже в 8-битной кодировке. Если используешь конкретные значения, например, русские буквы, то надо следить за тем, чтобы кодировка исходника соответствовала кодировке разбираемого текста (или конвертить при чтении), короче как обычно это бывает с неюникодными программами. Если хочется парсить символы в UTF8 или 16-битном юникоде, то нужно вместо char использовать что-то другое, но на алгоритм это не влияет.
no subject
Date: 2009-10-23 11:36 am (UTC)