thedeemon | Фрактальное сжатие

Фракталы бывают очень разные по своему устройству, но объединяет их самоподобие: какие-то части в них похожи на другие их же части в другом масштабе. Фрактальный метод сжатия изображений берется сделать фрактал из любой картинки, ведь если взять произвольную фотку, там можно найти немало похожих фрагментов:

:)
Ну, может не везде столь же хорошо, но если для какого-то куска не находится похожего, его можно разбить на кусочки поменьше и поискать для них. В конце концов, на уровне отдельных пикселей найти похожие уж точно не проблема. Итак, возьмем картинку, разобъем ее на блоки и для каждого блока будем искать похожий блок большего размера. Он может быть где угодно. Он может быть как угодно повернут и растянут, даже нелинейно. Разрешим этому блоку также иметь другой контраст (вплоть до инвертированного) и яркость, лишь бы контраст был больше. Запишем найденное в виде набора соотношений "блок такой-то очень похож на такую-то область, к которой применили вот такое геометрическое преобразование, а яркости умножили на k и добавили константу b" (константы для разных блоков будут разные). Оказывается, что этих соотношений нам достаточно, чтобы восстановить картинку. Если геометрическое преобразование сжимающее (уменьшает расстояние между любыми двумя точками), и преобразование яркости тоже (константа k по модулю меньше единицы), то, слава матану, взяв произвольные начальные значения яркости и применив эти преобразования в цикле некоторое количество раз, мы придем к неподвижной точке всей системы преобразований, она и будет картинкой. Теперь отложите ваши айпады на помоечку и полюбуйтесь вот этими 58 килобайтами флэша.

Тут видны получающиеся на разных итерациях из изначального хаоса картинки, а поводив мышкой по блокам, можно видеть, какие блоки берутся за источники. Как вы догадались, в прошедшем соревновании картинка была сжата именно этим способом. Чем сложнее доступное геометрическое преобразование для блока, тем выше можно получить качество, но тем больше данных придется хранить. В данном случае исходные блоки брались ровно вдвое больше текущего, никаких поворотов не делалось, поэтому сохранялись лишь координаты блока (по 9 бит на координату) и коэффициенты k и b (7 и 10 бит соответственно). Изначально картинка была разделена на 64х64 блока, некоторые из них поделились рекурсивно на 4 поменьше, некоторые из тех еще на 4 поменьше, всего чуть меньше 9000 блоков, что заняло 40 КБ данных.

Интересным свойством этого метода является то, что результат формулируется в векторном виде, и декодировать картинку можно в произвольное разрешение. Выше она декодирована в 512х512, в контесте декодировалась в 1024х1024, а вот тут, например, ее фрагмент при разжатии в 2048х2048. При увеличении картинка получается заметно более четкая, чем при увеличении растровых картинок каким-нибудь Ланцошом, линии сохраняют плавность, но все заметнее становятся границы блоков. На этой идее работают некоторые фрактальные увеличивальщики картинок.

Flat | Top-Level Comments Only

From:

digital333.livejournal.com

Круто.. я до этого только игрушки одни видел. А этот очень красивую картинку выдаёт..

From:

wizzard

картинки не работают(

Google Chrome could not load the webpage because stuff.thedeemon.com took too long to respond

From:

thedeemon.livejournal.com

а сейчас?

Можно еще заменить stuff.thedeemon на data.infognition. В частности:
http://data.infognition.com/lj/frakshow.html

Edited Date: 2012-12-19 10:40 am (UTC)

From:

wizzard

надо отметить что на 2 из 3 провайдеров оно так и не начало ресолвиться. но на третьем посмотрел.

From:

thedeemon.livejournal.com

Оказывается, это мой хостер намудрил с фильтрацией, от кого-то защищаясь. Сегодня с похожими жалобами на ненахождение сайта обратился итальянец, у него тоже IP на 82 начинается. Вроде, сейчас должно заработать нормально.

From:

nivanych.livejournal.com

> если для какого-то куска не находится похожего

То можно переопределить и дополнить 'понятие' похожести.

> Если геометрическое преобразование сжимающее

Можно сжимающее преобразование определить и по-другому.
Лишь бы оно было сжимающее относительно введённой метрики.
И оно совсем не обязательно будет всегда геометрически сжимающим картинку.
Относительно какой метрики описанное в посте преобразование является сжимающим?
Иначе говоря, что является функцией похожести?

Возможно, что стоит вспомнить и более широкие теоремы о неподвижной точке.
Хотя и известные мне тут применить куда сложнее.
Но может быть, как-то и можно. Но подумать стоит.

Собственно, я хотел высказать такую мораль — начинать надо с определения пространства. Если говорить про известную, гарантированно и понятно работающую классику, то с метрики пространства (то есть определения 'похожести').

From:

thedeemon.livejournal.com

Ну, тут везде L2 - классика.

Было бы интересно посмотреть, что получится с какой-нибудь SSIM, например.

From:

nivanych.livejournal.com

L_2, это слишком примитивно.
Можно привести аналогию со словами над алфавитом — это похоже на метрику Хэмминга (лень уточнять, думаю, суть понятна).
В общем, уже просто придумывать получше метрику уже должно дать хорошее.

Замечание про L_2 может быть полезным (скорее, что нет) вот в каком смысле —
картинки, это пространство заметно получше, чем метрическое и у него есть дополнительные хорошие свойства.
Скажем, сходу, несложно его рассматривать не как кусочно постоянное, а как пару раз гладкое.
Пользовать напрямую L_2, это слишком примитивно, но возможно, что удастся сделать какую-то другую норму по-хитрее. Может быть, где-то удастся подобное применить для оптимизации.
Я оцениваю это, как маловероятное.

А вот усложнять метрику, как раз, считаю перспективным делом.
SSIM-подобное попробовать, для начала, что ли...
Метрическими пространствами можно описать очень, очень многое.
И в них есть хорошие быстрые алгоритмы.
Я пытался когда-то составлять метрику через триангулирование изображения и попытку сделать что-то типа "Левенштейна" дальше.
Если бы сейчас продолжил, то может быть, что-то бы и получилось.

Другое направление, это усложнять набор сжимающих отображений. Правда, это сильно специфично относительно заданной метрики.
Как-то так.

From:

nivanych.livejournal.com

И кроме того, всякия сжатия должны соответствовать хоть чему-то хоть про какие-нибудь исследования про восприятие цвета ивсётакое.
Например, можно фрактально сжимать не саму картинку, а вавлет-преобразование. И сжимать не RGB, а какое-нибудь YUV. И с разной степенью сжатия для разных компонент.

From:

thedeemon.livejournal.com

В данном случае цветовое пространство было сжато до прямой Y. ;)

From:

nivanych.livejournal.com

;-) Ну так я же про вообще!

From:

thedeemon.livejournal.com

Про вообще, тогда следует также учитывать время и координаты просмотра. Вот у вас там сейчас зима, все серое, цветовые рецепторы не используются, вот и нечего приучать, можно цвет не передавать до весны. :)

Edited Date: 2012-12-19 02:14 pm (UTC)

From:

nivanych.livejournal.com

Выпитое пиво тоже учитывать?

From:

thedeemon.livejournal.com

Ага, количество деталей можно варьировать.

From:

kosiakk.livejournal.com

Вау, впечатляет. Там действительно всего 6 итераций до финального качества?! Это, получается, распаковка будет чуть ли не быстрее джепега. Фантастика какая-то.

А что если не делить картинку на блоки точно, а попробовать альтернативы:
- Базовые блоки с немного пересекающимися границами - насколько я понимаю, в области пересечения метод будет автоматически усреднять результат;
- Блок не в виде квадрата, а в виде какого-то "гауссового" облака - ближе к краям становится прозрачнее

Это я к проблеме проявляющихся квадратов при увеличении.

From:

digital333.livejournal.com

Тогда сжималка будет картинку лет 100 расчитывать)) это щас самая больная проблема..

From:

kosiakk.livejournal.com

Разве что-то изменится вообще? Мы же поменяем лишь метод разбивки на блоки и процедуру оценки схожести блоков - схожесть будет учитывать граничные точки просто с меньшим весом (пограничные с весом 1/2, а угловые 1/4).

Да, в первом варианте с пересечением квадратных блоков, их просто станет чуть-чуть больше.

Не вижу других причин для увеличения алгоритмической сложности метода.

From:

thedeemon.livejournal.com

Да, там по-честному все итерации показаны. Джпег хорош тем, что там все локально, а тут нужен random access ко всей картинке. Когда картинка большая, а память медленная, это не очень хорошо.

С пересекающимися блоками вполне может сработать. Просто данных придется хранить больше. Как обычно - увеличение качества за счет уменьшения компрессии.

From:

sorhed.livejournal.com

Напоминает известную среди дизайнеров игру "восстанови произвольный участок картинки с помощью cloning stamp и такой-то матери" (победивший выбирает свой участок того же размера и передаёт эстафету).

From:

kosiakk.livejournal.com

Самый кайф когда блок ссылается на своё же положение в пространстве =) Увидел как минимум там где пиджак у агента K идёт под 45 градусов. Труъ-фрактал!

Этот метод, получается, даже решает проблему различных DPI у современных устройств. Красота.

From:

thedeemon.livejournal.com

Таких самоподобных блоков там на границах немало. На руке даже подряд идущие есть.

В целом метод не обрел популярности, ибо сжатие требует большого перебора, соотношение качество/размер не шибко крутое (чтобы обойти jpeg уже надо постараться), да и патенты не способствуют.

From:

kosiakk.livejournal.com

А ещё и WebP появился, где file size is 25% - 34% smaller compared to JPEG. Там тоже простенькое самоподобие внутри, но только по соседним четырём блокам. А оставшаяся разница уже кодируется всякими вейвлетами и косинусами.

Спасибо что показали этот замечательный кусочек реальности =) Пожалуй, это первое практическое применение фракталов, которое мне встретилось.

From:

xoposhiy.livejournal.com

Как это первое! А генерация правдоподобных деревьев и облаков в компьютерных играх? :)

Edited Date: 2012-12-20 02:45 pm (UTC)

From:

djonline.livejournal.com

Ещё и h265 still image появился, где до 60% лучше Jpeg.

Flat | Top-Level Comments Only

Profile

Dmitry Popov

February 2026

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Mar. 9th, 2026 07:57 am

Dmitry Popov

Фрактальное сжатие

Фрактальное сжатие

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

February 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags