Новость

Стандарты Chainalysis для ончейн-аналитики: как формализовать кластеризацию кошельков

У Chainalysis пытаются формализовать самый скользкий участок on-chain-аналитики: переход от адресов к «субъектам».

Стандарты Chainalysis для ончейн-аналитики: как формализовать кластеризацию кошельков

Кластер больше не должен быть черным ящиком

Ключевая проблема, которую Chainalysis выносит наружу, банальна и неприятна: термин «кластер» в блокчейн-аналитике не имеет универсального значения. Один инструмент может считать связанными адреса по одному набору эвристик, другой — по другому. На выходе оба покажут аккуратный граф, но доказательная нагрузка у этих графов будет разной.

По информации CoinDesk, онтология Chainalysis начинается с разбиения этой конструкции на более мелкие элементы. В документе упоминаются сегменты кошельков, которые могут использоваться как депозитные адреса, адреса остатков или выполнять другие функции. Это правильное направление: сначала описать структурные элементы графа, потом уже говорить об атрибуции.

В нормальной инженерной модели вопрос должен звучать не «какой адрес принадлежит кому», а жестче: какие именно данные связывают эти адреса, какая эвристика применена, где граница уверенности и какой оверхед ошибки. Без этого «кластер» остается маркетинговым объектом в UI, а не артефактом, пригодным для аудита.

Два слоя: граф и уверенность

Главная техническая часть предложения — двухуровневая структура атрибуции. Первый уровень, согласно описанию CoinDesk, определяет структурный граф. Второй оценивает степень уверенности анализа в этом графе. Это минимально необходимая декомпозиция, если аналитический вывод предполагается использовать не только для внутреннего risk scoring, но и в расследовании.

Главный научный сотрудник Chainalysis Якоб Иллюм объяснил CoinDesk, что цель онтологии — задать стандарты для блокчейн-аналитики и показать следователям или прокурорам, что именно подтверждается данными. Формулировка здравая. Не «мы нашли преступника по блокчейну», а «вот что можно вывести из имеющихся данных, и вот почему».

Для разработчиков compliance-инфраструктуры и команд, которые строят собственные AML-модули, практический вывод простой: придется документировать не только результат, но и путь к нему. Какая эвристика сработала. Какие адреса были объединены. Почему предполагается общий контроль. Где уверенность высокая, а где граф держится на мягком предположении. Иначе любой красивый дашборд разваливается при первом серьезном cross-examination.

Судебный контекст и слабое место стандарта

Chainalysis, по данным CoinDesk, опирается в том числе на опыт дела Министерства юстиции США против Романа Стерлингова, сооснователя Bitcoin Fog, осужденного по обвинениям в отмывании денег в 2024 году. В ходе процесса суд проводил слушание Дауберта, чтобы определить, достаточно ли строг инструмент Reactor для использования обвинением. Судья Рэндольф Мосс в итоге указал, что существенные доказательства подтверждают утверждение правительства о высокой надежности этого ПО.

Это важный прецедент для самой Chainalysis, но не автоматическая валидация всей отрасли. Судебная проверка одного инструмента в конкретном деле не превращает любую кластеризацию в стандарт. Поэтому интересна не победная риторика, а попытка описать методологию так, чтобы ее можно было обсуждать, сравнивать и ломать.

При этом у предложения есть очевидная недоработка: Иллюм сказал CoinDesk, что публикация нужна, чтобы «начать разговор» с более широкой криптоиндустрией, но активного сбора отзывов пока не было, кроме первоначальных обсуждений с правоохранительными органами. Для стандарта этого мало. Стандарт, который пишется в основном поставщиком аналитического ПО и силовым контуром, рискует стать спецификацией удобства обвинения, а не нейтральной моделью данных.

Вердикт сухой: сама идея онтологии полезна. Она заставляет отделить адрес, кошелек, кластер, атрибуцию и confidence score — то есть заменить туманную «аналитику блокчейна» проверяемой архитектурой вывода. Но до отраслевого стандарта здесь еще нужен публичный разбор эвристик, независимые бенчмарки и понятная процедура оспаривания кластеров. Без этого это не стандарт, а хорошо оформленный internal model от крупного вендора.