Как прокачать работу с Claude в 10 раз используя метод autoresearch Андрея Карпаты

Скорее всего, ваши навыки работы с Claude дают сбой в 30% случаев, а вы этого даже не замечаете.

Я создал метод, который прокачивает любой навык на автопилоте. В этой статье я покажу, как именно запустить его самостоятельно.

Вы его запускаете, а агент тестирует и дорабатывает навык снова и снова — уже без вашего участия.

Мой навык для написания лендингов стал проходить проверку качества в 92% случаев вместо 56%. При этом ручной работы было ровно ноль.

Агент сам тестировал и докручивал промпт.

Вот этот метод и готовый навык, который можно забрать для своих задач:

P.S. Если хотите каждую неделю получать на почту новые сценарии работы с ИИ, присоединяйтесь к 34 тысячам читателей: aisolo.beehiiv.com/subscribe

Откуда это взялось

Андрей Карпаты (сооснователь OpenAI, бывший глава ИИ в Tesla и автор термина vibe coding) показал метод autoresearch.

Идея проста. Вместо того чтобы допиливать что-то руками, вы поручаете это ИИ-агенту — и он крутит задачу в цикле.

Он вносит крошечное изменение. Проверяет, стал ли результат лучше. Если да — оставляет, если нет — откатывает.

Затем делает это снова. И так раз за разом.

Карпаты использовал этот подход для кода машинного обучения. Но метод работает вообще для всего, что можно измерить и улучшить.

В том числе для навыков в Claude.

Я взял этот метод и превратил в отдельный навык, который работает в Claude Code и Cowork. И теперь просто натравливаю его на любые другие навыки в системе.

Пишу: «запусти autoresearch для моего навыка написания лендингов», и он берет всё на себя.

Как один цикл улучшает навыки

Смотрите, как это устроено.

Допустим, у вас есть рецепт. В 7 из 10 случаев блюдо выходит отличным, а в остальных трех что-то идет не так: то соус пресный, то специй не хватает.

Вместо того чтобы переписывать весь рецепт с нуля, вы меняете один ингредиент. И готовите так 10 раз.

Стало лучше? Оставляем.
Стало хуже? Возвращаем как было.

Затем меняете что-то еще. Готовите еще 10 раз. Смотрите на результат — и снова либо оставляете, либо откатываете назад.

После 50 раундов ваш рецепт идеально срабатывает уже в 9.5 из 10 случаев.

Именно это autoresearch делает с вашими навыками.

Рецепт — это промпт навыка.
Готовка — это его запуск.
Дегустация — оценка результата.

От вас требуются только критерии оценки.

Чек-лист: как объяснить агенту, что такое хорошо

Вы даете агенту простой чек-лист с описанием идеального результата. И это единственное, что вам нужно сделать.

Сам чек-лист состоит из вопросов, на которые можно ответить только да или нет.

Каждый вопрос проверяет ровно один аспект. Сдал или не сдал. Третьего не дано.

Агент оценивает каждый результат по этому списку, чтобы понять: его правки пошли на пользу или все испортили.

Это похоже на учителя, который проверяет контрольную.

Но вместо абстрактного «оцените качество текста от 1 до 10», каждый пункт — это строгое да или нет:

Сформулирован ли главный тезис? Да или нет.
Все источники указаны? Да или нет.
В тексте меньше пяти страниц? Да или нет.

По такому списку можно проверить сотню работ и каждый раз получать стабильный результат.

Здесь принцип тот же. Для навыка написания лендингов чек-лист может быть таким:

Есть ли в заголовке конкретное число или результат? (отсеивает воду вроде «Развивайте свой бизнес»)
Нет ли в тексте корпоративного сленга вроде «революционный», «синергия» или «передовой»?
Есть ли в призыве к действию конкретный глагол? (убивает слабые кнопки вроде «Узнать больше» или «Нажать сюда»)
Бьет ли первая строчка в боль клиента? (защищает от шаблонных заходов типа «В современном быстро меняющемся мире...»)
Уложился ли текст в 150 слов? (чтобы читатель не потерялся в простыне текста)

Вам даже не придется придумывать эти вопросы. При запуске autoresearch агент сам во всем поможет.

Он спросит, какого результата вы ждете, переведет ваши пожелания в формат да/нет и может даже подтянуть ваши текущие гайдлайны, если они есть.

Золотая середина — 3–6 вопросов. Если сделать больше, навык начнет подгонять результат под ответы (как школьник, который заучивает билеты, но не понимает предмет).

Как запустить процесс

Шаг 1: Скачайте навык. Забирайте его отсюда и кидайте в папку skills внутри Claude Code или Cowork.

Шаг 2: Выберите навык для прокачки. Напишите: «запусти autoresearch для навыка [название]». Берите тот, что бесит вас сильнее всего — который то выдает шедевры, то откровенный мусор.

Шаг 3: Ответьте на три вопроса агента. Что именно будем оптимизировать, какие тестовые данные взять (например, «напиши лендинг для ИИ-инструмента») и что включить в чек-лист.

Шаг 4: Агент запускает навык и выдает начальную оценку. Это точка отсчета. Мой генератор лендингов стартовал с 56%: выдавал водянистые заголовки, кашу из корпоративного сленга и вялые призывы к действию. Больше половины проверок он провалил.

Шаг 5: В браузере открывается дашборд. Там в реальном времени строится график оценок. Видно, какие вопросы из чек-листа пройдены, а какие нет. В логе сохраняются все попытки изменений, а экран обновляется каждые 10 секунд.

Шаг 6: Не мешайте. Агент уходит в цикл: анализирует ошибки, вносит микроправку в промпт и тестирует заново. Если оценка выросла — сохраняет, если упала — откатывает.

И так по кругу. Он будет работать автономно, пока вы его не прервете или пока он трижды подряд не выбьет больше 95%.

Можете залипать в дашборд или пойти пить кофе — ваше участие больше не требуется. Улучшенная версия промпта сохранится в отдельный файл, так что исходник ничего не испортит.

Что стало с моим навыком для лендингов

Я натравил autoresearch на свой промпт для лендингов, и вот к чему это привело:

Рост с 56% до 92%. Четыре раунда правок: три сохранены, одна отменена.

Вот что агент реально поменял в самом промпте:

Добавил правило для самой частой ошибки: «В заголовке должно быть число или конкретный результат. Никаких абстрактных обещаний в духе трансформируйте свой бизнес».
Собрал стоп-лист мусорных слов: «НИКОГДА не используй: революционный, передовой, синергия, новый уровень, меняющий правила игры, задействовать, раскрыть, трансформировать».
Подставил рабочий пример хорошего блока с четкой болью и призывом к действию. Теперь ИИ видит нужный формат, а не гадает.
Попытался жестче урезать лимит слов, но откатил назад: текст получился слишком куцым и пострадал CTA. (Система отлавливает такие моменты: локальное улучшение может сломать общую картину).

В итоге у меня на руках оказались:

Улучшенный навык в отдельном файле (оригинал на всякий случай остался нетронутым).
Лог результатов с оценками за каждый раунд.
Чейнджлог, где расписана каждая правка: зачем агент ее внес и сработала ли она.
Резервная копия первоначального промпта.

Чейнджлог — это вообще самая ценная штука. По сути, это подробная история того, что заходит, а что нет для конкретной задачи.

Когда выйдут новые, более умные модели, вы просто скормите им этот лог, и они продолжат ровно с того места, где остановился прошлый агент.

Это применимо не только к промптам

Подход сработает с чем угодно, лишь бы это можно было измерить.

Скорость сайта. Один парень применил метод для оптимизации времени загрузки. Менял одну настройку, замерял скорость, оставлял или откатывал. За 67 раундов он ускорил загрузку с 1100 мс до 67 мс.
Холодные письма. Собираете чек-лист: «Упоминается ли компания клиента? Уложились ли в 75 слов? Есть ли в конце понятный вопрос?». Дальше агент сам генерирует 50 вариантов.
Вступления для рассылок. «Есть ли в подводке личная история? Нет ли заезженных фраз?». Оставьте агента докручивать тексты на автопилоте.
Вообще любой промпт, которым вы пользуетесь постоянно.

Если результат можно измерить — значит, можно запустить autoresearch.

Берите и пробуйте

Возьмите свой самый кривой промпт и запустите скрипт. А сами идите заниматься нормальными делами.

Скачать навык можно на Dropbox Или забрать с моего GitHub вот здесь

P.S. Если хотите получать больше подобных ИИ-сценариев, которые экономят время, приносят клиентов и избавляют от рутины — я делюсь ими бесплатно каждую неделю с 34 тысячами читателей.