Кто как пилит свой личный telegram-агрегатор-дистиллятор?
У меня уже давно зудит тема с тем, чтобы навайбкодить очередной велосипед (для обмана FOMO), который бы помог не пропустить че-нидь важное среди миллионов тг-чатов и тг-каналов (вот прям как Глеб писал тут).
От корки до корки успеваю читать пару избранных каналов и пролистывать их чаты. А остальные несколько десятков кружочков с непрочитанными - давят)) иногда устраиваю туда заплыв "голым мозгом" (бегло листаю рандомный канал из папки каналов с ИИ) и всегда нахожу для себя что-то полезное - поэтому FOMO не дает отписаться)) еще забавное наблюдение: видишь в превьюшке последнего поста в канале интересную тему, но не заходишь, потому что боишься сбросить счетчик непрочитанных сообщений в этом канале.
Философски решил относиться к этому так: я один фиг не прочитаю это всё никогда, но если с помощью своего велосипеда хотя бы иногда среди этого моря каналов и чатов буду находить что-то полезное, не тратя время специально (кроме времени на разработку) - то хорошо.
А с точки зрения траты личных ресурсов на очередной нужный только мне велосипед - отношусь ровно как пишет Валерий Ковальский:
> "Когда спрашивают с чего начать в AI кодинге, я отвечаю, придумайте пэт проект который будете разрабатывать сами и использовать ежедневно. Это единственный способ набить тесты и понять где аппка ломается"
Последнее время все чаще натыкаюсь на ребят, которые сделали/делают свой собственный телеграм-дистяллятор:
- https://tgdistill.space/ от https://t.me/nlp_daily/183
- Павел Злой делает https://t.me/evilfreelancer/1540, https://t.me/evilfreelancer/1538
- Валерий Ковальский https://t.me/neuraldeep/1895
- более простой вариант от https://t.me/oestick/344
Неспешно экспериментирую, подбираю LLM, чтобы и результат был приемлемый и экономика не кусалась. На удивление Gemma 3 27b с SGR при цене облачного инференса в три копейки (буквально три копейки, иногда меньше) очень неплохо делает саммаризации и классификации тредов в чатах (ищу чтобы было прям максимально дешево и при этом не крутить локально)
Идей приходит в голову - куча (по большей части хотелок не задавайте вопросов о прагматизме и для чего мне это нужно - просто интересно поиграться):
- сохранять заметку о том, почему заинтересовался каналом, откуда о нем узнал (иногда в ленте встречаются каналы, к которым не привык и приходтся долго вспоминать кто это и зачем я вообще на него подписан)
- как-нибудь прикрутить темпоральные графы
- кластеризировать каналы по "тусовкам" (кто у кого пишет в комментах, репостит и пр оповещения о появлении новых постов по конкретным интересующим темам (начать с ключевых слов)
- доменная адаптация (кроме ИИ вайбкодинга читаю еще другие каналы)
- ранжировать выше комменты от людей, мнение которых мне интересно
- и пр (бесконечный список из заметок)
Если вы тоже делаете или уже сделали свой велосипед - поделитесь опытом:
- как парсите, где берете аккаунты (или если парсите своим основным, то почему не боитесь?)
- на какие грабли с парсингом?
- находили ли какие-то готовые опенсорсные модули для сбора данных?
- вообще любыми клевыми находками и идеями
Комментарии (11)
@VaKovaLskii по-моему это по твою душу вопросы :)
Сказал своему openClaw чтобы он собирал со всех каналов посты за неделю, делал вижимку в одно предложение и почтил мое в отдельную группу эти предложения в варик ссылок на исходник. Когда время есть захожу полистать
Править нельзя сообщения) да и ладно, как же их тогда отправлять в телегу исправленными. Может прикрутить таймер на 5 минут отложенной отправки..
Ммм спасибо что подсветил, что-то я не подумал. Сделаю чтобы можно было исправлять.
Войдите, чтобы комментировать