В 2019 году мы опубликовали инструкцию о том, как вручную восстановить удаленное видео с YouTube через Wayback Machine. Это была последовательность шагов: скопировать ID видео, подставить его в специальный URL, перейти по ссылке и надеяться, что Archive.org успел сохранить файл. Процесс работал, но требовал знания внутренних механизмов веб-архивов и не масштабировался. Найти все удаленные видео канала таким способом было невозможно.
Сегодня мы запускаем Archivarix Tube Search - полноценную поисковую систему, которая автоматизирует и расширяет этот процесс до масштаба в более чем полтора миллиарда видеозаписей.
Tube Search - это поисковый движок по архивным данным YouTube. Сервис агрегирует информацию из нескольких публичных источников: Wayback Machine (Internet Archive), Common Crawl и различных собранных датасетов метаданных YouTube. Когда видео удаляется с YouTube, его страница перестает существовать. Но если до удаления эту страницу успел проиндексировать один из веб-архивов, метаданные видео сохраняются: название, описание, дата загрузки, количество просмотров, превью-изображения, субтитры.
Tube Search находит эти архивные копии и делает их доступными через единый поисковый интерфейс.
Поиск по каналу. Введите URL канала, @handle или Channel ID - система покажет все известные видео этого канала, включая удаленные. Поддерживаются устаревшие форматы URL: /user/, /c/, /channel/, /profile?user=. Это работает даже для полностью заблокированных каналов.
Поиск по видео. Укажите URL конкретного видео или его 11-символьный ID. Система проверит все доступные архивы и соберет максимум сохранившейся информации.
Полнотекстовый поиск. Ищите по ключевым словам в названиях и описаниях видео. Полезно, когда вы помните содержание видео, но не помните канал или точное название.
Субтитры. Доступ к архивным субтитрам на более чем 240 языках. Можно скачать субтитры поштучно в формате SRT или пакетно в ZIP-архиве. Для видео, которые ещё доступны на YouTube, поддерживается получение актуальных субтитров.
Видеофайлы. Wayback Machine иногда сохраняет сами видеофайлы. Tube Search автоматически проверяет наличие архивных копий и показывает ссылку для просмотра или скачивания.
Поисковый конвейер Tube Search состоит из 15 этапов. При поиске по каналу система параллельно опрашивает CDX API Wayback Machine, индекс Common Crawl и локальную базу метаданных. Результаты стримятся в реальном времени через Server-Sent Events - вы видите найденные видео по мере их обнаружения, не дожидаясь завершения полного сканирования.
На каждом этапе происходит обогащение данных: проверка статуса видео на YouTube (живое или удаленное), поиск превью-изображений, проверка наличия видеофайлов в архиве, извлечение субтитров. Весь процесс занимает от нескольких секунд до 10 минут в зависимости от размера канала.
Сервис будет полезен исследователям, журналистам и всем, кто работает с историческим контентом YouTube. Типичные сценарии:
Tube Search можно использовать бесплатно без регистрации. Бесплатная регистрация увеличивает лимиты и открывает дополнительные возможности: скачивание субтитров и историю поисков.
Тарифы Plus и MCP+API с расширенными лимитами (экспорт в CSV, пакетная загрузка субтитров, REST API и MCP-сервер для AI-ассистентов) появятся в ближайшее время.
Интерфейс доступен на пяти языках: английский, русский, испанский, немецкий и португальский. Для каждого языка подготовлены руководства с пошаговыми инструкциями и скриншотами.
Попробуйте: tube.archivarix.net
Использование материалов статьи разрешается только при условии размещения ссылки на источник: https://archivarix.com/ru/blog/tube-search/
Tube Search - это поисковый движок по архивным данным YouTube. Сервис агрегирует информацию из нескольких публичных источников: Wayback Machine (Internet Archive), Common Crawl и различных собранных д…
Со временем внешние ссылки в записях Wordpress неизбежно ломаются, страницы удаляются, домены истекают, видео становятся недоступными. Проверять сотни или тысячи ссылок вручную непрактично. Archivarix…
Триллион сохранённых страниц. Более 99 петабайт данных. Сотни краулов, работающих каждый день одновременно. За этими цифрами стоит вопрос, который задаёт себе каждый, кто профессионально работает с ве…
Покупка истёкшего домена с историей это один из самых эффективных способов запустить новый проект с уже существующим ссылочным профилем, трастом и даже трафиком. Вместо того чтобы продвигать голый дом…
Когда речь заходит о восстановлении сайтов из архивов, почти все думают только о Wayback Machine. Это понятно: archive.org на слуху, у него удобный интерфейс, триллион сохранённых страниц. Но Wayback …
Мы выпустили браузерное расширение Archivarix Cache Viewer. Оно доступно сразу для трёх браузеров: Chrome, Edge и Firefox. Расширение бесплатное и без какой-либо рекламы.
Суть простая: быстрый доступ…
Когда вы восстанавливаете сайт из Web Archive, вы ожидаете получить оригинальный контент, который когда-то был написан живыми людьми. Но если архивы сайта были сделаны после 2023 года, есть реальный ш…
В октябре 2025 года Wayback Machine достиг отметки в один триллион сохранённых веб-страниц. Более 100 000 терабайт данных. Это огромное достижение для некоммерческой организации, которая работает с 19…
Мы рады представить версию 2.0 нашего WordPress плагина для импорта внешних изображений. Это не просто обновление, плагин полностью переписан с нуля с учётом современных требований и отзывов пользоват…
Дорогие друзья!
Black Friday и Cyber Monday - лучшее время для экономии на будущих восстановлении сайтов.
Если вы планируете восстанавливать сайты, пополнить баланс заранее или просто хотите получит…