TinEye - TinEye

TinEye
Tineye Logo.svg
Тип сайта
Поисковая машина изображений
Доступно в многоязычный
Владелец Idée, Inc.
URL tineye .com
Коммерческий да
Регистрация Необязательный
Запущен 6 мая 2008 г . ; 12 лет назад  ( 2008-05-06 )
Текущий статус Активный

TinEye - это система поиска обратных изображений, разработанная и предлагаемая компанией Idée, Inc., базирующейся в Торонто, Онтарио , Канада. Это первая поисковая система изображений в Интернете, которая использует технологию идентификации изображений, а не ключевые слова, метаданные или водяные знаки . TinEye позволяет пользователям выполнять поиск не по ключевым словам, а по изображениям. При отправке изображения TinEye создает «уникальную и компактную цифровую подпись или отпечаток пальца» изображения и сопоставляет его с другими проиндексированными изображениями. Эта процедура может сопоставить даже сильно отредактированные версии отправленного изображения, но обычно не возвращает похожие изображения в результатах.

История

Idée, Inc. была основана Лейлой Буйнан и Полом Блуром в 1999 году. Idée запустила сервис 6 мая 2008 года и в августе того же года перешла в режим открытого бета-тестирования. Хотя исследовательские проекты по компьютерному зрению и идентификации изображений начались еще в 1980-х годах, компания утверждает, что TinEye - это первая веб-система поиска изображений, использующая технологию идентификации изображений. Служба была создана с владельцами авторских прав и торговыми марками в качестве предполагаемой базы пользователей для поиска несанкционированного использования и отслеживания, где соответственно появляются бренды.

В июне 2014 года TinEye заявила, что для сравнения проиндексировала более пяти миллиардов изображений. Однако это относительно небольшая часть от общего числа изображений, доступных во всемирной паутине .

По состоянию на сентябрь 2020 года результаты поиска TinEye утверждают, что для сравнения проиндексировано более 41,9 миллиарда изображений.

Технологии

Пользователь загружает изображение в поисковую систему (размер загрузки ограничен 20 МБ) или предоставляет URL-адрес изображения или страницы, содержащей изображение. Поисковая система будет искать другие варианты использования изображения в Интернете , включая измененные изображения на основе этого изображения, и сообщать дату и время их публикации. TinEye не распознает очертания объектов и не распознает лица , но распознает все изображение целиком и некоторые измененные версии этого изображения. Сюда входят уменьшенные, большие и обрезанные версии изображения. TinEye доказал, что способен извлекать из своей базы данных разные изображения одного и того же объекта, например, известных достопримечательностей.

TinEye может искать изображения в формате JPEG , GIF или PNG . С 2009 года другие форматы, содержащие изображения в Интернете, такие как Adobe Flash , недоступны для поиска.

Результаты, полученные с помощью TinEye, включают в себя общее количество совпадений в их базе данных, сгенерированных отправленным изображением, изображение предварительного просмотра и URL-адрес каждого совпадения, а также функцию, называемую Сравнить изображения. Сравнение изображений предоставляет окно, в котором пользователь может переключаться между исходным изображением и результатом поиска. TinEye может сортировать результаты по наилучшему, худшему, самому большому или самому маленькому изображению.

Регистрация пользователя не является обязательной и позволяет хранить предыдущие запросы пользователя. Другие функции включают встраиваемые виджеты и букмарклеты . TinEye также выпустила свой коммерческий API.

Алгоритм

Хотя TinEye не раскрывает точные используемые алгоритмы, существуют методы, похожие на описание того, как это работает компания, которые достигают той же цели сопоставления изображений. Одним из таких алгоритмов является перцептивное хеширование, которое используется для создания хеш-значения из образца изображения. Вот пример базового алгоритма среднего хеширования, который похож на перцепционный хеш, но проще, чем перцептивный хеш, написанный доктором Нилом Кравец:

  1. Уменьшить размер На изображениях высокие частоты дают детализацию, а низкие - структуру; мы хотим последнего. Самый быстрый способ убрать высокие частоты и детали - уменьшить изображение. В этом случае уменьшите его до 8x8, чтобы всего было 64 пикселя. Не беспокойтесь о соотношении сторон, просто сократите его до квадрата 8x8. Таким образом, хеш будет соответствовать любому варианту изображения, независимо от масштаба или соотношения сторон.
  2. Уменьшить цвет Вычислить среднее значение для 64 цветов.
  3. Усреднение цветов Чтобы получить самые низкие частоты в изображении, возьмите только меньшую часть уже уменьшенного изображения. Например, если DCT ( дискретное косинусное преобразование , преобразование, связанное с Фурье) имеет размер 32x32, просто оставьте верхний левый угол 8x8.
  4. От байтов к битам Каждый бит просто устанавливается в зависимости от того, находится ли значение цвета выше или ниже среднего.
  5. Построение хэша. Установите 64-битное целое число. Порядок не имеет значения, если вы последовательны. Ваш конечный результат будет выглядеть примерно так: 8f373714acfcf4d0

Результирующий хеш не изменится, если изображение будет масштабировано или изменится соотношение сторон. Увеличение или уменьшение яркости или контрастности, или даже изменение цветов не сильно изменит значение хеш-функции.

Чтобы сравнить два изображения, создайте хэш из каждого изображения и подсчитайте количество различающихся битовых позиций. Это расстояние Хэмминга . Нулевое расстояние указывает на то, что это, вероятно, очень похожее изображение или его вариант. Расстояние 5 означает, что некоторые вещи могут отличаться, но они, вероятно, все еще достаточно близки, чтобы быть похожими. Расстояние 10 или более является вероятным признаком того, что изображения разные.

Применение

Способность TinEye искать в Интернете определенные изображения (и модификации этих изображений) делает его потенциальным инструментом для владельцев авторских прав на визуальные произведения, позволяющего обнаружить нарушения их авторских прав. Это также дает возможность людям, которые хотят использовать изображения из бесхозных произведений, найти правообладателей на эти изображения. Поскольку бесхозные работы могут быть определены как «произведения, защищенные авторским правом, чьи владельцы трудно или невозможно идентифицировать и / или найти», использование TinEye потенциально может удалить статус сиротских работ из онлайн-изображений, которые можно найти в его базе данных.

Смотрите также

Рекомендации

внешние ссылки