Имя: Пароль:
IT
 
Не могу понять как они распознают картинки в этом сервисе
0 Еврейчик
 
15.04.12
13:35
Есть такой сервис. Туда выкладываешь картинку, выкачанную из интернета и сайт тебе выдает кучу ссылок где находится в сети эта картинка. При том картинка может иметь другой размер и даже отличаться от оригинала чудчуть (случаи фотошопа). Я не могу понять как они это делают. Ведь невозможно распознавать образ за такое короткое время. там за считанную долю секунды обрабатываются миллионы фотографий.
а собственно сайт вот он: http://www.tineye.com/
особенно хорошо находит картинки англоязычных сайтов.
1 HeroShima
 
15.04.12
13:37
"Ведь невозможно распознавать образ за такое короткое время. там за считанную долю секунды обрабатываются миллионы фотографий."
возможно. выделяются признаки, сохраняются и сравнение в базе идёт уже по ним.
2 Нуф-Нуф
 
15.04.12
13:37
пора тебе уже понять что твой мозг просто не способен понять такое, что легко понимают другие понимающие люди
3 Terve-R-
 
15.04.12
13:41
(0) тебя послушать, так и обычные поисковики существовать не могут - тоже миллионы сайтов обрабатывают за долю секунды
4 miki
 
15.04.12
13:42
«Выглядит похоже». Как работает перцептивный хэш.
"
За последние несколько месяцев несколько человек спросили меня, как работает TinEye и как в принципе работает поиск похожих картинок.
"

http://habrahabr.ru/post/120562/
5 toypaul
 
гуру
15.04.12
13:46
если на сайте есть база картинок (что скорее всего), то не мудрено. достаточно мощного сервака и правильного алгоритма. конечно же картинки не сравниваются целиком. сравниваются их представления.
6 toypaul
 
гуру
15.04.12
13:49
(4) интересная статья :)
7 Jump
 
15.04.12
13:52
(0)Ты шутишь - "там за считанную долю секунды обрабатываются миллионы фотографий" ?
Или совсем не разбираешься в IT ?
Как из миллиона записей в информационной базе выбирается одна за долю секунды, если чтение с диска всей базы займет более минуты не знаешь?
Про индексацию и поиск по индексу слышал?
8 miki
 
15.04.12
13:53
(6)на ещё:
http://phash.org/
9 Jump
 
15.04.12
13:59
Обычный поисковый  робот-индексатор бегает по интернету, ищет картинки, найденные хеширует, и записывает в базу данных хэш и адрес хешированной картинки. Хэш это число, поэтому база данных упорядочивается допустим по возрастанию числового значения хэша.
Когда ты загружаешь свою картинку она хешируется и получившийся хеш ищется в базе данных. Т.е все сводится к поиску числа в упорядоченном списке чисел. Если совпадение находится то тебе выдают ссылку.
10 Еврейчик
 
15.04.12
14:00
(6)ты сейчас чтото умное попытался сказать? у тебя не получилось. наоборот, ты себя своей недалекостью опустил, показав, что не понял, что я имел ввиду. Конечно же не через интернет он ищет. и ясно дело что база картинок у него проиндексировано. Но как он запрос к базе делает? по каким критериям? Если размер и названия файла совсем иное!
11 Еврейчик
 
15.04.12
14:01
(9)ну я тоже так подумал. просто удивительно что иногда находит совсем отличающиеся фотки. напрмер Источник - фото актера. Результат в выдече - демотиватор, где слева это фото а справа другая картинка. как он это определил.
12 Еврейчик
 
15.04.12
14:02
(6) ссори. (6) = (7)
13 opty
 
15.04.12
14:05
(9) Ну там не совсем хеш , в общеупотребительном смысле , но типа того , цифровой код строится анализу картинки , и поиску ключевых элементов картинки .
Собственно анализ картинки и есть но-хау сервиса
14 opty
 
15.04.12
14:08
Image Comparer для локальной работы с огромными базами фото по такому же принципу работает , результаты впечатляют
15 Terve-R-
 
15.04.12
14:08
16 Jump
 
15.04.12
14:11
(11),(13) В (9) я описал предельно упрощенный алгоритм работы.
В реале конечно же используются более сложные методики.
Например картинка анализируется например на наличие человеческого лица (есть куча алгоритмов которые позволяют это делать) и хешируют не только картинку, но и отдельно область с лицом, хеш скорее всего не один а несколько, сделанных по разным алгоритмам.
17 opty
 
15.04.12
14:14
(16) Угу
В общем самое сложное получить числовой код :) Остальное элементарно , собственно база сервиса это таблицы кодов и ссылок , ну и маленьких фоток для предпросмотра
18 Противный
 
16.04.12
01:43
http://antidupl.narod.ru/russian/index.html

17.10.2003 - Версия 1.15

   Первая версия для публичного использования.
....
=================================
почти десять лет назад написана прога...
19 jsmith
 
16.04.12
02:10
протестировал. гугл круче