БЛОГФорумСсылки Написать письмоПочему Арбуз? Служебная UN ЕЖЕ-движение - международный союз интернет-деятелей

Сетевая жизнь картинок

Самой сложной задачей в общении с компьютером остается поиск информации, точнее, файла, по его содержанию. И если поиск текстового файла по содержащемуся в нем фрагменту текста - дело привычное, то поиск картинки с нужным изображением, или музыкального произведения по его фрагменту пока относим к области фантастики. К появлению того самого Искусственного Интеллекта, который "просмотрит" все картинки и выберет для нас с изображением, например, арбуза. Как ИИ отличит арбуз от полосатого мяча, а арбузный ломтик от ломтика дыни? Пока не известно, ведь даже умнейший из умных естественный интеллект не в силах объяснить, как мы различаем кошек и собак.

Вообще задача распознавания образов - одна из самых главных в программировании и здесь много наработок. Например, две перспективные задачи - первая - автоматизация проверки анализов крови под микроскопом. Пока что только человек может отличить здоровые клетки от больных и проверка большого количества пациентов требует квалифицированного персонала и растягивается на длительное время. Вторая задача - при просмотре видеозаписи движения через перекресток определить - проезжала ли здесь вишневая Нексия? Сможет ли робот определить марку машины и прочесть ее номер? Не секрет, что основными заказчиками программ распознавания образов были военные - это им надо было автоматически расшифровывать изображения, передаваемые спутниками-шпионами. Насколько удачно решена задача распознавания образов можно судить по неплохой работе известной программы перевода отсканированного в виде картинки текста в текстовый файл Fine Reader российской фирмы ABBY.

А как же быть с поиском картинок в Интернете? Поможет ли нам в этом пресловутый ИИ, присутствие которого мы ежедневно ощущаем? Поиск необходимой информации или сайта в Сети осуществляется с помощью поисковых машин и каталогов. Поисковые машины ищут на страницах Сети заданные вами слова ("ключевые"), в то время как каталоги представляют набор отсортированных ссылок с описаниями сайтов. Можно, конечно, для поиска картинок воспользоваться каталогом - зайти в раздел по нужной тематике и бродить по его ссылкам в надежде встретить нужное изображение. Удача может улыбнуться сразу, если на первых же просмотренных страницах отыщется искомое. Но можно потратить целый день и не найти ничего путного.

Есть и другой, более надежный способ. Ведь существуют специальные поисковые серверы для изображений. Они отбирают изображения по названию файла, по тому тексту, который прописан у них в свойстве alt и по другим параметрам. Напомню, что тег <img> языка html может содержать атрибут alt, в котором записывается информация о картинке. Наличие alt считается хорошим тоном и непременно должно присутствовать на профессиональных и просто хорошо сделанных сайтах. Во-первых, эта информация отображается вместо рисунка у пользователей, работающих с отключенной в браузере графикой, а таких пользователей, по некоторым источникам, от 6% до 10%. Во-вторых, информация alt используется в альтернативных браузерах - например, при прочтении содержания страницы голосом для пользователей с ограниченными возможностями. Во всех учебниках по Веб-дизайну подчеркивается необходимость задания alt, а визуальные редакторы вроде FrontPage вставляют его автоматически.

Итак, один из таких поисковиков, работающих с "альтами", расположен по адресу http://www.picsearch.com/. Это удобный в использовании сервис с простым интерфейсом, практически без рекламы, с возможностью фильтрации результатов запроса по различным параметрам, быстро работающий. Единственным недостатком можно назвать его англоязычность, впрочем, опций не так уж много и содержат они слова большинству юзеров знакомые со школы. Гораздо более серьезным недостатком является именно "неинтеллектуальность" сервиса, его конкретность, переходящая в аскетизм. Процесс поиска с помощью таких систем очень прост: вводится поисковая фраза, и задается количество рисунков, выводимых на одной странице. Вместе с пропорционально уменьшенными изображениями выводится информация о конкретном графическом файле. Для демонстрации работы зададим, например, слово "arbuz" и увидим в результате поиска всего 3 картинки, одна из которых - пес по кличке Арбуз, а из двух оставшихся одна является уменьшенной иконкой - ссылкой на вторую. Прямо скажем - не густо, дело в том, что сервис настроен на англоязычные сайты, а там слово arbuz редкость. Поэтому пробуем задать "water-melon" (арбуз по английски), и вытаскиваем улов побогаче - аж 119 картинок. И что самое обидное, что на большинстве картинок и намека нет на искомый бахчевый плод - просто в атрибте alt присутствует заданное для поиска слово. Дальше уже надо ручками (точнее глазками) просмотреть найденные картинки и отобрать подходящие. А если в alt не содержится нужного слова, а на картинке есть нужное изображение? К сожалению, мы такую картинку этим (кстати, очень быстро работающим) поисковиком не найдем.

И тут естественное желание обратиться к известной рунетовской поисковой четверке - Яндекс, Гугль, Апорт, Рамблер и, с октября 2003 года, Мейл-ру. Рассмотрим ее поподробнее. Гугль условно отнесем к рунетовским поисковикам после появления весной 2002 года http://google.ru. Однако русский Гугль не является филиалом Гугля - это самостоятельный сервис статистики и рейтинга по каталогам TopCto, использующий поисковый скрипт от Гугля для поиска в Рунете. Была даже информация, что Гугль настоящий подавал в суд на Русский Гугль за использование товарного знака, но дело пока не закончено. Так вот - русский Гугль картинки не ищет, для этого надо зайти на http://google.com и после задания ключевого слова указать, что искать нужно именно картинки. За одну секунду Гугль нашел 182 картинки по запросу "арбуз"!

Мощнейшим поисковиком картинок является Яндекс. На момент запуска проекта Яндекс-картинки летом 2002 года им было проиндексировано 12 миллионов картинок и цифра эта все время растет. По некоторым данным Яндекс ищет лучше Гугля, но только в Рунете. Как видно на скриншоте по запросу "арбуз" Яндекс нашел 833 картинки!

Самый молодой в этой обойме - поиск картинок на Мейл-ру. Открыт в октябре 2003 года, о чем было торжественно извещено на всех новостных сайтах. Вот цитата из релиза: "Картинки@Mail.ru - это сервис, осуществляющий поиск графических файлов не только на отечественных серверах, но и на сайтах всего остального мира. Система индексирует картинки стандартных графических форматов (jpeg, gif и png) во всем Интернете. В базе данных Картинки@Mail.ru содержится 425 миллионов изображений. Доступ к сервису включен в форму поиска, расположенную на главной странице портала @Mail.ru. За неделю тестовой работы Картинки@Mail.ru сервисом уже воспользовалось около 50 тыс. уникальных пользователей" На скриншоте видно, что по запросу "арбуз" найдено 182 картинки.

Перечисленные сервисы поиска картинок содержат скрипт, формирующий маленькое изображение с сопроводительной информацией о картинке. В отличие от них Апорт http://aport.ru результаты поиска картинок выдает только в виде ссылок на них без предварительного просмотра. Результат появляется очень быстро… но без картинок. Зато результаты впечатляющие - по запросу "арбуз" найдено 2141 картинка на 833 сайтах.

На Рамблере возможен поиск картинок только по протоколу FTP ftp.rambler.ru, но все попытки поискать "арбузные" картинки успехом не увенчались. Все рассмотренные поисковики (кроме Рамблера) имеют возможность поиска картинок по схожим алгоритмам и результаты их работы практически совпадают. Можно найти в прессе самые разные высказывания о результативности этих искалок, но поверить в них непросто, для этого надо провести серьезное тестирование, набрать и обработать статистику, для наших пользовательских потребностей разница в поиске практически неуловима. Поисковики эти - ветераны Интернета, но сама возможность поиска картинок сравнительно молода - три-четыре года назад такой возможности не было. На всех четырех поисковиках рядом с окном ввода запрашиваемого слова есть опция выбора зоны поиска - в каталоге, в интернете и среди изображений. И результаты поиска выходят в похожем виде (кроме Апорта) - уменьшенная картинка найденного изображения с его атрибутами (габариты, размер, формат - jpg, gif, png или bmp - тоже есть!) и с ссылкой на расположение картинки.

Самой же главной для нас и приятной особенностью этих поисковиков является заложенный в них "интеллектуальный" алгоритм поиска, причем, у каждого поисковика свой. Подробности алгоритмов держатся разработчиками в тайне, но мы сами заметим, что ищется картинка не только по наличию ключевого слова в атрибуте alt, но и в имени файла, в заголовках и в ближайшем к картинке тексте. Кроме того учтена транслитерация и перевод на другие (во всяком случае на английский) языки. То есть, если вы зададите поиск слова "арбуз", то найдутся также картинки по словам "arbuz" и "melon", причем в разных вариантах словообразования. С таким всеохватным алгоритмом нужно очень постараться, чтобы не выловить картинку с нужным изображением. Для этого надо умудриться, чтобы на странице с изображением арбуза ни разу не встретилось упоминание о нем ни в тексте, ни в заголовках, ни в списках ключевых слов, ни во вспомогательных атрибутах, ни, наконец, в именах файлов картинок и html-страниц. Учитывая, что страниц десятки миллионов, можно предположить, что любая наперед заданная самая невероятная ситуация где-то реализована, но ее роль в результате наших поисков, когда нам будут предложены сотни и тысячи найденных картинок, ничтожно мала. Поэтому результатам поиска можно доверять - вряд ли мы что-то стоящее пропустим.

Еще в Рунете заявлена открывшаяся не так давно новая система Metafora.ru - она осуществляет поиск по изображениям, рисункам и фотографиям. Система позволяет производить поиск графических файлов по заданному запросу как на русском, так и на английском языке. Во время написания статьи добиться результата от Метафоры не получилось. Есть поиск картинок и на Лайкосе http://lycos.ru  - но результат поиска по слову arbuz точно совпадает с результатом работы пиксерч-ком, рассмотренного первым. Однако, если мы перейдем на "настоящий" лайкос http://lycos.com  и дадим запрос картинок по слову melon, то получим результат из 22 125 найденных картинок!

Таким образом мы постепенно от рунетовских искалок перешли к "импортным". В первую очередь можно обратиться, например, к сервису http://Alltheweb.com - по запросу arbuz найдено 127 картинок, да каких - все именно с изображением арбуза!

Прекрасно ищет также известная Альтависта Http://altavista.com - на тот же самый запрос найдено 423 картинки! Список основных ресурсов Интернета, производящих поиск бесплатной графики либо дающие доступ к своим архивам изображений, можно увидеть по этому адресу: demiart.ru/search_images.shtml. Здесь же находится небольшая коллекция ссылок на некоторые хорошие архивы бесплатной графики, поисковики и каталоги графики, фотографий, картин, анимаций и тому подобных вещей. Ditto visual search engine - довольно неплохой поисковик изображений, но база поиска значительно меньше, чем у вышеупомянутых. GoGraph graphics search - использует поиск, ориентированный на свой каталог изображений (некоторые из них, в частности, в большом разрешении, будут доступны только за деньги). Technology & Computers Search Portal - база ссылок на различные сайты, хранящие всевозможную тематическую графику.

И все же следует отметить, что самым профессиональным поиском фотографий в Интернете является поиск в онлайн-фотобанках. Правда, в большинстве своем, такой поиск требует денежных затрат, поскольку ни один солидный фотобанк не предоставляет услуги бесплатно. Однако в виде preview некоторые банки предоставляют изображения хорошего качества, в чем можно убедиться на одном из них - creative.gettyimages.com. Если вас интересуют дополнительные адреса профессиональных банков изображений и все, что с ними связано - зайдите на форум http://www.all-win.ru/forum/topic1354.html

Хорошим вариантом также будет обращение к Промо http://promo.by/useit/image_search_engines.html - здесь сконцентрированы лучшие поисковики картинок. Если точно известно имя файла с искомым изображением, для его автоматического поиска и закачки на диск можно с успехом воспользоваться менеджером ReGet Deluxe. Более того, эта программа поддерживает поиск файлов по маске. Например, хочется найти картинки с изображениями злобных вирусов - вводим в поле запроса имя файла в виде: virus*.jpg - ReGet будет искать все файлы формата jpg, содержащие в имени virus, и складывать их на диск в указанную в настройках программы папку. Если в поле запроса просто ввести virus, программа будет скачивать из Интернета все подряд, независимо от формата. Недостатком такого использования ReGet является то, что невозможно увидеть заранее, что именно программа нашла и собирается сохранять на диск. К тому же, для поиска ReGet использует ограниченный набор поисковиков, причем не специализующихся на поиске изображений - FileMirrors, Rambler, LapLink, FileSeach.ru, SunSite. Гораздо лучше справляются с этой задачей программы, специально созданные для поиска картинок в Интернете. Одной из них является мета-поисковая система Meta Image Search ( http://www.searchutilities.com/mis/), которая ищет картинки в Сети очень быстро и, что самое главное, успешно. Результаты поиска выводятся в удобном виде и могут быть сохранены для дальнейшего использования. С этой программой экономится масса времени - не нужно заходить на каждый поисковый сервер, вводить ключевые слова, ожидать загрузки каждой страницы с результатами поиска, а потом еще и сохранять на диск изображения. Не нужно открывать и веб-страницы, где находятся оригиналы картинок - Meta Image Search найдет и загрузит их сама. Остается лишь просмотреть сохраненные на диск картинки и отобрать из них самые лучшие. Как видите, искать и скачивать картинки из Интернета можно довольно легко. Но, пожалуйста, не забывайте о том, что у каждой картинки есть законный владелец.

Немного использованы материалы статьи в онлайн журнале SoftKey.Info, рекомендую, кстати...


Автор about me
Design by dady_MYKC
)c( 2000-2019
Kопирайта нет, копируйте на здоровье :)

100112 лет в Интернете


.