By Andy Beal - February 04, 2004
В моей недавней статье "Будущие
Технологии Поисковых Машин" "The
Future of Search Engine Technology" , я рассмотрел
множество достижений, которые могли бы
произойти в будущем, улучшая технологию
поиска. Я искренне верю, что мы являемся
свидетелем начальной стадии развития
технологии поисковиков, но я хотел услышать
то, что говорят другие. Сегодня, мы начинаем
ряд интервью с видными экспертами,
просвещенными лицами и ведем переговоры с
разработчиками поисковых машин, чтобы
услышать их мысли и прогнозы на будущее.
Если вы были в курсе событий недавних
событий и работаете в области, связанной с
Интернетом, вы должны были услышать о Robert
Scoble. Работая в Microsoft, он обслуживает
ежедневный блог (daily
blog) в свое свободное, если можно так
выразиться время. Robert работает над
публикациями по поводу новой операционной
системы "Longhorn" Microsoft), где он излагает
свое мнение о том, что происходит в Microsoft,
при этом, так же, не забывая критически
взглянуть на конкурентов. Scoble делает
большую работу, сохраняя и разделяя
собственное и официальное мнение.
Мне случайно повезло поймать его во время
творческого отпуска и расспросить о
будущем технологии поисковиков. Scoble
настоятельно просил меня отметить, что
нижеизложенное отражает лишь его личное
мнение, а не Microsoft.
Роберт, расскажи мне о наиболее волнующих
тебя изменениях технологии поисковиков?
[ RS ] Это зависит от того, говорите ли вы о
поиске в Интернете или поиске на вашем
жестком диске. Если мы ведем речь о
локальном жестком диске, то поиск файлов на
нем все еще ужасен и становится еще хуже.
Почему ты так считаешь?
[ RB ] Поскольку жесткие диски становятся все
больше (60 GB drive у Fry's Electronics стоит сейчас $60 –
мы полагаем, что через три года он уже будет
$20, и вы вскоре увидите 500 GB drives за менее, чем
$100). Сейчас легче создавать файлы, чем их
находить.
Сегодняшние инструменты поиска как,
например X1, наиболее интересны, поскольку
они индексируют информацию на вашем диске и
совершают довольно легко поиск email -адресов
и файлов. Microsoft Research еще работает над
инструментом, называемым " Stuff I've Seen " (все,
что я видел). Это также весьма интересно (позволяет
искать как email-адреса, так и файлы на диске).
Но всего этого недостаточно. Прежде всего,
они привязаны с ядром операционной системы.
Так что, пока они индексируют, ваша
операционная система тормозит. Их не могут
подогнать для правильной работы с
операционной системой и другими
приложениями, которые требуют затрат
времени процессора.
Плюс к этому, чтобы действительно хорошо
осуществлять поисковую работу, поисковые
машины требуют метаданных, а метаданные,
добавленные системой, содержат следы вашей
работы с файлами. Также сами системные
приложения могут добавлять метаданные в
саму систему. Многими способами блоги
добавляют метаданные к web-сайтам. Когда блог,
к примеру мой,
ссылается на сайт, мы обычно добавляем чуть
больше деталей об этом сайте. Допустим, мы
говорим, что это «классный сайт» ("cool site").
Так вот, Google заносит эти слова в свою машину.
Это метаданные. (Технически метаданные – «данные
о данных»). Теперь, если вы ищете "cool site",
наиболее вероятно, вы найдете сайт, на
который я только что ссылался. Таким
образом, вы можете увидеть, как машине Google
помогают метаданные. Но мы не в состоянии
применить эти уроки к тысячам файлов на
вашем жестком диске. В будущем планируется
это изменить .
Вы можете объяснить проблемы,
возникающие при поиске на жестких дисках.
Что Microsoft разрабатывает для их решения?
[ RB ] А что, если мы проделаем на вашем
жестком диске то же самое, что в свою
очередь делает Google? Возьмите фотографии.
Когда я переписываю фотографии с моего Nikon,
то они включают в себя некоторые метаданные
(например, внутри файла есть дата снимка
вместе с информацией о фотографии), но для
большинства поисков, осуществляемых
человеком, метаданные не несут пользы.
Как насчет того, если бы я захотел искать «мои
свадебные фотографии» ("my wedding photos")? Ни
X1, ни Windows XP's, созданные для поиска, не найдут
ваших свадебных фото. Почему? - Потому что у
них бесполезные названия, вроде DSC 0001. jpg и
нет метаданных, говорящих о том, что именно
это свадебные фотографии.
Давайте посмотрим вперед на несколько лет,
к следующей версии Windows, имеющей кодовое
название Longhorn . В Longhorn мы создали новую
систему хранения файлов, с кодовым именем
WinFS . При WinFS поиск и метаданные будут частью
операционной системы. Например, только вы
начинаете печатать в адресной строке " W
"," E "," D " и " D ", как все,
начинающееся с WEDD, будет представлено. Как,
к примеру, ваши свадебные документы,
всевозможные записи и фото (wedding documents,
spreadsheets, and photos).
Но WinFS идет дальше, чем X1 и другие
инструменты файлового поиска. Он позволяет
вам (и используемым вами приложениям)
добавлять метаданные в ваши файлы. Так, если
вы даже не меняете названия файлов, вы
просто можете кликнуть на одно из лиц в
изображении и получить возможность ввести
имя и описание. Например, кликнув по лицу
вашего кузена Joe , впечатать "Joe Smith" и
"Wedding".
Теперь, если вы когда-либо будете искать
тему венчания, появится это фото. И это еще
не все. Если вы импортируете группу
фотографий в свадебный альбом, вы будете
добавлять метаданные для использования
поисковиком. Другими словами, вас ждет
гораздо лучшая система поиска на вашем
жестком диске.
Похоже, что Microsof предоставляет вещи для
поиска в режиме offline, но могут ли они
состязаться с поисковыми машинами сети
Интернет?
[ RS ] В настоящее время, если говорить об
Интерне, то Google тут также проделал
колоссальную работу. Я пользуюсь Google
десятки раз в день. Будет ли MSN выдавать
более релевантные результаты, чем Google? Я не
знаю. Конечно, на сегодняшний день это не
так. Изменится ли это завтра? Поживем,
увидим, что предпримут мозги, работающие на
MSN .
Одно я вижу, что в Longhorn поиск для
потребителей станет лучше. Google работает,
чтобы сделать свой tool-bar возможно наилучшим.
Мы тоже работаем над массой вещей. Меня
очень волнует будущее поиска, неважно в
каком направлении пойдут дела.
Давайте заглянем на несколько лет вперед.
Какие новые технологии и продвижения
поиска вы видите в ближайшие 3-5 лет?
[ RS ] Для Интернет-поиска я вижу, что
инструменты анализа социального поведения,
напр.Technorati,
становятся гораздо более важными. Почему? -
Потому что люди хотят любыми способами
видеть потенциально релевантные
результаты. Google далеко продвинул нас к
такому будущему, поскольку на его
результаты влияет количество обратных
ссылок, имеющихся на сайт. Но теперь,
давайте пойдем дальше, еще дальше, чем Technorati
. Давайте определимся, кто поддерживает
актуальность рынка в определенной области
и придает ему/ей больше значения?
Я также вижу, что поисковые машины,
которые ищут лишь специфическую информацию
(например как Feedster)
собираются занять более важное место. (Feedster
ищет только RSS и Atom syndication feeds).
Но пользователи собираются требовать новых
путей экспортирования поиска. Google показал
это с News Alerts . Введите поисковый термин, как
напр. " Microsoft " и в любое время получайте
блок новостей по почте, упоминающих Microsoft.
Feedster идет еще дальше. Там вы можете создать
RSS подключение по поисковому термину. У меня
таких несколько, направленных в мой RSS News
Aggregator и, вы знаете, они неоценимы в
наблюдении за тем, что говорят web-логи о
вашем продукте, компании или рынке.
Например, источник для одного из моих
созданных терминов - " WinFS ", - я
понаблюдаю, сколько людей сошлются на эту
статью. И если кто-либо из вас хочет сказать
что-то интересное, я даже поставлю на его
статью обратную ссылку.
Предположим, что нет технологических
ограничений. Какие новые свойства вы бы
желали увидеть у поисковых машин?
[ RS ] Я хочу видеть значительно более
совершенные инструменты для поиска фото. А
также создание связи между всеми типами
файлов и фото. Например, почему я не могу
просто перетащить имя из моего списка
контактов для ассоциации имени с лицом на
фото? Не сможет ли это помочь в дальнейшем
поиске? За каких-то 18 месяцев я сделал 7400
фото. Но сейчас для меня непросто найти
какую либо фотографию без переименования
файлов.
Как вы считаете, какое влияние окажут
социальные сообщества на будущие
технологии поисковых машин?
[ RS ] Мы уже наблюдаем воздействие на Feedster и
Technorati. Трудно сказать, что произойдет в
будущем. Что произойдет, если каждый в мире
будет иметь логи и членство в Google's? Изменит
ли это методы поиска? Ну, с одной стороны,
наиболее вероятно, что это заставит
объединиться людей в службах, связывающих
воедино социальные пространства и web-логи.
Например, я не могу вспомнить адрес
почтового ящика моего брата, но Google найдет
мне его.
С другой стороны, я буду наблюдать, как
Longhorn's WinFS используется разработчиками
приложений для построения новых видов
социальных систем. Сегодня, если, к примеру,
взглянуть на контакты, то они заперты в Outlook
, либо в каком-то другом персональном
информационном программном обеспечении,
как ECCO . Но контакты в Outlook не могут быть
использованы другими приложениями (к тому
же сейчас из-за создателей вирусов Microsoft
исключил эти функции).
WinFS это меняет. Как?
[ RS ] Вставляя файл “контактного” типа в
саму OS, тем самым, заставляя приложения
работать с их собственной методологией
контактов.
Что если ВСЕ приложения, не только Outlook,
могли бы использовать этот новый тип файлов?
Что, если бы мы могли ассоциировать данный
тип файлов с социальным программным
сервисом, как Friendster, Tribe, Yahoo's personals, или Google's
Orkut? Изменит ли это радикально способы
поддержания ваших контактов? Сделает ли это
контакты более ценными? Я полагаю, что да.
Мы уже видим такие системы, как Plaxo
поддерживающие контакты, но Plaxo все же не
осознает, что я ввел свои данные в Google's Orkut и
Friendster . Почему я не смог бы сделать систему,
которая будет сопоставлять данные во всех
моих социальных приложениях, включая Outlook?
Вы не предвидите каких либо проблем со
стороны WinFS?
[ RS ] Тут разработчики не доверяют
намерениям Microsoft . Они также не хотят
раскрывать своих собственных приложений
своим конкурентам. Если вы, например, были
бы разработчиком AOL , разве вы видите, как
ваша система контактов открывается, скажем,
с Yahoo или Google либо Microsoft? Это пугающие
обстоятельства для всех нас .
Но если вся отрасль работает на общих WinFS
схемах (не только для контактов, но и при
других типах данных тоже), мы окажемся с
некоторыми новыми, действительно
великолепными способностями. Это
действительно заставит разработчиков
волноваться о возможностях WinFS и заставит
их позабыть все сомнения и страхи,
касающиеся открытия их разновидностей
данных.
Предвидите ли вы наступление времени,
когда результаты коммерческого поиска (продукт/услуги)
будут отграничены от результатов
информационного поиска (белая пресса/образовательные
сайты)? И думаете ли вы, что в конце концов
все коммерческие базы данных будут только
платными?
[ RS ] На сегодняшний день я не вижу системы,
отличающейся результатами от стиля Google.
Только платные поиски не принесут наиболее
релевантных результатов.
Что заставляет вас так думать?
[ RS ] Это потому, что я чаще нахожу наилучшую
информацию на блогах. Владельцы блогов
никогда не смогут платить за включение в
поисковые базы.
Исключительно коммерческий листинг может
быть приведен по сотовым телефонам,
например, или PDA. Если я бы организовывал
сотовый сервис, например для ресторанов в
Сиэтле, я скорее всего хотел бы быть
упомянут на простых сайтах для
пользователей. Но, думая об этом, я не
предвижу, что подобная система станет
достаточно популярной, не упомянув каким-то
образом каждый ресторан.
О сотовых телефонах. Что вы скажете о
технологии поисковых машин, и как она
повлияет на использование PDA и сотовых
телефонов?
[ RS ] Не уверен, что технология поисковиков
повлияет на это, но смесь речевого
распознавания с поисковыми машинами может
сильно ее изменить. Когда я использую свой
сотовый телефон, то не хочу просматривать
сайты, в которых есть много текста (я их
сохраняю на потом, чтобы прочитать дома за
своим компьютером). Наоборот, я хочу
отыскать ближайшие кинотеатры, системы
Starbucks или же найти славное местечко, где
можно съесть неплохой бифштекс.
Сейчас сотовые телефоны сообщают e 911
данные (это значит, что сотовая связь
приблизительно знает место вашего
нахождения и поэтому может посоветовать
вам только один или два Starbucks , чем все,
находящиеся в Сиетле).
Если бы пользователи поисковиков немного
бы сдали позиции своей анонимности и
позволили проследить за своими поисковыми
привычками, сможет ли это позволить
поисковым машинам предоставлять более
хорошие, выборочные результаты?
[ RS ] Да. Я уже предоставляю Google возможности
следить за моими поисковыми фразами (я
использую для этого Google Toolbar). Люди
действительно не терпят, если вы не
соблюдаете норм приватности, и их легко
понять. Они не терпят, если вы не
предоставляете им право выбора не сообщать
о чем-то.
Роберт, вы определенно открыли нам глаза
на будущее технологии поисковиков. Есть ли
еще что-либо, что вы хотели бы добавить?
[ RS ] Как отражение, сказанного выше, я
надеюсь, что эта область с достоинством
оценит возможности, открывающиеся с Longhorn's
WinFS. Мы либо можем сотрудничать, и
обмениваться информацией друг с другом,
либо бояться и придерживать данные для себя.
Будет интересно все это пронаблюдать в
ближайшие три года.
Источник: Webmasterpro