Что Google грядущий нам готовит?
Рубрика SEO оптимизация |Некоторые спам-страницы отдельных документов не имеют смыслового содержания, а вместо этого составляют коллекции популярных слов и фраз, часто сотни или даже тысячи из них. Иногда эти страницы называют «страницы, наполненные ключевыми словами«.
Страницы других документов включают конкретные слова и фразы, которые представляют интерес для рекламодателей.
Эти типы документов (часто называемые «приманка») создаются для того, чтобы в результатах поиска поисковые системы выдавали их вместе с оплачиваемой рекламой.
Однако для пользователя, который осуществляет поиск значимого содержания, получение в выдаче таких документов приводит к потере времени и разочарованию.
Следовательно, существует потребность в информационно-поисковой системе и методологии, которые смогут комплексно определять фразы в больших масштабах данных и индексировать документы в соответствии с фразами.
Кроме того, существует потребность в такой информационно-поисковой системе, для того, чтобы выявлять спам-документы и отфильтровывать их в результатах поиска.
Резюме изобретения
Информационно-поисковая система и методология используют фразы для индексирования, поиска, ранжирования и описания документов в базе данных.
Система адаптирована для выявления фраз, которые достаточно часто используются и/или известны базе данных, что позволяет определить, являются ли они «действительными» или «хорошими» фразами.
Таким образом, многословные фразы могут быть идентифицированы.
Это позволяет избежать проблемы определения и индексации всех возможных фраз, полученных в результате выявления всех возможных последовательностей заданного числа слов.
Эта система адаптирована к выявлению фраз, которые связаны друг с другом, то есть любая фраза имеет способность предсказывать присутствие других фраз в документе.
В частности, в системе заложена прогнозируемая степень фактического появления двух фраз, которая вытекает из ожидания совместного появления этих двух фраз.
Информационный коэффициент усиления, как соотношение фактического совместного появления, является одним из таких прогнозируемых понятий.
Две фразы связываются там, где прогнозируемая степень превышает заранее установленный пороговый уровень.
В этом случае вторая фраза имеет более значительный информационный коэффициент усиления в сравнении с первой фразой.
Семантически, похожими будут те фразы, которые используются для описания или обсуждения заданной темы или концепции, например, такие как «Президент Соединенных Штатов» и «Белый Дом».
Для заданной фразы, связанные фразы могут быть упорядочены с учетом их релевантности и значимости, основанные на их соответствующих методах прогноза.






