Термин · Глоссарий B2B-ПО

Search Engine (Search Engine)

Search Engine (поисковая система) – программная система, индексирующая и обрабатывающая информацию из интернета или корпоративных источников для выдачи релевантных результатов по запросам пользователей. Включает краулер, индексатор, ранжирующий алгоритм и интерфейс. Примеры: Google, Яндекс, Bing.

Буква «S» В категориях: 3 Платформ: 6+

Введение

Search Engine (поисковая система) – это программный комплекс, предназначенный для поиска информации по запросам пользователей. Поисковая система выполняет три ключевые функции: обнаружение информации, её индексация и ранжирование по релевантности запросу. Результаты отображаются в виде списка ссылок на документы, называемого SERP (Search Engine Results Page).

Различают публичные поисковые системы (Google, Яндекс, Bing, Baidu) и корпоративные (Elasticsearch, Apache Solr, Microsoft Search). Обе категории используют схожие технологии, но ориентированы на разные источники данных.

История и контекст

Первые поисковые системы появились в начале 1990-х. Archie (1990) был первым инструментом поиска файлов на FTP-серверах. AltaVista (1995) и Yahoo! предоставили полнотекстовый поиск по веб-страницам. Переломным моментом стало создание Google в 1998 году Ларри Пейджем и Сергеем Брином – алгоритм PageRank революционизировал ранжирование, учитывая авторитетность страниц через входящие ссылки.

В России в 1997 году был запущен Яндекс – поисковая система с глубоким пониманием русской морфологии. Сегодня Яндекс занимает около 60% российского рынка поисковых запросов.

В 2010-е годы поисковые системы перешли к машинному обучению: Google представил алгоритм RankBrain (2015) на основе нейросетей, затем BERT (2019) для понимания контекста запросов. В 2023 году Google и Bing интегрировали генеративный AI (SGE/Copilot).

Как это работает

Поисковая система работает в три этапа:

  1. Краулинг (Crawling) – боты-краулеры (Googlebot, Яндекс.Бот) обходят веб-страницы, переходя по ссылкам. Они скачивают содержимое страниц и передают его индексатору.
  2. Индексация (Indexing) – обработанный контент сохраняется в поисковый индекс – гигантскую базу данных. Для каждого документа извлекаются слова, метаданные, структура.
  3. Ранжирование (Ranking) – при поступлении запроса алгоритм ранжирования (PageRank + сотни факторов) определяет порядок выдачи результатов по релевантности и авторитетности.

Алгоритмы ранжирования

  • PageRank (Google) – ранжирование на основе количества и качества входящих ссылок.
  • TF-IDF – Term Frequency-Inverse Document Frequency, классический алгоритм текстовой релевантности.
  • BM25 – улучшенный TF-IDF, используется в Elasticsearch и Solr.
  • BERT/RankBrain – нейросетевые модели для понимания смысла запросов.
  • Матрица факторов – поведенческие сигналы (CTR, время на сайте), технические факторы (скорость, мобильность), E-E-A-T (опыт, экспертиза, авторитетность, достоверность).

Виды поисковых систем

  • Веб-поисковики – Google, Яндекс, Bing, Baidu, DuckDuckGo.
  • Вертикальные поисковики – Amazon (товары), HeadHunter (вакансии), Booking (отели).
  • Корпоративный поиск – Elasticsearch, Apache Solr, Microsoft SharePoint Search.
  • Семантический поиск – используют векторные базы данных (Pinecone, Weaviate) для поиска по смыслу.
  • AI-поиск – Perplexity AI, Google SGE, Bing Copilot с генеративными ответами.

Где применяется

  • Корпоративный поиск по документам – поиск по внутренним базам знаний, SharePoint, Confluence.
  • E-commerce – поиск товаров в интернет-магазинах (Elasticsearch в Wildberries, Ozon).
  • SEO (Search Engine Optimization) – оптимизация сайтов для повышения позиций в поисковой выдаче.
  • Data Discovery – поиск по корпоративным данным и метаданным.
  • Мониторинг СМИ – поиск упоминаний бренда в медиапространстве.

Связь с другими понятиями

Search-Based Data Discovery Tools используют те же технологии (индексирование, ранжирование, NLP), что и поисковые системы, но применяют их к корпоративным данным. Семантический поиск – следующий уровень, учитывающий смысл, а не только ключевые слова. Поисковые движки Elasticsearch и Apache Solr являются основой многих корпоративных приложений. SEO – дисциплина оптимизации контента для поисковых систем.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «Search Engine».

Платформы класса «Search Engine»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Программная система для поддержки экспертной деятельности по выявлению текстовых заимствований во внешних инфо...
Цена по запросу
Подробнее →
GI

GigaChat

Чат-боты и виртуальные ассистенты
GigaChat от компании Сбер — российский программный продукт из реестра отечественного ПО, включённый в топ-анал...
Цена по запросу
★ 2.9
Подробнее →
UF

UNISTAR FORQ

Чат-боты и виртуальные ассистенты
Коммуникационная платформа для управления знаниями, чат-ботами и голосовыми роботами с речевой аналитикой. Зам...
Цена по запросу
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «Search Engine».

Где применяется

Отрасли, в которых «Search Engine» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про Search Engine

Как работает поисковая система?

Поисковая система работает в три этапа: краулинг (обход страниц ботами), индексация (сохранение контента в индекс) и ранжирование (выдача результатов по релевантности запросу).

Чем Google отличается от Яндекса?

Google и Яндекс используют схожие технологии, но Яндекс лучше справляется с русской морфологией и локальными российскими запросами. Google доминирует глобально, Яндекс – в России с долей около 60%.

Что такое PageRank?

PageRank – алгоритм ранжирования Google, учитывающий количество и качество ссылок на страницу. Страницы с большим числом авторитетных ссылок получают более высокий ранг.

Что такое корпоративный поиск?

Корпоративный поиск – поиск по внутренним документам, базам данных и системам компании. Реализуется на платформах Elasticsearch, Solr, Microsoft Search. Помогает сотрудникам быстро находить нужную информацию.

Как поисковые системы используют AI?

Современные поисковики применяют нейросетевые модели (BERT, RankBrain у Google) для понимания смысла запросов, а также генеративный AI для создания прямых ответов (Google SGE, Bing Copilot).

Что такое SEO?

SEO (Search Engine Optimization) – комплекс мер по оптимизации сайта для повышения позиций в органической выдаче поисковых систем: техническая оптимизация, контент, ссылочное продвижение.