«Как готовить Sphinx»

 
Время проведения
18
июня2011
Завершено

Киев

Ориентировочная продолжительность 4-5 часов + несколько перерывов на кофе.

Описание

Мастер-класс будет интересен разработчикам, руководителям и владельцам проектов, которые сталкиваются с проблемой поиска при высоких нагрузках.

План мероприятия

1. Введение в Sphinx
 1.1 архитектура в целом (indexer/searchd, API/QL/SE)
 1.2 конфиг, источники данных, индексы
 1.3 sql источники
 1.4 xml источники
 1.5 поиск (подробнее про API/QL/SE)
 1.6 простейший конфиг, поиск в 3 строки через API/QL
2. Повседневная работа
 2.1 борем обновления (ребилды, ротация, дельты, “полуинкрементальные” апдейты, фантомы, клисты)
 2.2 борем естественные языки (charsets, CJK, морфология, стеммеры, словоформы, exceptions, blended keywords)
 2.3 борем индексацию (точные формы, подстроки, expansion, crc/keywords словари)
 2.4 борем обработку запросов (синтаксис, конвейер, и где в нем что)
3. Борьба с масштабированием
 3.1 merge vs rebuild
 3.2 съедаем весь диск (iops, throttling, raw vs raid, etc)
 3.3 съедаем все ядра (dist_threads)
 3.4 съедаем все машины (распределенные индексы, кластера, стандартные миниграбли)
 3.5 съедаем всю память (оптимизация схем, ondisk_dict)
 3.6 как искать боттлнеки
 3.7 как оптимизовать поиск
 3.8 как оптимизировать фильтрацию
4. Борьба с тонкостями
 4.1 как искать предложения/абзацы/зоны
 4.2 как чинить опечатки
 4.3 как ловить дубликаты
 4.4 как устроена релевантность
5. Секция вопросов-ответов