нутчфільтр

Нутчфільтр (від англ. nutch filter) — спеціалізований фільтр у відкритій веб-пошуковій системі Apache Nutch, призначений для обробки, відбору або перетворення даних під час збору та індексації веб-сторінок.

Нутчфільтр — будь-який програмний компонент або модуль, що впроваджується в конвеєр обробки даних Apache Nutch для виконання певних операцій (наприклад, нормалізації URL, видалення дублікатів, вилучення контенту) на різних етапах краулінгу.

Приклади вживання

Відсутні

Частина мови: t.d. () |