Базова ідея: черга завдань індексування
Вікно конфігурації індексування складається з однієї або більше вкладок, кожна з яких представляє індекс, що буде створений або оновлений. Усі вкладки разом формують чергу завдань, чиї елементи будуть оброблятися по одному за раз. Ви можете додавати більше завдань у таку чергу чергу за допомогою кнопки '+'
у правому верхньому кутку.
Кожна вкладка має кнопку Пуск
внизу справа. Клацаючи по ній, ви підтверджуєте, що це завдання належно сконфігуровано та готове до індексування. Індексування починається, як тільки є хоч одне готове завдання у черзі.
Справа від кнопки '+'
є інша кнопка. Клацання по ній буде мінімізувати все вікно конфігурації у смугу стану DocFetcher'а. Це дозволяє вам здійснювати пошук по наявних індексах, у той час як створюються нові у фоні.
Ви можете скасувати будь-яке завдання, клацнувши на кнопці закриття ('x'
) цієї вкладки. Коли завдання скасовується, вам дається вибір зберегти або відкинути частково зроблений індекс. Відновлення просто робиться запуском оновлення частково зробленого індексу через Оновлення індексу
з контекстного меню зони Область пошуку
.
Саме вікно конфігурації має також кнопку закриття (у Windows, це кнопка 'x'
вгорі справа). Якщо ви клацнете на ній, то усі завдання індексування будуть скасовані та вилучені з черги.
Опції індексування
Примітка: Цей підрозділ зосереджується на доступних опціях індексування для теки та індексів архівів. Про опції для індексів Outlook PST дивіться відповідні записи нижче у підрозділі 'Різне'.
Розширення файлів
Керувальник 'розширення файлів' дозволяє вам визначати, які файли повинні бути оброблені, як текстові файли або архіви zip. Одним з поширених сценаріїв використання є змусити DocFetcher індексувати певні види файлів джерельного коду. Звернули увагу на ці дві кнопки '...'
справа? Якщо ви клацаєте на них, DocFetcher буде проходити по теці, що має бути індексована, та збирати усі розширення файлів у список для вас.
Виключення файлів / Виявлення типу mime
Додаючи елементи у цю таблицю, ви можете (1) виключати певні файли з індексування, та (2) вмикати виявлення типу mime для певних файлів. Це все базується на регулярних виразах (regexes), а тому, якщо ви не знаєте, як їх використовувати, прочитайте про це у введенні у регулярні вирази.
Тепер, ось як ця таблиця працює: кожен елемент у таблиці є регулярним виразом з асоційованою дією. Цей регулярний вираз може підставлятися по іменах файлів або шляхах файлів, а дія може бути "виключити файл" або "виявити тип mime". У ході індексування, коли файл відповідає регулярному виразу, дія цього регулярного виразу застосовується до такого файлу.
Ви можете додавати елементи до або вилучати елементи з таблиці за допомогою кнопок '+'
та '-'
справа. Кнопки уверх та вниз дозволяють вам збільшувати або зменшувати пріоритет виділеного елемента таблиці. Цей пріоритет стає значущим, коли файл відповідає більше, ніж одному регулярному виразу у таблиці; у такому випадку регулярний вираз з найвищим пріоритетом перемагає, а всі інші ігноруються.
Безпосередньо нижче таблиці є маленький засіб, що допомагає вам писати регулярні вирази: клацніть на кнопці '...'
справа для вибору певного файлу з теки, що буде індексуватися. Шлях до цього файлу покажеться у текстовому полі. Далі рядок тексту над текстовим полем розкаже вам, чи поточно обраний регулярний вираз у таблиці відповідає вибраному файлу.
Різне
Опція | Коментар |
---|---|
Парування HTML | Файли HTML та їх асоційовані теки (наприклад, файл foo.html та тека foo_files ) повинні оброблятися як єдиний документ. |
Виявлення виконуваних архівів zip та 7z (повільніше) | При увімкненні, DocFetcher буде перевіряти кожний файл з розширенням exe , чи він не є виконуваним архівом zip або 7z. |
Індексування за іменем файлу навіть якщо вміст файлу не може бути витягнено | При увімкненні, DocFetcher буде включати всі файли у свій індекс, незалежно від того, чи може бути витягнено вміст файлу. Вмикайте це для пошуку за повними іменами файлів. Зауважте, проте, що DocFetcher може потребувати набагато більше пам'яті, залежно від кількості файлів в індексованій теці. У такому випадку ви можете запобігти цьому, підвищивши ліміт пам'яті. |
Збереження відносних шляхів, якщо можливо (для портативності) | Ця устава є важливою, якщо ви використовуєте портативну версію DocFetcher'а. Ви можете прочитати про це більш детально на сторінці про портативні репозиторії документів. |
Відстеження тек на зміни файлів | Чи повинен DocFetcher виявляти зміни в індексованих теках та оновлювати їх індекси відповідно. Ця устава не задіює демон DocFetcher'а. |