Автор Тема: Локальный поиск файлов  (Прочитано 41354 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Локальный поиск файлов
« : Июнь 19, 2011, 21:52:06 »
Локальный поиск файлов.


Recoll - поиск файлов по названию и по содержимому,  распознает много форматов (в том числе форматы Libre Office и MS Office).

Установка в Runtu 16.04
sudo apt update && sudo apt install recoll aspell aspell-ru python xdg-utils xsltproc antiword catdoc ghostscript libimage-exiftool-perl poppler-utils pstotext python-chm python-mutagen unrtf untex wv
Установка в Runtu 18.04
sudo apt update && sudo apt install recoll aspell aspell-ru xdg-utils xsltproc antiword ghostscript groff libimage-exiftool-perl libinotifytools0 poppler-utils pstotext python-chm python-libxml2 python-libxslt1 python-lzma python-mido python-mutagen python-rarfile unrtf untex wv


DocFetcher - поиск файлов по содержимому, написан на java, распознает много форматов (в том числе форматы Libre Office и MS Office).

Catfish - поиск файлов по именам, а также поиск txt файлов по содержимому, использует find, grep, locate.


find - консольная программа для поиска файлов по именам
grep - консольная программа для поиска текста в выводе терминала, для поиска текста в txt файлах.
locate - консольная программа для быстрого поиска файлов, для ускорения поиска использует индексирование.


Дополнительная информация: во многих окружениях рабочего стола есть встроенные службы поиска файлов по названиям, а также в файловых менеджерах есть функция поиска файлов по названиям.
« Последнее редактирование: Июль 20, 2018, 20:52:15 от Пользователь. »

Оффлайн dr.Faust

  • Новичок
  • **
  • Сообщений: 25
Re: Программы для поиска файлов в системе
« Ответ #1 : Июнь 20, 2011, 16:35:21 »
Tracker - шустро все индексирует, хоть и грузит систему, но если вдруг на чем-то споткнется, то продолжать уже не станет, но грузить дисковую подсистему продолжит. При этом может игнорировать некоторые пути индексации по совершенно непонятным причинам. При попытках поиска часто подвисает, а некоторые результаты не попадают в выхлоп - в итоге найти что-то часто невозможно.
Beagle - написан на mono, из чего вытекает, что тупит сильнее чем Tracker, результат поиска все так же ненадежен - часто результаты выподают из поиска и найти что-то очень тяжело.
Recoll - не имеет демона индексации и поэтому индексировать диск надо вручную или по крону, что может и  лучше - можно настроить время. При этом использует для индексации и поиска наиболее адекватный из существующих движков - xapian. Как результат это единственный полезный на  практике индексирующий поисковик.
Catfish - единственный минус - не умеет работать с xapian/recoll, но для поиска с помощью find и locate вполне подойдёт.
Есть еще не упомянутый тут отдельно strigi - это часть nepomuk и потому самый прогрессивный и функциональный индексатор. Жаль только, что единственное что он умеет делать сегодня - это превращать ваш компьютер в обогреватель. При этом это не многозадачное приложение, и пока машина греет воздух всеми своими компонентами под чутким управлением strigi использовать её для чего-то ещё просто невозможно.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #2 : Июнь 20, 2011, 19:17:22 »
Протестировал сейчас Recoll и Catfish


Recoll - разобрался как с ней пользоваться, все хорошо, но вордовские документы плохо индексирует, через одного, поэтому часто не находит в вордовских...

Catfish - стандартная программа поиска в гноме не хуже, она разве что для LXDE может пригодится.

Вобщем пока откажусь от этих программ, раз не работают.

Оффлайн dr.Faust

  • Новичок
  • **
  • Сообщений: 25
Re: Программы для поиска файлов в системе
« Ответ #3 : Июнь 20, 2011, 19:21:34 »
Из всех этих прог юзаю только recoll.
Там кстати, после первого прохода индексации должен был быть выведен список недостающих пакетов - это пакеты которые необходимы для открытия тех файлов которые он нашел в процессе индексации, но не смог открыть - после доустановки recoll при следующей индексации проиндексирует и их.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #4 : Июнь 20, 2011, 19:27:05 »
Да, мне для вордовских документов предложил установить пакет antiword
а в описании этого пакета написано:

Antiword -- свободная программа для просмотра файлов формата MS Word.

Конвертирует двоичные файлы документов MS Word 6, 7, 97 и 2000 в PS, PDF и
текстовые файлы.


Но документы вордовские созданные либрой не индексируются почти все, один только проиндексировался...
Может в либре дело...

Оффлайн dr.Faust

  • Новичок
  • **
  • Сообщений: 25
Re: Программы для поиска файлов в системе
« Ответ #5 : Июнь 20, 2011, 19:41:24 »
А зачем вообще хранить документы в некошерных форматах? Я понимаю если это входящий, а создавать либрой и потом хранить - не понимаю... Это конечно не оправдывает recoll, но все же.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #6 : Июнь 20, 2011, 19:50:44 »
Все выяснил, это либра что-то делает с doc документом, сделанные в Microsoft word документы нормально индексируются...

Сырая либра... Doc файлы портит... Сохранял, чтобы потом открыть в ворде...

остальные форматы индексируются

Оффлайн ludoed

  • Местный
  • *****
  • Сообщений: 861
  • ludoed1970@jabber.ru
Re: Программы для поиска файлов в системе
« Ответ #7 : Июнь 20, 2011, 20:11:34 »
А зачем вообще хранить документы в некошерных форматах? Я понимаю если это входящий, а создавать либрой и потом хранить - не понимаю... Это конечно не оправдывает recoll, но все же.

Для совместимости с внешним миром. Я тоже пользуюсь OpenOffice, но филе сохраняю в .doc
все юниксы очень дружелюбны.. они просто очень разборчивы в друзьях ;)

Настоящее труЪ: самописное ядро, выращенные на кухне кристаллы и программирование перемычками :)

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #8 : Июнь 20, 2011, 20:59:03 »
Оставил recoll  :)

По работе знаю, что полезная штука, бывает у нас среди кучи документов нужный найти не могут, тогда поиск по содержимому документов спасает, это быстрее чем все несколько сотен документов открыть и просмотреть.

Оффлайн dr.Faust

  • Новичок
  • **
  • Сообщений: 25
Re: Программы для поиска файлов в системе
« Ответ #9 : Июнь 20, 2011, 21:37:41 »
я его всем рекомендую  ;)
я на нем интернет-поисковик собрал...

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #10 : Июнь 20, 2011, 22:32:13 »
Чтобы каждый раз после запуска не нажимать обновление индекса, сделал скрипт запуска и в меню изменил команду запуска ссылкой на этот файл (у меня только папку с документами эта программа сканирует - чтобы долго не ждать)


!#bin/sh

recollindex
recoll

« Последнее редактирование: Июнь 20, 2011, 22:33:52 от Пользователь. »

Оффлайн dr.Faust

  • Новичок
  • **
  • Сообщений: 25
Re: Программы для поиска файлов в системе
« Ответ #11 : Июнь 21, 2011, 02:40:04 »
А у меня напротив - сканит все три диска. Запускается по крону в 5:00 - обычно в это время я уже сплю, а жена еще спит и комп никто не использует...

Оффлайн kurolesov

  • Новичок
  • **
  • Сообщений: 38
Re: Программы для поиска файлов в системе
« Ответ #12 : Февраль 02, 2013, 17:25:04 »
Подходит для этого раздела?
Программа для полнотекстового поиска - DocFetcher:
http://docfetcher.sourceforge.net/ru/index.html

Написана на java, поэтому кроссплатформенная. Интерфейс очень похож на archivarius.3000. Есть окно предпросмотра. Можно настроить поиск по разным индексам.
Недостаток - не индексирует документы djvu. Как говорит автор, всё упирается в поддержку java формата djvu.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #13 : Июль 30, 2013, 23:00:56 »
Еще есть SearchMonkey - поиск по названиям файлов и по содержимому, интерфейс на английском, есть в стандартном репозитории Ubuntu.

Установка:
sudo apt-get install searchmonkey

На сайте написано, что поисковик рассчитан на программистов, то есть на поиск по текстовым файлам с исходным кодом.

При проверке выяснил, что названия файлов находит как русские так и английские.
Поиск по содержимому - ищет только в простых текстовых файлах и только английские слова.





gnome-search-tool - ищет по названиям, может найти простые текстовые файлы по содержимому, ищет как русские так и английские слова. Интерфейс переведен на русский.

Установка:
sudo apt-get install gnome-search-tool
« Последнее редактирование: Июль 30, 2013, 23:19:33 от Пользователь. »

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4639
Re: Программы для поиска файлов в системе
« Ответ #14 : Июль 31, 2013, 22:19:14 »
В первом сообщении темы урезал информацию, оставил только самое нужное - что применяется на практике.



Есть еще Strigi-client, ищет файлы по содержимому, находит txt, ods, odt, doc созданный в MS Office (не находит doc созданный в LibreOffice), вобщем результат как у Recoll, но Recoll намного удобнее и функциональнее.

В Catfish хоть и заявлен поиск с помощью разных консольных утилит, но он нормально работает только с find, пробовал в нем через strigi поискать - выдало фатальную ошибку и больше ничего  ;D , а Strigi-client спокойно находит документы.
« Последнее редактирование: Август 01, 2013, 13:33:10 от Пользователь. »