Błędy wyszukiwania PDF Adobe Reader

Do niedawna wydawało mi się, że cechą charakterystyczną plików PDF pobieranych tylko z witryny Dziennika Ustaw lub Internetowego Systemu Aktów Prawnych (ISAP) — jest to, że nie działa tam jak trzeba wyszukiwarka wewnątrz programu Adobe Acrobat Reader (wersja DC 18 PL, system Microsoft Windows od Vista po 10, PL).

Przykładowo, pobrałem Dz. U. z 2017 r. poz. 2361, szukałem (CTRL+F) frazy „organ” (na wszelki wypadek zaznaczam, że jako prosty tekst/ciąg znaków, bez wyrażeń regularnych, dodatkowo bez polskich krzaczków), znalazło i zaznaczyło mi na s. 4 w art. 7 w ust. 1 w pkt 4 w lit. d w pierwszej linii wyraz „a” we fragmencie „…Gwarancyjny, a impreza…” (w tych trzech wyrazach, jak widać, nie ma liter: „organ”). W praktyce, długo nie potrafiłem zidentyfikować, nie tylko gdzie, ale czy w ogóle, jakaś szukana fraza w ogóle występowała w tekście.

Błędy wyszukiwania Adobe

Błędy wyszukiwania Adobe

Wydawało mi się, że to pliki PDF są przez Kancelarię Sejmu czy Rządowe Centrum Legislacji (RCL) jakoś zabezpieczane przed wyszukiwaniem (w przeszłości zdarzało się bowiem, że zabezpieczali przez kopiowaniem do schowka CTRL+C, a nawet zamiast tekstu wrzucali obrazki, na szczęście w tej chwili to już przeszłość, chociażby w tej poz. 2361).

Okazało się, że jest to spowodowane problemami Adobe z buforem i indeksowaniem (tak, moim zdaniem, to jest problem Adobe, że nie byli w stanie sobie z tym poradzić i przewidzieć różnych działań użytkowników, wcale nie takich nieoczywistych). Indeksowanie to proces wyłapywania poszczególnych wyrazów i znaków, tak jakby automatyczne układanie alfabetycznego skorowidza czy indeksu. Indeksować program może po zleceniu wyszukiwania, albo nie czekając na takie zlecenie przez użytkownika, wyprzedzająco rozpoczynać indeksowanie w tle od razu po otwarciu każdego pliku.

Prawdopodobnie pliki PDF były przeze mnie zamykane szybciej, niż zdążały się całe zindeksować. Przy ponownych odwiedzinach program widział już, że były indeksowane, i nie dokańczał dzieła. W efekcie nie wszystko było indeksowane. Metodą rozwiązania tej sytuacji jest:

  • niezamykanie plików PDF po ich otwarciu przez bliżej mi nieznany czas (kilkadziesiąt sekund? kilka minut? skąd mam wiedzieć, że to „już”?☺); albo
  • jednorazowe czyszczenie bufora (por. dalej) w przypadku stwierdzenia błędu (pod warunkiem, że w ogóle zauważymy, że jakiś plik zindeksował się źle); albo
  • wyłączenie szybszego wyszukiwania=indeksowania (por. dalej), tj. aby program nie indeksował każdego pliku od razu po otwarciu, lecz dopiero przy jego wyszukiwaniu — negatywnym skutkiem jest jednakże dłuższe wyszukiwanie; co przy nowych procesorach CPU i pamięciach RAM można poddawać w wątpliwość, czy ma znaczenie (im większy plik, tym bardziej doceni się, że program w tle sam szybciej zindeksował zawartość pliku).

W menu EdycjaPreferencje na liście znajduje się pozycja Wyszukiwanie.

Menu preferencji Adobe

Menu preferencji Adobe

Tam zaś są dwie opcje:

Szybkie wyszukiwanie i czyszczenie bufora Adobe

Szybkie wyszukiwanie i czyszczenie bufora Adobe

Odpowiednio klikając na Wyczyść zawartość bufora, albo odznaczając Włącz szybkie wyszukiwanie i klikając OK, zrealizujemy drugi lub trzeci sposób radzenia sobie z błędami wyszukiwania. Obawiam się, że pierwszego sposobu nie jestem w stanie opanować ☺ bowiem często zdarza mi się, że z zupełnie innej, nowej lokalizacji otwieram testowo pliki PDF w ramach szybkiego sprawdzania–poszukiwania, czy to o ten dany plik chodzi. Żeby nie zaśmiecać sobie pamięci operacyjnej RAM komputera, pliki zamykam, a do tego jednego właściwego ewentualnie w ramach potrzeb wracam na koniec. Skoro zły nawyk szybszego niż chciałby Adobe otwierania i zamykania plików PDF ciężko mi zlikwidować, zniwelowałem go sobie wyłączeniem szybkiego wyszukiwania. Jakoś i tak są na tyle szybcy, że nie dostrzegam potrzeby włączania tej funkcji ☺

Pomocne w rozwiązaniu problemu okazały forum oraz system pomocowy.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *