• Reset your password

User account menu

  • Artikler
  • Forside
  • Forum
  • Nyheder
  • Log in
Hjem
Linuxin 2025

Breadcrumb

  • Hjem
  • forums
  • Søg multiple pdf filer for indhold

Hvad kan du med 100% sikkerhed sige, at du har stemt?

Resultater

1
0% (0 stemmer)
2
0% (0 stemmer)
Schrödinger
100% (1 stemme)
Antal stemmer: 1
Af stizzel | 05.04.2022 21:26

Søg multiple pdf filer for indhold

Software

Findes der et program / script / whatever

som kan søge multiple pdf filer igennem for den tekststreng jeg søger på ?



1. Jeg skriver et søge ord

2. Jeg får vist en liste over relevante pdf filer med det indhold jeg søger på

3. Jeg kan trykke på hver enkelte pdf fil, og få vist et preview af siden i pdfen, så jeg kan se om det er det rigtige indhold som programmet har fundet.



Jeg ved der findes et program til mac der hedder devonthink.



Til linux findes der noget der hedder recoll - recoll er dog et sindsygt ringe program - så den er udelukket.



Har i kloge hoveder en smart løsning ?. Måske en anden løsning som er bedre som jeg ikke har tænkt på ?



Vh

  • Log in to post comments

Kommentarer3

3 år 1 måned siden

Permalink

Indsendt af osjensen den 5. april 2022 kl. 22:07

Permalink

Hvis din pdf filer er i

Hvis din pdf filer er i /home/stizzel/Documents/ - kan du prøve:



pdfgrep -R 'det du søger' /home/stizzel/Documents/



Ser ud til at fungere.


  • Log in to post comments

3 år 1 måned siden

Permalink

Indsendt af phoenix den 6. april 2022 kl. 20:41

Permalink

Apache Tika

Du kan evt. benytte Apache Tika



Den kan scanne mange andre formater udover PDF (diverse billed formater, PowerPoint, ...) og kan også OCR scanne og trække metadata med ud.

Den Gemmer i XHTML filer som du så kan søge igennem med fx. grep.



Du downloader en JAR fil, så det kræver Java for at kunne afvikle.



Dette script læser alle filer i mappen dokumenter/ og gemmer dem som XHTML filer i out/ mappen:



#!/usr/bin/env bash



for x in `ls dokumenter`; do

java -jar tika-app-1.20.jar dokumenter/${x} > out/${x}.xml

done


  • Log in to post comments

3 år 1 måned siden

Permalink

Indsendt af marlar den 10. april 2022 kl. 22:12

Permalink

Jeg bruger Total Command via

Jeg bruger Total Commander via wine til præcis den opgave. Der er mange plugins til TC, heriblandt et PDF-plugin.



Hvis du vil have et ren linuxløsning, kunne det være Midnight Commander-> Eksternt panelisering > pdfgrep.



Ekstern panelisering vil sige at man får udfyldt en filliste med resultatet fra et ekstern program.

  • Log in to post comments

Svar søges

2 stk Jolla C2 sælges 0
Den er go 0
Vil du have et sikrere og mere privat internet? Du skal blot installere Vivaldi-browseren med Proton VPN understøttelse! 0
14. februar = I Love Free Software Day 0
Lokal fil-deling - for de dovne. 0

Seneste aktivitet

Det første forumindlæg efter installation af Forum-modulet 8
Test 1
Vanilla OS 12
Nye forum-indlæg viser sig kun 1 gang 1
Vil alle forumindlæg vise sig to gange 1
Hjælp til remote terminal vindue? 3
PCLinuxOS 19
Kan ikke boote på installation 24
80-20 reglen 1
Skærmlys fader ud på min bærbare 8
32 bit distro på max 700mb der stadig understøttes 26
Har vi nogen Linux konsulenter i Slagelse området? 3
Virkelig 7
gnome-software? 3
Archer T2U AC600 Wireless Dual Band USB Adapter 26
En farverig APT 3.0 udgivelse imponerer med sine nye funktioner 2
Unix's fødsel 2
Linux Mint 13
"Intet realistisk alternativ" - mig i r*ven 1
German state moving 30,000 PCs to LibreOffice 6

Copyright © 2025 Company Name - All rights reserved

Developed & Designed by Alaa Haddad