Waarom kan ik geen tekst uit een PDF kopiëren?
Je opent een PDF, probeert wat tekst te selecteren, en... er gebeurt niets. Of de tekst wordt geselecteerd maar plakt als wartaal. Dit is een van de meest voorkomende frustraties met PDF's, en het komt bijna altijd door een van deze 6 redenen.
1. De PDF is een gescande afbeelding (meest voorkomend)
Dit is de #1 reden waarom mensen geen tekst uit een PDF kunnen kopiëren. Wanneer een document wordt gescand — met een flatbedscanner, een multifunctionele printer of een telefooncamera-app zoals CamScanner — bevat de resulterende PDF een foto van elke pagina, geen echte teksttekens. Je PDF-viewer toont het als een normaal uitziend document, maar er is letterlijk niets om te selecteren omdat elke pagina slechts een afbeelding is.
Dit komt extreem veel voor bij oudere documenten, overheidsformulieren, academische papers uit het pre-digitale tijdperk en alles wat je als fysieke uitdraai hebt ontvangen die later is gescand om elektronisch te delen.
Hoe herken je het: Probeer te klikken en over de tekst te slepen. Als er niets wordt gemarkeerd, of de hele pagina wordt als één groot blok geselecteerd (zoals bij een afbeelding), is het een gescande PDF. Een andere test: zoom in tot 400% — als de tekst er licht wazig of gepixeldeerd uitziet zoals een foto, is het een afbeelding.
Oplossing: Je hebt OCR-software (Optical Character Recognition) nodig om de afbeeldingen in tekst om te zetten. Gratis opties zijn Google Docs (uploaden naar Google Drive → "Openen met → Google Docs") en het open-source Tesseract CLI-tool. Voor betere nauwkeurigheid — vooral bij complexe lay-outs, tabellen of niet-Engelse tekst — past een speciaal hulpmiddel zoals ParseJet automatisch OCR toe en behoudt het de leesvolgorde.
2. De PDF heeft kopieerbeveiliging ingeschakeld
PDF-makers kunnen beveiligingsrechten instellen die specifiek tekstselectie en kopiëren uitschakelen. Dit komt vaak voor bij gepubliceerde e-boeken, bedrijfsrapporten gemarkeerd als "vertrouwelijk", overheidspublicaties en documenten uit betaalde databases zoals JSTOR of IEEE.
Je kunt het document meestal nog wel op het scherm lezen — de beperking blokkeert alleen de kopieerfunctie. Sommige viewers tonen een slotpictogram of "Beveiligd" in de titelbalk.
Hoe herken je het: Ga in Adobe Acrobat Reader naar Bestand → Eigenschappen → tabblad Beveiliging. Kijk bij "Documentbeperkingen Samenvatting". Als "Kopiëren van inhoud" "Niet toegestaan" toont, is kopieerbeveiliging actief. In Chrome's PDF-viewer, probeer Ctrl+A — als er niets wordt geselecteerd, is de PDF mogelijk beperkt.
Oplossing: Als je legitieme toegang tot de inhoud hebt (je hebt het gekocht, ontvangen via geautoriseerde kanalen, of het is een openbaar overheidsdocument), kunnen tools die de PDF server-side verwerken de tekst extraheren. Google Docs werkt vaak — upload naar Drive en open als een Google Doc. ParseJet kan dit ook aan, omdat het de PDF op zijn server verwerkt in plaats van client-side beperkingen te respecteren.
3. De tekst is weergegeven als vectorcontouren
Dit is een lastige. Sommige PDF's zien er perfect scherp en professioneel uit, maar de "tekst" bestaat eigenlijk uit vectorvormen — curves en paden die de omtrek van elke letter tekenen, in plaats van fontkarakters. Dit gebeurt wanneer een ontwerper exporteert vanuit Adobe Illustrator, InDesign of Figma met de optie "Converteer tekst naar contouren" ingeschakeld (vaak gedaan om fontlicentieproblemen te voorkomen).
Het resultaat ziet er op het scherm identiek uit aan echte tekst, maar voor de computer is elke letter een abstracte tekening — als een klein logo. Er zijn geen karakters om te selecteren of kopiëren.
Hoe herken je het: Zoom in tot 800%+ op een karakter. Echte tekst blijft perfect scherp omdat het wordt weergegeven vanuit een font. Gecontoureerde tekst blijft ook scherp (het is vector), maar je kunt geen individuele karakters selecteren — je cursor selecteert het hele tekstblok als één object, of helemaal niets. Een ander teken: de PDF-bestandsgrootte is ongebruikelijk groot voor een tekstrijk document, omdat vectorcontouren meer ruimte innemen dan font-weergegeven tekst.
Oplossing: Omdat de originele karaktergegevens verdwenen zijn, is OCR de enige manier om de tekst te herstellen. Upload de PDF naar ParseJet of Google Docs — de OCR-engine leest de visuele vormen en geeft echte tekstkarakters uit.
4. Aangepaste fontcodering zorgt ervoor dat tekst als wartaal plakt
Dit verschilt van niet kunnen selecteren — hier kun je tekst prima selecteren en kopiëren, maar bij plakken krijg je rommel: □□□□, willekeurige symbolen zoals "˙ˆ˜¯", of compleet verkeerde karakters. De PDF ziet er op het scherm prima uit omdat de viewer het ingebedde font gebruikt om het weer te geven, maar de onderliggende karaktercodes zijn niet-standaard.
Dit gebeurt wanneer de PDF-maker een subset van een font heeft ingebed dat een aangepaste coderingstabel gebruikt. In plaats van karaktercode 65 te mappen naar de letter "A" (standaard ASCII), kan het font code 65 mappen naar "Z" of een ander karakter. De viewer weet hoe het correct moet worden weergegeven met het font, maar kopiëren-plakken verwijdert de fontinformatie, waardoor je de ruwe (verkeerde) karaktercodes overhoudt.
Hoe herken je het: Selecteer een regel tekst, plak het in Kladblok of een andere platte tekst-editor. Als het resultaat onleesbaar is — symbolen, verkeerde letters of lege vierkantjes — is codering de oorzaak.
Oplossing: Standaard kopiëren-plakken kan dit niet oplossen omdat het probleem zit in hoe de karakters zijn opgeslagen. Tools die de interne fonttabellen van de PDF analyseren, kunnen de karakters terug mappen naar standaardcodering. ParseJet doet dit automatisch tijdens extractie. Je kunt ook proberen de functie "Opslaan als tekst" van Adobe Acrobat Pro te gebruiken, die soms codering beter oplost dan kopiëren-plakken.
5. Meerdere kolommen lay-out verstoort de tekstvolgorde
Dit is technisch gezien "kopiëren van tekst werkt" — maar het resultaat is onbruikbaar. In PDF's met twee of drie kolommen (gebruikelijk in academische papers, kranten, tijdschriften en nieuwsbrieven), pakt het selecteren van tekst met je cursor tekst van links naar rechts over de volledige paginabreedte. Regel 1 van kolom A wordt samengevoegd met regel 1 van kolom B, dan regel 2 van kolom A met regel 2 van kolom B, wat een afwisselende chaos creëert.
Tabellen hebben hetzelfde probleem. Wanneer je een tabel selecteert en kopieert, krijg je meestal celwaarden door elkaar in een onvoorspelbare volgorde, zonder duidelijke scheiding tussen rijen en kolommen.
Hoe herken je het: Selecteer tekst in een gebied met meerdere kolommen, plak het in een teksteditor en lees het. Als afwisselende regels van verschillende delen van de pagina lijken te komen, is lay-out het probleem.
Oplossing: Je hebt een tool nodig die kolommen detecteert en elk afzonderlijk in volgorde leest. Adobe Acrobat Pro heeft een "Leesvolgorde"-tool maar vereist handmatige correctie. ParseJet detecteert automatisch kolommen, tabellen en leesvolgorde en extraheert tekst in de juiste volgorde.
6. De PDF is beschadigd of onvolledig
Soms is het PDF-bestand zelf beschadigd — afgekapt tijdens een download (de bestandsgrootte is verdacht klein), gemaakt door buggy software, of gedeeltelijk overschreven. De viewer kan sommige of alle pagina's nog visueel weergeven, maar de interne tekstgegevens ontbreken of zijn kapot, waardoor selectie en kopiëren stilzwijgend mislukken.
Hoe herken je het: Controleer op waarschuwingsberichten bij het openen van de PDF ("Dit document is mogelijk beschadigd"). Vergelijk de bestandsgrootte met wat je zou verwachten — een rapport van 200 pagina's dat slechts 50 KB is, is vrijwel zeker beschadigd. Probeer het bestand in een andere viewer te openen (Chrome vs Adobe vs Preview) — als ze allemaal problemen hebben, is het bestand beschadigd.
Oplossing: Probeer eerst het bestand opnieuw te downloaden van de originele bron. Als dat niet mogelijk is, probeer het te openen in Google Chrome (die een relatief tolerante PDF-renderer heeft) en kopieer vandaar. Als laatste redmiddel kan ParseJet vaak tekst extraheren uit gedeeltelijk beschadigde PDF's die andere tools volledig laten falen, omdat het de ruwe PDF-byte stream verwerkt in plaats van te vertrouwen op een standaard PDF-renderpijplijn.
Samenvatting: hoe je jouw specifieke probleem identificeert en oplost
Kan helemaal geen tekst selecteren → Hoogstwaarschijnlijk een gescande afbeelding (#1), vectorcontouren (#3) of kopieerbeveiliging (#2). Probeer eerst Google Docs (gratis), daarna een speciaal hulpmiddel zoals ParseJet voor hardnekkige gevallen.
Tekst wordt geselecteerd maar plakt als wartaal → Aangepaste fontcodering (#4). Gebruik ParseJet of de functie "Opslaan als tekst" van Adobe Acrobat Pro om de karakters opnieuw te mappen.
Tekst wordt gekopieerd maar staat in de verkeerde volgorde → Lay-out met meerdere kolommen of tabellen (#5). Gebruik een lay-outbewuste extractietool zoals ParseJet.
Kan het bestand niet openen of sommige pagina's zijn leeg → Beschadigde PDF (#6). Download opnieuw van de bron, of probeer ParseJet dat gedeeltelijke beschadiging aankan.
Extraheer tekst uit elke PDF — zelfs degene waar je niet uit kunt kopiëren
ParseJet verwerkt gescande pagina's, kopieerbeveiliging, gebroken codering en complexe lay-outs. Upload je PDF en krijg schone tekst in seconden.
Extraheer tekst nu — gratis, geen aanmeldingVeelgestelde vragen
Waarom kan ik geen tekst in mijn PDF markeren of selecteren?
Hoogstwaarschijnlijk is de PDF een gescande afbeelding (geen echte tekst) of heeft het kopieerbeveiliging ingeschakeld. Gebruik ParseJet om de tekst te extraheren — het verwerkt beide gevallen automatisch via OCR en server-side verwerking.
Waarom plakt tekst uit mijn PDF als wartaal?
Dit gebeurt wanneer de PDF aangepaste fontcodering gebruikt die karakters mapt naar niet-standaard posities. ParseJet lost codering op tijdens extractie en geeft schone leesbare tekst terug.
Hoe weet ik of een PDF gescand of tekstgebaseerd is?
Probeer tekst met je cursor te selecteren. Als je individuele woorden kunt markeren, is het tekstgebaseerd. Als er niets wordt gemarkeerd of de hele pagina als één blok wordt geselecteerd, is het een gescande afbeelding.
Kan ik legaal tekst uit een beveiligde PDF kopiëren?
Als je legitieme toegang tot de inhoud hebt (je hebt het gekocht, het is een openbaar document, etc.), is het extraheren van tekst voor persoonlijk gebruik over het algemeen prima. ParseJet verwerkt bestanden server-side zonder wachtwoorden te kraken — het extraheert simpelweg de zichtbare tekstinhoud.
Waarom mengt kopiëren-plakken uit PDF's kolommen door elkaar?
PDF-viewers selecteren tekst van links naar rechts over de volledige paginabreedte, waarbij kolomgrenzen worden genegeerd. Gebruik een lay-outbewuste extractietool zoals ParseJet die kolommen detecteert en tekst in de juiste leesvolgorde extraheert.
Gerelateerde tools
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF to TXT File Converter
Convert PDF to a .txt file online for free. Get clean plain text output with no formatting — ready to save, import into databases, or process in data pipelines.
Start gratis met tekst extraheren
Geen aanmelding nodig. Parse je eerste bestand in seconden.