LaTeX: Kopieren von Text aus PDF, Kompilieren nicht möglich

A

Angry Onion

Mitglied
Thread Starter
Dabei seit
14.08.2014
Beiträge
25
Reaktionspunkte
1
Guten Abend,

ich möchte einen Text aus einer PDF-Datei kopieren und in eine .tex-Datei einfügen und diese dann kompilieren.
ich nutze
Code:
\usepackage[utf8]{inputenc}

Es kommt dann folgende Fehlermeldung:
! Package inputenc Error: Unicode char \u8:̈ not set up for use with LaTeX.

Exakt das selbe .tex-Dokument lässt sich unter Windows erfolgreich kompilieren.
Und wenn ich sämtliche Umlaute und Sonderzeichen des Dokumentes am Mac manuell lösche und neu eintippe, kann ich das Dokument auch am Mac kompilieren.

Wäre schön, wenn ich es irgendwie zum laufen bekommen würde, bin für jeden Tipp dankbar.

Schöne Grüße,

Yannic
 
Das Problem dürfte darin liegen, dass Umlaute einmal als komplettes Zeichen vorliegen können und mal zusammengesetzt (z.B. ü aus u und den Punkten). LaTeX kann mit letzteren nichts anfangen, der Editor oder andere Textprogramme können das zusammengesetzte ü allerdings anzeigen und so das Problem verschleiern. Wenn beim Kopieren nun im einem Fall das komplette ü in der Zwischenablage landet und im anderen Fall das zusammengesetzte ü, kann der erste Text problemlos gesetzt werden, letzterer jedoch nicht. Wie das gehandhabt wird, hängt vermutlich vom Betriebssystem und/oder pdf-Betrachter ab.

In deinem Fall würde ich einfach alle Umlaute der Reihe nach durchgehen (nicht vergessen, es gibt nicht nur ü sondern auch Ü usw.) und per Suchen/Ersetzen durch die korrekten Umlaute ersetzten. Damit die zusammengesetzten Umlaute auch korrekt im Suchfeld stehen, würde ich die per Kopieren/Einfügen aus dem Text übernehmen.
 
Vielen Dank für die schnelle Antwort!
Da man das selbe Textdokument und Windows kompilieren kann, liegt es ja vermutlich am LaTeX-Compiler für Mac oder?

Ich besuche zur Zeit einen LaTeX-Kurs, in dem ich jetzt wöchentlich mit dieser Copy-Paste-Methode arbeiten muss.
Schade, dass es keine einfachere Lösung gibt.

Ich habe es bereits mit verschiedenen Editoren (Atom, Vim) und versch. Pdf-Readern (Adobe Reader, Vorschau) versucht.
 
Also das .tex-Dokument sieht wie folgt aus:
Code:
\documentclass{article}
\usepackage[utf8]{inputenc}
\begin{document}
Die Würde des Menschen ist unantastbar. Sie zu achten und zu schützen ist Verpflichtung aller staatlichen Gewalt.
La France est une République indivisible, laïque, démocratique et sociale. Elle assure l’égalité devant la loi de tous les citoyens sans distinction d’origine, de race ou de religion. Elle respecte toutes les croyances. Son organisation est décentralisée.
Todas las personas nacidas en territorio español. Los hijos de padre o madre españoles, aunque hayan nacido fuera de España. Los extranjeros que hayan obtenido carta de naturaleza.
\end{document}

Hier die Datei:

ich kompiliere über das Terminal mit dem Befehl
Code:
pdflatex aufg1.tex
 
Hallo,
nur mal so eine Idee: mit dem Befehl \usepackage[utf8] sagst Du dem TeX-Compiler, welche Codierung der Text hat. Davon völlig unabhängig musst Du das natürlich auch dem Editor beibringen, mit dem Du die TeX-Datei erstellst…
Peter
 
Hallo,
nur mal so eine Idee: mit dem Befehl \usepackage[utf8] sagst Du dem TeX-Compiler, welche Codierung der Text hat. Davon völlig unabhängig musst Du das natürlich auch dem Editor beibringen, mit dem Du die TeX-Datei erstellst…
Peter
Der Editor speichert die .tex-Datei UTF8 codiert.
Kann man das irgendwie überprüfen?
 
Also bei mir funktioniert das Beispieldokument.

Wenn du wirklich das identische Dokument vom Mac auf einen Windows PC überträgst und dort kompilieren kannst, kann es eigentlich auch nicht an einer falschen Kodierung der Datei liegen, denn die Kodierung ändert sich durch den Kopiervorgang nicht.

Nochmal zur Klarstellung: Du kopierst unter OS X Text aus einer pdf-Datei in eine tex-Datei und bekommst unter OS X diesen Fehler. Kopierst du genau diese tex-Datei aber auf einen Windows-PC und setzt sie, kompiliert er sie? Dann sieht mir das nach einem Bug aus.
Solltest du beim Test unter Windows jedoch nicht die tex-Datei kopieren sondern eine neue tex-Datei erstellen, indem du den Text unter Windows aus dem gleichen pdf in eine tex-Datei kopierst, dann kann dieser Unterschied auftreten (siehe oben).

Edit: Okay, ich habe die angehängte Datei übersehen, die wird in der Tat nicht korrekt kompiliert. Soll heißen, bei mir werden die Umlaute ü zu einem u und die ganzen Akzente fehlen. Der hier gepostete Quelltext funkioniert allerdings.

PS: Ein LaTeX-Kurs, in dem man Quelltext per Kopieren-Einfügen einfach nur ins eigene Dokument einbaut, hört sich für mich nicht sehr sinnvoll an. Ich kann mir nicht vorstellen, dass man durch bloßes Kopieren-Einfügen besonders viel lernt. Ähnlich wie man durch das Abschreiben von Aufgabenlösungen wenig lernt. Wenn du einfach nur Blindtext haben willst, dafür gibt es Pakete in LateX, die definieren Kommandos, mit denen man Blindtext einfügen kann (google hilft).
 
Zuletzt bearbeitet:
Genau,

also genau die .tex-Datei, die ich hier verlinkt habe, wird unter Windows kompiliert.

Komisch, komisch alles.
Vielen Dank für die Hilfe, ich werde es wohl so hinnehmen müssen.
 
Hallo,
das Problem kann ich bei mir mit beliebigem Text aus PDF-Dateien reproduzieren. Meine Vermutung geht in die Richtung von @TEXnician: Umlaute werden entweder als ein Zeichen betrachtet (= UTF8-NFC) oder als zusammengesetztes Zeichen (= UTF8-NFD). Mindestens das Dateisystem von Mac OS X verwendet die zweite Version, weshalb WebDAV auf Windows- und Linux-/Unix-Servern nicht wirklich funktioniert. Ich denke mir, dass die Zwischenablage dann wohl ähnlich arbeitet…
Peter
 
Umlaute werden entweder als ein Zeichen betrachtet (= UTF8-NFC) oder als zusammengesetztes Zeichen (= UTF8-NFD)
Das ist das Stichwort! Ich habe nochmal ein bisschen weitergesucht und allem Anschein nach liegt es an der OS X Zwischenablage. Ich werde mich also damit anfreunden müssen.

PS: Ein LaTeX-Kurs, in dem man Quelltext per Kopieren-Einfügen einfach nur ins eigene Dokument einbaut, hört sich für mich nicht sehr sinnvoll an. Ich kann mir nicht vorstellen, dass man durch bloßes Kopieren-Einfügen besonders viel lernt. Ähnlich wie man durch das Abschreiben von Aufgabenlösungen wenig lernt. Wenn du einfach nur Blindtext haben willst, dafür gibt es Pakete in LateX, die definieren Kommandos, mit denen man Blindtext einfügen kann (google hilft).
Es wird natürlich nicht der Quelltest vorgegeben, denn natürlich würde das das Ziel verfehlen.
Lediglich der Inhalt des Dokuments wird vorgegeben, Formatierung und Arbeiten mit LaTeX muss dann am Inhalt noch geübt werden.
 
Zurück
Oben Unten