Alte SPARTAKIST-Ausgaben als PDFs

Bei RapidShare kann man die Ausgaben von SPARTAKIST, der Zeitung der Spartakist-Arbeiterpartei Deutschlands (SpAD), deutsche Sektion der Internationalen Kommunistischen Liga (Vierte Internationalisten) von Nr. 68 (1990) bis Nr. 140 (2000) in sechs Zip-Dateien (mit jeweils 10 bis 35 MB Größe) downloaden. Die Zeitungen sind jeweils per OCR-Scan in PDFs umgewandelt worden.

Auf Wunsch stelle ich auch eine CD zur Verfügung, auf der alle Ausgaben eine Stichwortsuche mit Volltextindex haben.

[Das Downloaden geht bis auf weiteres nicht, ich muß die Dateien erst wieder neu hochladen.]


5 Antworten auf „Alte SPARTAKIST-Ausgaben als PDFs“


  1. 1 tschack 18. Oktober 2006 um 0:15 Uhr

    also die pdfs der ersten zip-datei sind sehr lückenhaft. teilweise sind überschriften nicht vorhanden und es fehlen viele textzeilen. die informationen scheinen aber doch in den dateien zu sein, denn wenn man alles makiert, kopiert und in word einfügt, gibts deutlich mehr. ist das bei den anderen zips auch so?

  2. 2 Neoprene 18. Oktober 2006 um 7:16 Uhr

    Erstens erstaunt mich, daß bei RapidShare jetzt nur noch die erste Datei überhaupt vorhanden ist. Bei den weiteren heißt, „Diese Datei wurde gelöscht. Grund: Seit längerer Zeit kein Download mehr.“ Die sind aber erst ein paar Tage online gewesen. Seis drum, das läßt sich beheben.

    Dein Problem kann ich nicht nachvollziehen: Ich habe alle Ausgaben der Datei 68-80 Seite mit FoxIt 1.3 und zum Teil auch noch mit Acrobat Reader 7.0.8 für Seite durchgeblättert und außer dem langsamen Seitenaufbau, der dem zeilenweisen Seitenaufbau der OCR-Software geschuldet ist, keine einzige fehlende Überschrift gehabt. Was ich aber auch schon feststellen mußte war, daß eine Transformation der PDFs nach MS Word mit FineReader, dem Programm, mit dem auch die OCRs gemacht worden sind, zu genau deinem Egebnis führen: Teils fehlen Überschriften, teils ganze Zeilen oder Absätze. Der Support von ABBYY, dem Hersteller von FineReader hat leider noch nicht reagiert.

    Wenn du die genaue Ausgabe und Seite nennst, kann ich versuchen, das nachzuvollziehen und weitermelden.

  3. 3 Neoprene 18. Oktober 2006 um 8:53 Uhr

    Nachtrag (Bei RapidShare gefunden):
    „(yes, we have a space-problem right now, so the inactivity-timeout of 30 days for free users had to be shortened to 10 days. This is better than to disable the uploads completely.)“ Bei mir war es aber nicht mal ne Woche, blöd auch.

  4. 4 tschack 19. Oktober 2006 um 13:19 Uhr

    nehmen wir z.b. mal spk nr 80: auf seite 3 fehlt oben die überschrift, die bildunterschrift und an die 50 textzeilen.
    vielleicht liegts ja daran, dass ich acrobat pro 6.0 verwende. aber normalerweise müsste es entweder völlig kompatibel sein oder eben gar nicht.

  5. 5 Neoprene 19. Oktober 2006 um 13:34 Uhr

    Du solltest probehalber auch noch andere Reader ausprobieren, bei mir haben ja zwei andere ja dein Ergebnis nicht erbracht. Auch in Acrobat 4 und 5 ließen sich die immer anschauen, aber wer weiß, was da die Macke ist.

Antwort hinterlassen

XHTML: Du kannst diese Tags benutzen: <a href=""> <abbr title=""> <acronym title=""> <b> <blockquote> <code> <em> <i> <strike> <strong>


− drei = vier