Text & Data Mining-Lizenz
SZ-Artikeldaten für Forschungszwecke
Wir bieten Ihnen mit unserer Lizenz für Text & Data Mining die Möglichkeit zur systematischen und softwarebasierten Auswertung von Artikeldaten der Süddeutschen Zeitung – inkl. passender Datenbereitstellung.
Mit Optionen für fokussiertes KI-Training und kommerzielle Nutzungen.

Unsere Leistungen
Profitieren Sie von erweiterten Rechten gegenüber gesetzlicher Schrankenbestimmungen sowie von passgenauen Datenlieferungen – die Vorteile unserer TDM-Lizenz auf einem Blick:
- automatisierte, computer- oder softwaregestützte Auswertung zur Gewinnung von Informationen insbesondere über Muster, Trends, Beziehungen und Korrelationen für wissenschaftliche Zwecke
- interne elektronische Speicherung und Vervielfältigung der Ergebnisse
- auf Anfrage: Rechte für das Training fokussierter KI-Anwendungen
- alle SZ-Artikeltexte seit 1945
- inkl. SZ-Magazin, jetzt, SZ.de, Landkreisausgaben
- weitere SWMH-Medien erhältlich
- jahrgangsweise Datensätze
- Artikeldaten im XML-Format
- FTP Pull oder Push vom SZ Archiv-Server
Ihre Lizenzanfrage
Schreiben Sie uns!
Schilderung Ihres Forschungsprojekts
- Anwendungsbereich (z. B. Sprachforschung, Korpuslinguistik, Computerlinguistik)
- Wie und zu welchem Zweck möchten Sie die Daten verarbeiten? (z. B. Textanalyse, Sentimentanalyse, Datenextraktion, Training von Sprachassistenzsystemen oder Chatbots)
- Welche Quellen interessieren Sie?
- Untersuchungszeitraum bzw. Erscheinungszeitraum der Artikel
- Nutzerkreis und Nutzungsdauer
- Verwenden Sie bei der Datenverarbeitung KI-Technologien? (z. B. Machine Learning, NLP)
- Projektfinanzierung
Häufige Fragen
Was ist der urheberrechtliche Hintergrund von Text & Data Mining?
Das am 07.06.2021 in Kraft getretene Gesetz zur Anpassung des Urheberrechts an die Erfordernisse des digitalen Binnenmarktes enthält Regelungen zu Nutzungserlaubnissen für das Text & Data Mining (§ 44b UrhG, § 60d UrhG). Gemäß § 60d UrhG ist die automatisierte Auswertung (Text & Data Mining) von urheberrechtlich geschützten Texten zu wissenschaftlichen Zwecken ohne vorherige Freigabe durch Rechteinhaber nur nicht-kommerziellen Forschungsorganisationen (z. B. Hochschulen, Forschungsinstitute) und einzelnen Forschenden erlaubt. Hierbei sind jedoch Einschränkungen etwa durch Löschpflichten oder beim Nutzerkreis zu beachten.
Die Süddeutsche Zeitung GmbH – wie auch die weiteren Verlage der SWMH – behalten sich eine Nutzung ihrer Inhalte für kommerzielles Text & Data Mining (TDM) im Sinne von § 44b UrhG ausdrücklich vor.
Umfasst Text & Data Mining das Training generativer Künstlicher Intelligenz?
Diese Frage ist aktuell Gegenstand zahlreicher Diskussionen. Derzeit gibt es jedoch keine gesetzliche Grundlage für eine Nutzung von journalistischen Inhalten zum Training generativer KI-Anwendungen. Wir teilen die Ansicht, dass die Ausnahmebestimmung des § 44b UrhG „Text und Data Mining“ hier nicht herangezogen werden kann und die Verarbeitung von journalistischen Inhalten unter Einsatz von generativer KI deutlich über Text & Data Mining-Anwendungen hinaus geht und daher grundsätzlich genehmigungs- und damit lizenzpflichtig ist. Gerne beraten wir Sie zu unseren KI-Optionen als Ergänzung zu einer TDM-Lizenz.