Text & Data Mining

Text & Data Mining-Lizenz

SZ-Artikeldaten für Forschungszwecke

Wir bieten Ihnen mit unserer Lizenz für Text & Data Mining die Möglichkeit zur systematischen und softwarebasierten Auswertung von Artikeldaten der Süddeutschen Zeitung – inkl. passender Datenbereitstellung.

Mit Optionen für fokussiertes KI-Training und kommerzielle Nutzungen.

Lizenzanfrage stellen

Unsere Leistungen

Profitieren Sie von erweiterten Rechten gegenüber gesetzlicher Schrankenbestimmungen sowie von passgenauen Datenlieferungen – die Vorteile unserer TDM-Lizenz auf einem Blick:

Rechteumfang

automatisierte, computer- oder softwaregestützte Auswertung zur Gewinnung von Informationen insbesondere über Muster, Trends, Beziehungen und Korrelationen für wissenschaftliche Zwecke
interne elektronische Speicherung und Vervielfältigung der Ergebnisse
auf Anfrage: Rechte für das Training fokussierter KI-Anwendungen

Quellen & Inhalte

alle SZ-Artikeltexte seit 1945
inkl. SZ-Magazin, jetzt, SZ.de, Landkreisausgaben
weitere SWMH-Medien erhältlich

Datenbereitstellung

jahrgangsweise Datensätze
Artikeldaten im XML-Format
FTP Pull oder Push vom SZ Archiv-Server

Ihre Lizenzanfrage

Wir stimmen unser Text & Data Mining-Lizenzangebot speziell auf Ihre Bedürfnisse ab. Schildern Sie uns dazu Ihr Vorhaben möglichst genau.

Schreiben Sie uns!

Schilderung Ihres Forschungsprojekts

Anwendungsbereich (z. B. Sprachforschung, Korpuslinguistik, Computerlinguistik)
Wie und zu welchem Zweck möchten Sie die Daten verarbeiten? (z. B. Textanalyse, Sentimentanalyse, Datenextraktion, Training von Sprachassistenzsystemen oder Chatbots)
Welche Quellen interessieren Sie?
Untersuchungszeitraum bzw. Erscheinungszeitraum der Artikel
Nutzerkreis und Nutzungsdauer
Verwenden Sie bei der Datenverarbeitung KI-Technologien? (z. B. Machine Learning, NLP)
Projektfinanzierung

Angebot anfordern

Häufige Fragen

Was ist der urheberrechtliche Hintergrund von Text & Data Mining?

Das am 07.06.2021 in Kraft getretene Gesetz zur Anpassung des Urheberrechts an die Erfordernisse des digitalen Binnenmarktes enthält Regelungen zu Nutzungserlaubnissen für das Text & Data Mining (§ 44b UrhG, § 60d UrhG). Gemäß § 60d UrhG ist die automatisierte Auswertung (Text & Data Mining) von urheberrechtlich geschützten Texten zu wissenschaftlichen Zwecken ohne vorherige Freigabe durch Rechteinhaber nur nicht-kommerziellen Forschungsorganisationen (z. B. Hochschulen, Forschungsinstitute) und einzelnen Forschenden erlaubt. Hierbei sind jedoch Einschränkungen etwa durch Löschpflichten oder beim Nutzerkreis zu beachten.

Die Süddeutsche Zeitung GmbH – wie auch die weiteren Verlage der SWMH – behalten sich eine Nutzung ihrer Inhalte für kommerzielles Text & Data Mining (TDM) im Sinne von § 44b UrhG ausdrücklich vor.

Umfasst Text & Data Mining das Training generativer Künstlicher Intelligenz?

Diese Frage ist aktuell Gegenstand zahlreicher Diskussionen. Derzeit gibt es jedoch keine gesetzliche Grundlage für eine Nutzung von journalistischen Inhalten zum Training generativer KI-Anwendungen. Wir teilen die Ansicht, dass die Ausnahmebestimmung des § 44b UrhG „Text und Data Mining“ hier nicht herangezogen werden kann und die Verarbeitung von journalistischen Inhalten unter Einsatz von generativer KI deutlich über Text & Data Mining-Anwendungen hinaus geht und daher grundsätzlich genehmigungs- und damit lizenzpflichtig ist. Gerne beraten wir Sie zu unseren KI-Optionen als Ergänzung zu einer TDM-Lizenz.

Sie haben noch Fragen?

Wir beraten Sie gerne zu unserer Text & Data Mining-Lizenz.