Ryte

Mehr erfahren
AdWords, KMU, wir machen den Unterschied!
Mehr erfahren

Ab wann ist ein Text ein Plagiat?

Internet  |   |  , 10:30 Uhr  |  39 Kommentare

Die aktuelle Diskussion um die gegenüber Karl-Theodor zu Guttenberg gemachten Plagiatsvorwürfe zum Anlass genommen, werfen die Frage auf, wann man einen Text als den `eigenen´ bezeichnen kann? Da auch Suchmaschinen Texte auf ihre Einzigartigkeit hin prüfen, möchten wir mit einer Umfrage herausfinden, ab welchen Prozentsatz der Übereinstimmung mit einem bereits existierenden Text ein neuer Text als `Plagiat´ betrachtet werden muss…

Hier zunächst ein Beispieltext aus der Doktorarbeit zu Guttenbergs:

Dissertation

In deren Plädoyer für einen amerikanischen Bundesstaat lebt die damals geführte Diskussion wieder auf und es sind prinzipielle Überlegungen über die Probleme zu finden die Einigungsprozesse von solcher Größenordnung aufwerfen. Zudem ist eine Stringenz der Argumentation zu erkennen, die verwundern muss, wenn man die Entstehungsgeschichte der „Papers“ bedenkt.

Original

In deren Plädoyer für einen amerikanischen Bundesstaat lebt die damals geführte Diskussion wieder auf, doch nicht nur das: Hier sind prinzipielle Überlegungen über die Probleme zu finden, die Einigungsprozesse von solcher Größenordnung aufwerfen. Und es ist eine Stringenz der Argumentation zu erkennen, die verwundern muss, wenn man die Entstehungsgeschichte der „Papers“ bedenkt.

Wie man unschwer erkennen kann, hat zu Guttenberg den Text seiner Dissertation mehr oder weniger vom Original, einem 1997 veröffentlichten Artikel in der FAZ abgeschrieben. Da möglicherweise auch Suchmaschinen diese Methode zur Plagiatserkennung verwenden, streichen wir zur Ermittlung des genauen Prozentsatzes der Übereinstimmung einfach einmal sämtliche Füllwörter aus beiden Texten:

Dissertation

Plädoyer, amerikanischen, Bundesstaat, lebt, geführte, Diskussion, prinzipielle, Überlegungen, Probleme, finden, Einigungsprozesse, Größenordnung, aufwerfen, Stringenz, Argumentation, erkennen, verwundern, muss, Entstehungsgeschichte, Papers, bedenkt.

Original

Plädoyer, amerikanischen, Bundesstaat, lebt, geführte, Diskussion, prinzipielle, Überlegungen, Probleme, finden, Einigungsprozesse, Größenordnung, aufwerfen, Stringenz, Argumentation, erkennen, verwundern, muß, Entstehungsgeschichte, Papers, bedenkt.

Durch das Streichen der Füllwörter haben beide Texte eine Übereinstimmung von 100%! Obwohl Karl-Theodor zu Guttenberg den Text für sein Verständnis möglicherweise ausreichend verändert hat, hat er ihn aus Sicht einer Suchmaschine tatsächlich 1zu1 aus der FAZ übernommen.

Hätte zu Guttenberg die Hälfte der für einen Text wirklich aussagekräftigen Wörter geändert, hätten beiden Texte nur noch eine Übereinstimmung von 50%, hätte er drei Viertel der Wörter anders geschrieben, nur noch eine von 25% usw.

Ab welchem Prozentsatz der Übereinstimmung seid Ihr unter Verwendung beschriebener Vorgehensweise der Meinung, dass ein Text nicht mehr als unique, also als Plagiat ansehen werden muss?

Ab wann ist ein Text ein Plagiat?

  • Ab einer Übereinstimmung von 50% (25%, 276 Votes)
  • Ab einer Übereinstimmung von 30% (13%, 141 Votes)
  • Ab einer Übereinstimmung von 60% (12%, 128 Votes)
  • Ab einer Übereinstimmung von 90% (11%, 124 Votes)
  • Ab einer Übereinstimmung von 70% (11%, 118 Votes)
  • Ab einer Übereinstimmung von 10% (10%, 108 Votes)
  • Ab einer Übereinstimmung von 40% (8%, 83 Votes)
  • Ab einer Übereinstimmung von 80% (6%, 61 Votes)
  • Ab einer Übereinstimmung von 20% (5%, 59 Votes)

Total Voters: 1.098

Loading ... Loading ...

Eure SEO-united.de Blogger
Sie befinden sind hier: Ab wann ist ein Text ein Plagiat?

Kommentare zu Ab wann ist ein Text ein Plagiat?:

  1. Viktor says:

    Also ein Plagiat ist für mich, wenn einzelne Sätze oder Passagen Wort für Wort übernommen sind. Umgestellte bzw. neu formulierte Sätze sind dagegen in Ordnung, sonst wäre ja fast jeder Text ein Plagiat.

  2. eric says:

    @gretus: Ein Prozentsatz ist ’ne gute Idee – irgendwelche Richtwerte braucht man schon. Und ich denke, es ist auch wichtiger, die Kernwörter zu betrachten als die Füllwörter. Schon allein, weil wir nach einer vernünftigen Keyword-Recherche ja ohnehin einen Text ändern würden…

    @markus: Ich finde, du hast ganz recht, dass dies auch von dem Inhalt und der Textart abhängig ist. Für Google News ist es bumsegal, ob der Text 100 % Duplicate ist, für einen Info-Text natürlich nicht. Andererseits ist es immer eine gute Idee, einen mittleren Maßstab zu haben – von dem aus man dann schön die Differenzierungen zu individuellen Texten zu entdecken.

    Deshalb finde ich die Frage hier auch super-interessant. Und ich freue mich auf viele Erfahrungs-Kommentare der Kollegen und Kolleginnen.

    Eine Erfahrung habe ich ja schon rein geworfen: Für Google News ist es egal. Und für ein „Mittelmaß“ habe ich noch von irgendeinem Test den Wert in Erinnerung, dass 20 % uniquer Content für die Suchmaschine ausreicht. Ich weiß nicht mehr, woher – vielleicht findet noch jemand die Quelle. Erfahrungsgemäß würde ich allerdings sagen, dass das nicht reicht. Und, Markus, weil du die moralische Sicht angesprochen hast: Für einen aufrechten Umgang mit Inhalten reichen 20 % allemal nicht! (Siehe Gutti…)

  3. Markus says:

    Du fragst, ab wann ein Text ein Plagiat ist? Ich frage (rhetorisch) zurück: Welcher absolute Umfang und welche Art von Text? 5 Zeilen oder 500 Seiten? Blogpost oder Dissertation? Aus wissenschaftlicher Sicht? Aus (urheber) rechtlicher Sicht? Gesetze welchen Landes? Aus Suchmaschinen-Sicht? Welche Suchmaschine?

    Oder geht es um die rein persönliche Sicht? Und ist Umformulieren immer ok? Auch moralisch? Also (xy%) Textklau geht noch bzw. nicht mehr, aber „Gedankenklau“ ohne Nennung der Inspirationsquelle ist kein Thema? Oder sollte (im Extremfall) sogar auf Twitter mit via @xyz auf den „Aufmerksam-Macher“ hingewiesen werden (müssen)?

    Will sagen: Spannende Frage, aber differenzierte Betrachtung notwendig. Und Beantwortung mit einfachen Prozentsätzen m. E. unmöglich bzw. wenig aussagekräftig. Deshalb wäre es interessant, weitere Kommentare zu „hören“.

    • Gretus says:

      Hallo,

      da wir hier ein SEO Blog sind, spielt der Beitrag natürlich auf Duplicate Content an. Man kann also auch fragen, ab welchem Prozentsatz wertet Google einen Text als DC?

      Man neigt immer dazu, das Ganze viel zu kompliziert so sehen. Die Betreiber von Suchmaschinen überlegen nicht, wie man einen Text `am Besten´ als DC einstufen kann (Übereinstimmung der Schlüsselbegriffe, Übereinstimmung bestimmter Füllwörter, Reihung der einzelnen Begriffe, Genre des Textes, Länge des Textes usw.), sondern wie können wir es schaffen, auf dem `einfachsten Weg´ bzw. mit einer möglichsten `geringen Fehlerquote´ doppelte Inhalte zu ermitteln?

      Es könnte anders ausgedrückt also sein, dass Google die Anzahl bzw. Reihung der Keywords schon reicht…

      Grüße

      Gretus

  4. Raymond Appels says:

    Die Frage „Ab wann ist ein Text ein Plagiat?“ kann so nicht gestellt werden. Wie Eric schon erwähnt kommt es auch darauf an, wie und welche Füllwörter verwendet werden, weil eine oder wenige die ganze Bedeutung des Textes schon ändern können.

    Im obigen Beispiel ist es schon ziemlich eindeutig. Bei vielen Überprüfungen wird möglicherweise eine softwareseitige Lösung ausreichen. Der Anwalt, von dem ich Rechtslehre bekommen habe, sagte aber immer: „Es hängt davon ab!“

    Was ist ein Plagiat? Wie viele Wörter müssen bei der Plagiatprüfung in einem zu vergleichenden Textabschnitt enthalten sein? Wann ist es ein Zitat und wie viele Wörter dürfen zitiert werden? Viele Fragen können in diesem Rahmen gestellt werden, die zu der korrekten Beantwortung notwendig sind.

    Wenn hier nur softwaretechnisch vorgeht, passieren ähnlichen Sachen, wie bei der PR Abstufung dieses Blogs.

    Fazit: Ich denke, die Frage lässt sich so nicht beantworten. Prinzipiell sage ich aber ein Plagiat ist 100% kopiert und nicht 90%.

    Liebe Grüße aus Viersen
    Raymond

  5. eric says:

    Ist „Zudem ist keine Stringenz der Argumentation zu erkennen“ ein Plagiat zu „Zudem ist eine Stringenz der Argumentation zu erkennen“? (ich habe aus „keine“ „eine“ gemacht). Ne, oder?

    Was ich damit sagen möchte: Die „Füllwörter“ sind bei der Erkennung eines Plagiats nicht nur Füllmaterial sondern können sehr wichtig sein – das sehen auch die Suchmaschinen so. Deshalb zählen die Duplicate-Content-Erkennungen nicht einfach die Keywords durch. Diese Annahme ist nicht korrekt. Ist ja auch einleuchtend: Sonst wären ja viele Artikel auf seo-book.de zu vielen Artikeln auf seo-united.de Plagiate (und anders herum) – weil wir die gleichen Wörter verwendet haben. Allerdings können die Inhalte trotz gleicher Wörter sehr unterschiedlich sein…

    Wenn man sich copyscape.com anschaut, sieht man, dass eher komplette Sätze (bzw. andere Wort-Kombinationen) miteinander verglichen werden und keine statistische Zahlen.

    Das vielleicht als Erweiterung deiner Frage. Denn ein reines Verändern der Nicht-Füllwörter ist nicht die einzige Strategie zum Ent-Duplicaten von Inhalten. ;-)

    • Gretus says:

      Hallo eric,

      das es mehrere Möglichkeiten zur Plagiatserkennung gibt, ist klar. Entscheidend ist vielleicht z.B. auch die Reihenfolge der verwendeten Schlüsselbegriffe (oben zu 100% gleich). Den genauen Algorithmus von z.B. copyscape.com kenne ich nicht, sinnvollerweise sollte man meiner Meinung nach aber schon eine Unterscheidung zwischen Füll- und sonstigen Wörtern machen. Wie auch immer, in Bezug auf den gefragten Prozentsatz einer wie auch immer gearteten Übereinstimmung ist die Vorgehensweise erst einmal zweitrangig…

      Grüße

      Gretus

      • DoFollowBlogger says:

        Howdy,

        OK, gerade gesehen, dass Ihr tatsächlich alle Kommentar-Links nachträglich mit NoFollow versehen habt. Jeder ist sein freier Herr im Web, deswegen will ich da auch gar nicht lang & groß draufrum reiten, ist halt Eure Entscheidung. Doch eine Botschaft würde ich schon ganz gerne da lassen, bevor ich diesen SEO-Blog verlasse. (Ja, ich werde hier wahrscheinlich nicht mehr aktiv kommentieren, weil mich diese Umstellung als Viel-Kommentierer beleidigt hat). Meine Botschaft an SEO-united.de lautet: respect yourself!

        Warum? Wer anderen keinen DoFollow-Link als kleine Belohung gönnt, der respektiert nicht, dass sich dieser jemand gerade freiwillig (!) Zeit genommen hat, sich Gedanken zu Eurem Content zu machen, um dann einen interessanten Beitrag FÜR EUCH zu verfassen. Und man muss nicht gerade Psychologie studiert haben, um zu wissen: Wer andere nicht respektiert, der respektiert in Wirklichkeit auch sich selbst nicht.

        Jetzt werdet Ihr wahrscheinlich zu eurem Schutz sagen, dass Ihr wegen des PageRanks umgestellt habt. Was ist Euch wichtiger: PageRank oder Seitenaufrufe? Haltet Ihr uns für doof? Wir wissen doch genau weshalb Ihr ab heute ein NoFollow-Blog seid: Ihr habt umgestellt, weil Ihr vermutlich einfach nur Bammel vor SEO.de habt, die Euch mit sicheren Schritten immer näher auf die Pelle rücken. Aber auch hier habe ich eine Botschaft für Euch: keep cool!!!

        GrusS DoFollowBlogger
        stay doFollow

1 2 3 6

Jetzt zu "Ab wann ist ein Text ein Plagiat?" kommentieren:




Ihre Agentur noch nicht dabei?


Ihre Agentur noch nicht dabei?