Similarity Texter

Additional Information

DIE HOCHMÜTIGE DOHLE UND DER PFAU

Einst lebte eine Dohle, voll von eitlem Stolz, die stahl sich Federn, die dem Pfau entfallen warn und putzte sich damit. Das eigne Dohlenvolk ver- achtend trat sie in der schönen Pfauen Reihn. Der Unver- schämten reißt man hier die Federn aus, jagt sie mit Schnäbeln. Und die Dohle, bös verbleit will wieder nun betrübt zu ihrem Volk zurück. Die aber stoßen sie von sich, mit herbem Schimpf. Und eine derer, die zuvor verachtet, sprach zu ihr “Hätt’ unsre Lebensart dir vormals conveniert, hätt’st du, was die Natur dir schenkte, akzeptiert, dann wär dir weder jene Schande widerfahrn noch müsstest du zum Unglück jetzt verstoßen sein.”

Diese Version von Aesops Fabel ist aus Wilfried Strohs Sammlung von Übersetzungen von Jan Novák: “Aesopia”, die auf Geschichten von Phaedrus basieren.

Testmethodik 2007

Um Plagiatserkennungssoftware zu testen, haben wir eine Sammlung von Testfllen konstruiert. Diese sind kurze Aufstze, von denen wir wissen wie plagiiert wurde, wieviel plagiiert ist, und welches die Quellen sind. Wir haben verschiedene Plagiatstechniken eingesetzt und haben dabei versucht, die ganze Bandbreite anzuwenden. Es wurden auch Plagiate von Bchern und CDs beigemischt sowie bersetzungsplagiate angefertigt, aber auch Originale hergestellt. Weiter unten auf dieser Seite ist eine genaue Auflistung der Plagiate. Da wir die Testflle als bungen fr die Lerneinheit „Fremde Federn Finden“ einsetzen, war es notwendig, die Erlaubnis von allen Urhebern einzuholen, damit die Ergebnisse publiziert werden knnen.

Wir haben dann Namen von potentiellen Testkandidaten ermittelt und um Zugnge fr einen Test beim Hersteller nachgefragt. Viele haben sofort geantwortet, andere haben zwar versprochen, sich darum zu kmmern, aber nicht mal auf Nachfrage gelang es uns, dort einen Testaccount zu bekommen. Die kostenlosen Dienste haben wir ohne Anmeldung verwendet. Insgesamt gab es 25 Kandidaten, von denen zwei Code-Vergleichs-Systeme und eines ein Collusion-Erkennungssystem war. Von den 22 identifizierten Plagiatserkennungssystemen waren zwei identisch und nur unter anderen Namen vermarktet (turnitin und iThenticate). Es blieben 21 Systeme, von denen wir aus verschiedenen Grnden 7 nicht testen konnten – die Grnde sind im Testbericht vermerkt.

Wir haben die Testflle als .doc, .html, .pdf und als .txt vorhanden gehabt, damit jedes System genau das Material so bekommen konnte, wie es es brauchte. Alle 20 Testflle wurden dem System gleichzeitig zum Testen angeboten. Ein Fall hat im Dateinamen einen Umlaut, um zu sehen, ob die Systeme damit zu Recht kommen knnen. Eine Kopie der Datei ohne Umlaut im Namen wurde verwendet, wenn es nicht mit dem Umlaut-Namen klappte.

Wir haben die Zeit gemessen, die bentigt wurde um die Suche durchzufhren (inkl. der Zeit, um die Dateien hochzuladen) und unser subjektives Empfinden bei der Verwendung der Sites notiert. Als die Ergebnisse vorlagen, wurden die einzelnen Berichten analysiert. Wir haben versucht, die Position einer Nicht-Informatik-Lehrkrafts einzunehmen, um zu entscheiden, ob wir die Ergebnisse als korrekt (Erkennung ob Plagiat oder Nicht-Plagiat) werten konnten. Die Kriterien fr die Bewertung sind auf einer getrennter Seite beschrieben.

Nach Abschlu der Analyse gab es einen zweiten Durchgang, da viele Systeme „aktualisierte“ Versionen fr Ende August angekndigt hatten. Wir haben diese erneut getestet und als Gesamtnote den Durchschnitt aus beiden Durchgngen gebildet. Auch fanden sich neue Systeme, die ebenfalls mitgetestet wurden.

Es folgte eine Gesamtdurchsicht der Bewertungen, fr einen Testfall (Nr. 6) wurde die Bewertung umgestellt und alle Ergebnisse entsprechend korrigiert. Dann wurde geschaut, dass alle Systeme an einigermaen gleichen Mastben gemessen wurden, bevor die Rangliste mit der Einteilung in Gteklassen aufgestellt wurde.

Testflle

Die folgende Testfllen wurden bei dem Test der Plagiatssoftware 2007 verwendet. Die Testfllen 0-9 wurden bereits fr den Test 2004 erstellt und befinden sich daher gelegentlich in Datenbanken von Plagiatserkennungssoftware – ohne Erlaubnis, versteht sich, denn es wurde explizit damals gebeten, die Testflle wieder zu tilgen. Durch eine Missachtung der Suchmaschinendirektiven wurden ausserdem teilweise diese Texte in Suchmaschinen-Datenbanken vorrtig gehalten, sie sind inzwischen durch persnliche Intervention wieder bereinigt.

  1. Schaltjahr
    Dieser Aufsatz ist ein Originalaufsatz, der fr den ersten Test 2004 erstellt wurde, daher ist er gelegentlich im Google-Archiv zu finden. Mindestens ein Plagiat dieses Artikels existiert.
  2. Djembe
    Dieser Aufsatz ist ein plumpes bersetzungsplagiat, der mit Hilfe von Babelfish erstellt worden ist. Er wurde fr den Test 2004 entwickelt und wurde bisher von keiner Plagiatserkennungssoftware entlarvt, wohl aber von vielen Lehrkrften in Weiterbildungs-Seminaren.
  3. Atwood
    Dieser Aufsatz wurde aus einer Besprechung auf der Amazon.de-Site durch Copy&Paste-Methodik bernommen. Einzelne kosmetische Aufhbschungen wurden vorgenommen. Es existieren mehrere Plagiate der Amazon-Site online.
  4. IETF
    Dieser Aufsatz wurde aus einem Bericht des Wissenschaftszentrums Berlin entnommen, der mehrfach dort vorhanden ist und einmal als Ausstellungskatalog in sterreich plagiiert worden ist, der immer noch online zu finden ist.
  5. Dner
    Dieser Aufsatz ist eine Halbsatzflickerei aus drei Quellen, eine wissenschaftliche, eine populr-wissenschaftliche und aus Wikipedia.
  6. Telnet
    Dieser Aufsatz basiert auf einem tatschlich von einem Studenten eingereichten Aufsatz bei einer Kollegin im Fach Informatik. Er basiert auf eine in PDF im Netz vorhandene Kopie eines Buches. Gendert wurden lediglich die sichtbaren Datumsangaben, die kodierten Zeitstempel wurden jedoch bersehen.
  7. Fririk r Fririksson
    Dieser Aufsatz ber den islndischen Regisseur Fririk r Fririksson ist ein Original-Aufsatz, wurde aber von der Autorin in der Wikipedia eingestellt mit entsprechendem Vermerk.
  8. Ahorn
    Dieser Aufsatz ist eine Halbsatzflickerei einer populr-wissenschaftlicher Site und aus Wikipedia.
  9. Lettau
    Dieser Aufsatz ist ein Originalaufsatz, der sowohl in der englischen als auch in der deutschen Wikipedia mit entsprechendem Vermerk eingestellt wurde. Es gibt hiervon etliche Plagiate im Netz.
  10. Frosch
    Dieser Aufsatz wurde von den Aufsatzverkufer schoolunity erworben. Teilweise liegt er im Netz, teilweise ist ein sehr hnlicher Aufsatz in einem Schulbuch der Cornelsen Verlag zu finden.
  11. Fraktur
    Dieser Aufsatz ber Frakturschrift entstammt einem PDF, in dem die Ligaturen kodiert sind, damit sie in Fraktur richtig dargestellt werden knnen, und einigen Abstzen aus einem Buch. Die Abstze sind im Copy&Paste-Verfahren verwendet, aber teilweise auch im Shake&Paste Methodik eingesetzt worden.
  12. Mankell
    Dieser Aufsatz ber einen Krimi des schwedischen Autors Henning Mankell ist einer nur leicht vernderter Buchbesprechung im Netz entnommen.
  13. Mikrobrauereien
    Dieser Aufsatz ist ein bersetzungsplagiat aus der englischsprachigen Wikipedia. Es gibt hierfr (noch) keinen Eintrag auf Deutsch.
  14. Allspice
    Dieser Aufsatz ber Piment ist ein bersetzungsplagiat aus der englischen bersetzung eines auf Schwedisch erschienenen Buches. Die Abstze wurde im Shake&Paste-Verfahren bernommen.
  15. Schmeling
    Dieser Aufsatz ist Original, die Funoten sind teilweise erdichtet.
  16. Bedrfnisanstalt
    Dieser Aufsatz stammt aus einer DVD-Kopie einer 1910 erschienen Enzyklopdie, die inzwischen im public domain ist. Auch wenn keine Copyright-Verletzung damit vorliegt, ist es immer noch ein Plagiat. Alle Jahreszahlen wurden einfach mit 100 Jahren ergnzt, damit es moderner erscheint. Die Bilder sind Kupferstiche aus dem Originalwerk.
  17. Jelenik
    Dieser Aufsatz ber die Nobelpreistrgerin Elfriede Jelenik ist ein Shake&Paste Plagiat aus drei Quellen, eins bersetzt freihndig aus dem Englischen, einer Buchbesprechung und einem Zeitungsartikel.
  18. Square Dance
    Dieser Aufsatz ist fast original – bis auf der Copy&Paste Absatz ber Kleidung, der im Artikel eingebettet ist.
  19. Vikinger
    Dieser Aufsatz ist ein bles Bearbeitungsplagiat einer Onlinefassung eines Zeitschriftenartikels. Es wurde sehr viel Mhe aufgewendet, den genauen Wortlaut zu verndern. Viele Leute meinen, damit sei es kein „Plagiat“ mehr.
  20. Blogs
    Dieser Aufsatz ist ein Strukturplagiat einer im Internet befindlichen PDF-Quelle fr ein Buch. Stze und Abstze wurden in aufsteigender Reihenfolge inklusiver Funoten bernommen, die bergnge sind dann einfach erdichtet.