Similarity Texter

Additional Information

Testfälle 2010

Hier werden die einzelnen Testfälle kurz erläutert!

<

Erläuterung
00-schaltjahr Dieser Aufsatz ist ein Originalaufsatz, der für den ersten Test 2004 erstellt wurde, daher ist er gelegentlich im Google-Archiv zu finden. Mindestens ein Plagiat dieses Artikels existiert.
01-djembe Dieser Aufsatz ist ein plumpes Übersetzungsplagiat, das mit Hilfe von Babelfish erstellt worden ist. Er wurde für den Test 2004 entwickelt und wurde bisher von keiner Plagiatserkennungssoftware entlarvt, wohl aber von vielen Lehrkräften in Weiterbildungs-Seminaren.
02-atwood Dieser Aufsatz wurde aus einer Besprechung auf der Amazon.de-Site durch Copy&Paste-Methodik übernommen. Einzelne kosmetische Aufhübschungen wurden vorgenommen. Es existieren mehrere Plagiate der Amazon-Site online.
03-IETF Dieser Aufsatz wurde aus einem Bericht des Wissenschaftszentrums Berlin entnommen, der dort mehrfach vorhanden ist und einmal als Ausstellungskatalog in Österreich plagiiert worden ist und immer noch online zu finden ist.
04-döner
Dieser Aufsatz ist eine Halbsatzflickerei aus drei Quellen, einer wissenschaftlichen, einer populär-wissenschaftlichen und der Wikipedia. Es existieren mehrere (unerlaubte) Kopien unseres Plagiats im Netz. Nachdem der Artikel auf Wikipedia zu stark verändert wurde, mussten wir Wikipedia als Quelle bei der Bewertung entfernen, allerdings gibt es noch Mirrors der alten Seite. Dafür gibt es jetzt eine exakte Kopie unseres Artikels bei Volkan.
05-telent Dieser Aufsatz basiert auf einem tatsächlich von einem Studenten, bei einer Kollegin im Fach Informatik, eingereichten Aufsatz. Er basiert auf einer als PDF im Netz vorhandenen Kopie eines Buches. Geändert wurden lediglich die sichtbaren Datumsangaben, die kodierten Zeitstempel wurden jedoch übersehen.
06-ftf Dieser Aufsatz über den isländischen Regisseur Friðrik Þór Friðriksson ist ein Original-Aufsatz, wurde aber von der Autorin in der Wikipedia mit entsprechendem Vermerk eingestellt.
07-ahorn Dieser Aufsatz ist eine Halbsatzflickerei einer populär-wissenschaftlichen Seite und der Wikipedia. Die populärwissenschaftliche Seite („Die Sendung mit der Maus“) ist im Netz nicht mehr auffindbar, aber der Aufsatz bleibt ein Plagiat!
08-lettau Dieser Aufsatz ist ein Originalaufsatz, der sowohl in der englischen als auch in der deutschen Wikipedia mit entsprechendem Vermerk eingestellt wurde. Es gibt hiervon etliche Plagiate im Netz.
09-frosch Dieser Aufsatz wurde von den Aufsatzverkäufern schoolunity erworben. Teilweise liegt er im Netz, teilweise ist ein sehr ähnlicher Aufsatz in einem Schulbuch des Cornelsen Verlags zu finden.
10-fraktur Dieser Aufsatz über Frakturschrift entstammt einem PDF, in dem die Ligaturen kodiert sind, damit sie in Fraktur richtig dargestellt werden können, und einige Absätze aus einem Buch. Die Absätze sind mit dem Copy&Paste-Verfahren übernommen, aber teilweise auch mit der Shake&Paste Methodik eingesetzt worden.
11-mankell Dieser Aufsatz über einen Krimi des schwedischen Autors Henning Mankell ist einer nur leicht veränderter Buchbesprechung, inklusive Schreibfehlern, dem Netz entnommen.
12-mikrobrauerei Dieser Aufsatz ist ein Übersetzungsplagiat aus der englischsprachigen Wikipedia. Es gibt hierfür (noch) keinen Eintrag auf Deutsch.
13-allspice Dieser Aufsatz über Piment ist ein Übersetzungsplagiat aus der englischen Übersetzung eines auf Schwedisch erschienenen Buches. Die Absätze wurde im Shake&Paste-Verfahren übernommen.
14-schmeling Dieser Aufsatz ist Original, die Fußnoten sind teilweise erdichtet.
15-bedürfnisanstalt Dieser Aufsatz stammt aus einer DVD-Kopie einer 1910 erschienen Enzyklopädie, die inzwischen im public domain ist. Auch wenn damit keine Copyright-Verletzung vorliegt, ist es immer noch ein Plagiat. Alle Jahreszahlen wurden einfach um 100 Jahren ergänzt, damit es moderner erscheint. Die Bilder sind Kupferstiche aus dem Originalwerk.
16-jelenik Dieser Aufsatz über die Nobelpreisträgerin Elfriede Jelenik ist ein Shake&Paste Plagiat aus drei Quellen, eine freihändig aus dem Englischen übersetzte, einer Buchbesprechung und einem Zeitungsartikel. Die englische Quelle ist jedoch nicht mehr online, der Aufsatz bleibt ein Plagiat.
17-squaredance Dieser Aufsatz ist fast original – bis auf der Copy&Paste Absatz über Kleidung, der im Artikel eingebettet ist.
18-vikinger Dieser Aufsatz ist ein übles Bearbeitungsplagiat einer Onlinefassung eines Zeitschriftenartikels. Es wurde sehr viel Mühe aufgewendet, den genauen Wortlaut zu verändern. Viele Leute meinen, damit sei es kein “Plagiat” mehr. Obwohl es 2008 noch von vielen Systeme gefunden wurde, haben fast keine Systeme es 2010 als Plagiat erkennen können, trotz großer Zitat mitten drin.
19-blogs Dieser Aufsatz ist ein Strukturplagiat einer im Internet befindlichen PDF-Quelle für ein Buch. Sätze und Absätze wurden in aufsteigender Reihenfolge inklusiver Fußnoten übernommen, die Übergänge sind dann einfach erdichtet.
20-Volleyball Diese Originalarbeit ist mit ca. 9% Copy & Paste-Plagiat (2 Sätze) angereichert worden.
21-Tibet Dieses Plagiat wurde absatzweise aus drei Quellen – Wikipedia, der Süddeutsche Zeitung und der Computerwoche zusammengestellt. Es ist ein Komplettplagiat.
22-Le Pont Dieser Aufsatz wurde mit Google-Translate aus dem Französischen in Deutsch übersetzt und poliert, weil der Satzbau sehr unverständlich war.
23-Wok Dieser Aufsatz ist eine vollständige Kopie aus der ersten Seite eines Kochbuchs über die Wok-Küche, die aus dem Amazon “Search inside”-Feature abgetippt wurde.
24-Tastatur Dieses Shake & Paste-Plagiat wurde aus einem Online-Artikel angefertigt.
25-Surströmming Dieser Aufsatz wurde aus einer Online-Quelle übernommen, die selber großzügig bei der Wikipedia geborgt haben könnte. Der Text wurde nochzu 21% verändert. Mitten im Test ist jedoch die Online-Quelle spurlos aus dem Netz verschwunden, daher konnte nur der Wikipedia-Anteil bewertet werden. Eine zweite Version wurde angefertigt, in dem im 2. Absatz ein anderes ASCII-Zeichen für “e” verwendet wurde, sowie andere Fonts für den ersten und letzten Absatz, um auch diese Verschleierungstaktik zu erproben. Da die Quelle aber ersatzlos verschwunden ist und der Wikipedia-Artikel stark überarbeitet wurde, haben wir diesen Testfall 2010 gestrichen – es bleibt aber ein Plagiat.
26-Ajax Dieses Copy & Paste-Plagiat wurde aus dem geschützten Bereich der Springer-Datenbank verwendet. Während des Tests haben wir festgestellt, dass sowohl Ciando als auch Googlebooks den Text als Suchtext referenzieren.
27-Kabeljau Dieses Shake & Paste-Plagiat wurde aus der Zeit, Spiegelwissen und der Wikipedia zusammengeflickt.
28-Brantenberg Dieses Übersetzungsplagiat ist in Handarbeit aus einer norwegischen online-Biografie entstanden. Durch die Ortsnamen melden manche Systeme gelegentlich kleine Mengen Plagiat.
29-Facebook Ein Abschnitt dieses Werks ist zu 36% aus einem Blog 1:1 übernommen worden.
30-Rauchverbot Dieses ist ein Originalaufsatz.
31-Pickles Dieser englische Aufsatz ist aus zwei Quellen, Wikipedia und WiseGeek in Shake & Paste zusammengestellt.
32-Zakuma Dieser englischer Aufsatz ist von zwei Quellen, Wikipedia und der FIFA Site in Shake & Paste zusammengestellt.
33-Eyjafjallajökul Dieser englische Aufsatz wurde aus der englischen Wikipedia entnommen.
34-StiegLarsson Dieses ist ein Originalaufsatz.
35-Perl Dieses ist ein Originalaufsatz, aber weil es um Code geht, wurde im Text der PHP-Code aufgenommen, um einen blinkenden roten Text im Bericht zu zeigen, wenn ein System in Perl geschrieben ist und nicht korrekt Eingaben verarbeitet.
36-Champagne Ein Abschnitt der französischen Wikipedia über Champagne-Flaschengrößen (die eigentlich wegen die Auflistung der Namen auffindbar sein sollte) wurde durch Google-Translate ins Englisch übersetzt und leicht poliert.
37-Mosque Dieser englische Aufsatz hat zu einem kleinem Teil aus der englischen Wikipedia und zu über 75% von der Site Allaboutturkey entnommen.
38-Photovoltaics Dieser englische Aufsatz wurde zu 100% von der Homepage eines studentischen Projekts an der HTW entnommen. Leider wurde übersehen, dass die Studenten einen robots.txt-Datei gesetzt haben, die von den Suchmaschinen respektiert wurde. Der Aufsatz ist trotzdem ein 100% Plagiat
39-Agassiz Dieser Aufsatz wurde aus einem der eingescannten Google Bücher entnommen und ist zur 95% plagiiert.
40-Barbarians Machiavelli’s „Der Prinz“ ist gemeinfrei und überall zu finden. Es wurde aus einem  Kapitel einiges übernommen und einige Wörter und Sätze wurden gelöscht, die zu merkwürdig wirkten.
41-Turnitin Turnitin hat einen Aufsatz mit einer erfundenen URL als Referenz in ihrer Datenbank gespeichert, um zu sehen, ob andere Systeme Turnitin als eigenes verkaufen. Eines haben wir gefunden.
42-Japanese 8 Punkte waren erreichbar für je 4 Absätze auf Japanisch in 2 verschiedenen Kodierungen. Quellen waren die japanische Wikipedia und eine Masterarbeit, die online erhältlich ist.