Category Archives: Open Source

Captcha mit Tourette-Syndrom

CAPTCHA ist ein Akronym für Completely Automated Public Turing test to tell Computers and Humans Apart. Wörtlich übersetzt bedeutet das €žVollautomatischer öffentlicher Turing-Test, um Computer und Menschen zu unterscheiden€œ. CAPTCHAs werden verwendet, um zu entscheiden, ob das Gegenüber ein Mensch oder eine Maschine ist. Der Begriff wurde zum ersten Mal im Jahr 2000 von Luis von Ahn, Manuel Blum und Nicholas J. Hopper an der Carnegie Mellon University und von John Langford von IBM gebraucht.” (Wikipedia)

“Das Tourettesyndrom ist eine neurologisch-psychiatrische, ätiologisch noch ungeklärte Erkrankung, die durch das Auftreten von Tics charakterisiert ist. Bei den Tics handelt es sich um unwillkürliche, rasche, meistens plötzlich einschießende und mitunter sehr heftige Bewegungen, die immer wieder in gleicher Weise einzeln oder serienartig auftreten können. Verbale, ungewollte Äußerungen zählen mit dazu, sowie Ausrufe oder eigenartige Geräusche. “ (Wikipedia)

Captchas sind ein beliebtes Verfahren, um die Eingabe von Webformularen gegen automatische Spam-Bots abzusichern. Wir selbst setzten Captchas ebenfalls an verschiedene Stellen und Projekten ein. Bislang immer ohne Probleme. Bis wir heute im Kundensupport einen seltsamen Vorfall gemeldet bekamen.

Bitte geben Sie “Zicke” ein

Ein Captcha soll eine Kundin in einem online-Shop mit sexistischen, kriegsverherrlichenden und geschmacklosen Begriffen belästigt haben. Bitte geben Sie “Zicke” ein. Nein, das  geht gar nicht

Auch “terror”, “stalin”, “bigamie”, “bordel”,  “dachau”, “eichel”, “fummeln”, “furzes”, “gaddafi”, “galgen”, “glied”, “kastrat”, “Khmer”, “Kokain” und “Khomeini” sind nicht gerade Begriffe, die der political correctness entsprechen.

Ja, dieses Captcha war wohl tatsächlich an Tourette erkrankt und beschimpft Webbenutzer. Aber warum? Zuerst lag der Verdacht auf einen böswilligen Scherz. Das Captcha stammt aus dem öffentlichen TYPO3 Extension Repository. Hatte sich ein böser Programmierer den Dateien im Repository eine schmutzige Wortliste untergeschoben? Denkbar wäre es.

Wenn das Wörterbuch zum Verhängnis wird

Doch ich glaube die Erklärung ist viel einfacher. Das Captcha-Programm bezieht seine Wörter aus einer umfassenden Quelle: dem Wortlexikon aus Open Office. Die Wortliste ist daher mit über 19.800 Wörtern sehr umfassend. Ein Blick in die Wortliste zeigt: die überwiegende Mehrheit der aufgeführten Wörter sind harmlos: “Hydrant”, “Idee”, “Kultur” und viele mehr. Doch zwischen all den schönen Wörter tauchen auch immer wieder kritische Begriffe auf “Freibad”, “Freien”, “Freier”, “Freiern”, “Freimut”, “Freitag” und “Freitod” folgen ganz unschuldig Zeile für Zeile.

Eine Frage der Wahrscheinlichkeit

Das Grundübel liegt also darin, dass die Verfasser der deutschen Captcha Version einfach eine Wörterbuch-Datei als Quelle zum Erzeugen der Captcha-Bilder verwenden. Beim generieren eines Captchas sucht sich das Programm zufällig ein Wort aus dieser Liste und trifft mit einer ausreichend hohen statistischen Wahrscheinlichkeit ein negativ besetztes Wort. In diesem Fall hatte Kollege Zufall die Kundin des online Shops getroffen und belästigt. Autsch.

Fazit: nur die eigenes geprüfte Wortliste schützt vor ungemach

Das ganze erinnert mit etwas an dem Problem, mit der die populäre SMS-Software T9 vor einigen Jahren zu kämpfen hatte. Wer also die TYPO3-Extension freecap einsetzt, sollte einfach die enthaltene Wortliste .ht.de.freecap.word durch eine eigene geprüfte Liste ersetzten.

Mit Open Source arbeiten, heisst nicht immer Open Source verstehen

Es gibt eine Vielfalt von Firmen die von Dienstleistungen und Services rund um Open Source Software existieren. Zahlreiche Unternehmen verwenden Open Source Software und zahlreiche Dienstleister arbeiten damit, ohne die eigentlichen lizenzrechtlichen Hintergründe zu kennen.

In der Regel ist dies nicht dramatisch. Allerdings sollten sich Software-Entwickler sehr genau mit dem Thema der Open Source Lizenz beschäftigen. Denn im Zusammenhang mit Open Source Software ist es gut zu wissen, ab wann eine entwickelte Software-Anwendung ein “eigenständiges” oder ein “abgeleitetes” Werk ist. Je nach dem hat dies lizenzrechtlich schwerwiegende Konsequenzen. Wenn der Copyleft-Effekt der GPL auf eine entwickelte Anwendung greift, haben Anwender und Softwareentwickler sehr genaue Vorgaben über den zukünftigen Gebrauch des Werkes.

Noch schwieriger ist es, wenn es in einer komplexen Anwendung zu einer Vermengung eigener Code-Sourcen und diverser Open Source Komponenten mit unterschiedlichen Lizenzen wie LGL, GPL oder BSD kommt. Eine solche lizenzrechtliche Gemengelage ist ohne Juristen nicht mehr überschaubar. Und es ist zu befürchten, das es in der juristischen Auslegung der angelsächsischen Lizenzen mit dem deutschen Urheberrecht nur so kracht.

Manche fatalen Dinge passieren auch schlicht aus Unwissenheit. Nur so kann ich den Lizenztext in dieser HTML-Source deuten:

 Copyright Medien Büro XYZ http://www.xyz.de
,,_
L ¯^N¸
__¸L_ ¯\
»~¯¯ ¯~¸ ¼
,´ _ J J
,¯ _M´¯L J ]
[ [ _¸Ã¦¯ Ñ
[ [ ¯ ¸¹
`_ ¯W¸___¸«€™¯
€™¸ ¯¯Ã‘¯
¯~«__ L
¯¯^

This website is powered by TYPO3 – inspiring people to share!
TYPO3 is a free open source Content Management Framework initially created by Kasper Skaarhoj and licensed under GNU/GPL.
TYPO3 is copyright 1998-2006 of Kasper Skaarhoj. Extensions are copyright of their respective owners.
Information and contribution at http://typo3.com/ and http://typo3.org/

Hier hat ein Dienstleister eine Webseite auf Basis des populären Open Source Redaktionssystem TYPO3 erstellt. Wahrscheinlich ohne tieferes Nachdenken wurde der Lizenzhinweis von TYPO3 erweitert. Der Zusatz “Copyright Medien Büro XYZ http://www.xyz.de”ist allerdings wirklich fatal… denn in diesem Fall wird ein Copyright-Anspruch auf ein Werk unter der Lizenz GPL geltend gemacht.

Liebe Mitarbeiter des Büro XYZ*, so geht das überhaupt nicht….

Natürlich ist das individuell erstellte Werk der Webseite urheberrechtlich geschützt. Insofern hat der Dienstleister einen rechtlichen Schutz als Urheber des Werkes “Internetseite”. Allerdings ist es unzulässig sein “Copyright” schlicht in den Lizenzhinweis des darunter liegenden Frameworks zu platzieren. Denn das Framework, basiert auf die per GPL lizensierte Software TYPO3.

Daher: einfach die Finger von Lizenzhinweisen und Texten lassen. Es hätte in diesem Falle auch genügt per Meta-Tag den Urheber der Webseite zu nennen.

*Nein, ich nennen besser keine Namen ;)

Google Analytics im Visier der Datenschützer

*Disclaimer: ja ich gebe es zu, auch diese Webseite nutzt Google-Analytics.

Vor zwei Jahren saß ich gemeinsam mit mehreren Internet-Fachanwälten bei einem Business Lunch zu Tisch. Wenn man mit soviel rechtliche Kompetenz konzentriert an einen Ort vorfindet, dann muss einer wie ich einfach kniffelige Frage stellen.

Also plauderte ich im Smalltalk über den Dienst Google-Analytics, mit dem Seitenbetreiber statistische Daten an Google übermitteln und im Gegenzug ein kostenloses Auswertungstool zur Seitenanalyse und -nutzung erhalten.

Eine klassische Win-Win Situation für beide Seite. Ich gebe Google Informationen über die Nutzung meiner Webseite und dafür erhalte ich ein Analysetool, dass diese Daten mit den Daten aus der Google-Suchmaschine in Beziehung setzt. Wirklich praktisch. Aber wie ist das rein rechtlich? Schließlich werden hier Daten, wie die IP der Webseitenbenutzer, Surfzeiten erhoben und an einen Drittanbieter in die USA übermittelt. Das müsste doch aus Sicht der Deutschen Datenschutzbestimmungen problematisch sein.

Das dachte ich mir. Und weil nun an meinen Tisch so viele Rechtsanwälte gemeinsam saßen, fragte ich die Herren ob hier nicht eine Zeitbombe ticken würde.

Die Antwort: “……………………………..” (ein ziemlich ratloses Schweigen, gepaart mit Achselzucken).

Heute zwei Jahre später, erhalte ich mit dieser Meldung eine Antwort. Der Landesdatenschützer aus Schleswig-Holstein nimmt den Dienst Google-Analytics unter die Lupe und warnt vor der Erhebung personenbezogener Daten durch das Website-Tracking mittels Google-Analytics.

Dazu Landesdatenschützer Dr. Thilo Weichert in einer Pressemitteilung:

“Wir waren verblüfft und schockiert, wie weit Google Analytics auch in Schleswig-Holstein verbreitet ist. Renommierte Medien- und Internetunternehmen gehören zu deren Nutzern ebenso wie viele Anbieter aus der Tourismus- und der Dienstleistungsbranche; ja politische Parteien, öffentliche Stellen des Landes und Hochschulen setzen den kostenlosen, aber datenschutzwidrigen Service ein. Den meisten Betreibern dürfte nicht vollständig bewusst sein, dass sie mit dem Einsatz von Google Analytics einen Service in Anspruch nehmen, bei dem Daten in die USA übermittelt werden, die dort umfassend ausgewertet und genutzt werden, und dass dies die Datenschutzrechte der Webseitenbesucher verletzt.”

Als nächstes erwarte ich, dass sich der Datenschutz auch bald mit den Diensten Google Maps, Google Earth und GMail beschäftigen wird. Schließlich gibt es dort auch zahlreiche Daten die Google Personenbezogen verwerten kann. Interessant, in wie weit sich dies Datenerhebung mit der Deutschen Rechtslage in Einstimmung befindet.

Juhu Firefox 3.0 ist da…

…und es gibt schon die ersten Probleme. So wie es aussieht, müssen einige Applikationen nachbessern um Probleme bei der Darstellung im neuesten Firefox zu beheben. Es mehren sich seit heute Morgen die ersten Support-Fälle. Hier ein Auszug:

 TYPO3 4.1.x: Backend wird nicht richtig aufgebaut.

Google-Maps-API: Fehlermeldungen beim Rendern von Karten.

Ach, das verspricht doch spassig zu werden. Die Entwicklung kann gleich anfangen auch noch auf Firefox 3.0 zu testen….

Des Teufels Alternative

Google Vize David Drummond posted im Google Blog, warum seiner Ansicht nach die Übernahme von Yahoo durch Mircosoft dem Internet schaden könnte.

Die Argumentation von Drummond ist einleuchtend: gemeinsam mit Yahoo würde Microsoft besonders in den Bereichen E-Mail-, Messanger- und Portaldienste eine herausragende Markstellung erreichen. Doch bei allen Argumenten bleibt auch ein schaler Beigeschmackt. Google ist im Bereich der Suche und online Vermarktung der führende Anbieter. Außerhalb der USA verfügt das Unternehmen einen monopolistischen Marktanteil. Beispielsweise in Deutschland mit ca. 90% bei der online Recherche.

Microsoft dagegen hat in der Vergangenheit bewiesen, wie sehr das Unternehmen nach Monopolsituationen drängt, um diese dann aggressiv auszubauen und zu verteidigen.

Aber auch Google muss den Erwartungen seiner Investoren Rechnung tragen. Die Devise heißt auch hier Wachstum und Verteidigung von Marktanteilen.

Neben der finanziell, strategischen Komponente hat dieser Wettbewerb der Giganten auch einen moralischen Beigeschmack. Diesen akzentuiert David Drummond in seinem Blog-Posting.

Überspitzt gesagt: es geht um die Zukunft des Internets. A la billigem Hollywood Drehbuch geht es um einen Kampf der Guten (Google) gegen das Böse (Microsoft).

Doch so einfach ist es leider nicht.  Ich bin wirklich kein Fan der Produkte und Marktstrategien aus Redmond. Aber auch Mär vom edlen Ritter aus Mountain View, der gegen das Böse kämpft ist nicht glaubhaft. Zugegeben Google hat sich im Gegensatz zu Microsoft immer darum bemüht, das Services mit offenen Standards bedient werden können. Als großer Nutznießer von Open Source Software ist Google zu einem der größten Förderer geworden. Zum Leidwesen von Microsoft und anderen Anbietern von propritärer Software und abgeschotteten Diensten.

Doch Google ist ebenso wenig Gut, wie Microsoft das Attribut Böse verdient. Beides sind schlicht Unternehmen, die Rendite für Anleger erwirtschaften müssen. Es Unterscheiden sich die Mittel, nicht die strategischen Ziele.

Falls Microsoft tatsächlich übernimmt, entsteht ein bedeutendes Gegengewicht zu Google im Bereich der online Vermarktung und Suche. Das ist nicht schlecht. Nur verfügt der Bräutigam von Yahoo leider nicht unbedingt über den besten Leumund.

Es ist eine Teufels Alternative.

Sonnenaufgang für MySQL

MySQL war reif für den Börsengang. Die Vorbereitungen dafür waren schon länger im Gangen. Und nun das: Sun kauft das Unternehmen und sichert sich damit die Rechte am weit verbreiteten Open Source Datenbanksystem.

MySQL passt sehr gut in das Portfolio von Sun. Diese haben mit Java und Open Office bewiesen, dass Sie Open Source Projekte steuern und vermarkten können.

Ich glaube, dass auf Grund der negativen Börsenstimmung eine Platzierung der MySQL Aktien am Kapitalmarkt keine gute Rendite versprach. Der Verkauf an Sun ist vermutlich Plan B. Aber immerhin, der Deal mit Sun wird den Investoren bei MySQL ca. $ 1 Mrd. einbringen.

SYSTEMS: Open Source CRM Center

Phew, der erste Messetag ist geschafft. Im Open Source CRM Center gab es viel zu sehen: vtiger CRM und Sugar CRM im Live-Einsatz. Ein besonders Schmankerl ist unsere Demonstration der Asterisk-Anbindung an vtiger CRM. Die kleine Asterisk Box von VoiSmart arbeitet perfekt, fleißig und zuverlässig mit vtiger CRM zusammen.

Das Open Source CRM Center wurde heute den ganzen Tag über gut besucht. Unsere Stimmbänder sind heute Abend angeschlagen vom vielen Reden. Ebenfalls schön zu sehen, dass Heise hat heute über uns auf dem Newticker berichtet hat :)

Hier ein paar Eindrücke vom heutigen Tag auf der SYSTEMS:

Open Source CRM Center auf der SYSTEMS 2007

Unser Messestand…

Vortrag vtiger CRM auf der SYSTEMS 2007

Mein Vortrag zum Thema vtiger CRM mit Asterisk verbinden…

Open Source Sucks Teil I

Ja wirklich es regt mich auf! Es geht um Open Source Entwickler, die absichtlich mit schlampiger Arbeit ein Projekt verseuchen, um später mit Patches und Fixes Kohle zu machen. Wenn diese Geschichte aus einem sehr bekannten Open Source Projekt stimmt, dann schwillt mir der Hals.

Heute wurde mit am Telefon folgendes Berichtet: Herr XYZ ist in der Community zuständig für die deutsche Lokalisierung des Projektes XXX. Es ist kein Geheimnis, dass es im Betrieb der Software immer wieder Probleme mit der deutschen Lokalisierung gibt.

Herr XYZ ist Kompetent, hat ein Buch über die Software geschrieben und kümmert sich rege im Forum um Posting.

Soweit so gut. Das ist Open Source at its bests.

Nun zum pikanten Detail, dass etwas unschön ist.

Mein heutiger Telefongesprächspartner setzt die besagte Open Source Software XXX ein und ist durchaus gewillt dafür auch bei externen Dienstleistern Leistungen für Anpassungen und Support einzukaufen.

In diesem Sinne hatte er die Firma von Herrn XYZ kontaktiert. Während des Gesprächs mit Meister XYZ selbst, wurde auch über Probleme mit fehlerhaften Inhalten in der deutschen Sprachversion gesprochen.

Wir erinnern uns: Herr XYZ ist verantwortlich für die deutsche Versionierung. Deshalb ist folgende Aussage besonders erschreckend: “Ja, es gibt Probleme in der offiziellen deutschen Sprachversion. Sie können bei uns eine Sprachversion erwerbe, in der diese Fehler behoben sind”

BITTE!!!!

Derjenige der für die fehlerhafte Version verantwortlich ist, versucht Anwendern per Buxfixing um Geld zu erleichtern? Ja geht es noch?

Das nenne ich mal niedere Beweggründe. Ein solches Verhalten ist unmoralisch, schadet der Software-Qualität und dem Gedanken der Open Source Community.

1 4 5 6 7 8 9