Alle Beiträge von Andreas Wagener

Künstliche Intelligenz: AI und ihre Tücken – Bilderkennung mit Microsofts CaptionBot

Microsoft Bilderkennung: Captionbot
Microsoft Bilderkennung: Captionbot

 

Microsoft hatte sich bereits vor einigen Wochen mit seinem AI-Bot „Tay“ gewaltig in die Nesseln gesetzt, als sich der „selbstlernende“ Algorithmus in kürzester Zeit durch entsprechendes Anfüttern der trollenden Community von einer freundlichen Smalltalk-Plaudertasche in einen handfesten und hasserfüllt geifernden Nazi entwickelte – was Microsoft bereits nach kurzer Zeit zwang, den Bot vom Netz zu nehmen.

Mit seinem CaptionBot beschreitet Microsoft erneut das schwierige Pflaster der „Artifiziellen Intelligenz“. Nutzer können auf www.captionbot.ai ein Foto aus ihrem eigenen Fundus hochladen und analysieren lassen. Nach meist nur wenigen Sekunden meldet sich der Bot mit dem Ergebnis, der Beschreibung des bereitgestellten Bildes, zurück. Der User wird dabei nicht nur als Übermittler des „Übungsmaterials“ eingespannt, sondern zudem aufgefordert, die Resultate per Click und „Sternvergabe“ zu bewerten. Diese Rückmeldungen fließen in die Fütterung des Algorithmus‘ ein, der sich auf diese Weise selbst verbessern, also auf Grundlage der Nutzerfeedbacks hinzulernen soll.   Das funktioniert teilweise ganz gut, wie die beiden folgenden Beispiele zeigen…

captionbotwineglassescaptionbotcity  

…und manchmal weniger gut, wie bei unserem Bild zum „Urban Gardening“ in Berlin:

Captionbot Urban Gardening  

Spaßeshalber haben ich mal mein Blog-Logo durch den Bot gejagt – das Nerdwärts.de-Logo wird als Gruppe von Bäumen erkannt – naja.

CaptionbotNWLogo  

Interessant auch das Ergebnis für mein Social Media Profilfoto: Immerhin vermutet CaptionBot richtigerweise mich als Motiv. Angeblich sehe ich aber zu 54% so aus wie der britische Late-Night-Talker John Oliver – ich bin mir noch nicht sicher, ob ich mich da geschmeichelt fühlen soll…

captionbot #profwag JohnOliver

Andere Nutzer durften sich über noch extremere Ergebnisse freuen:

  Auch das legendäre „blaue“ Kleid, das es zu Beginn des Jahres zum viralen Hit schaffte bereitet dem CaptionBot erhebliche Probleme:

  …fairerweise sollten man von AI allerdings auch nicht erwarten, dass sie Dinge versteht, die zu begreifen uns Menschen schon Probleme bereiten… ;-)

 

Künstliche Intelligenz: Potenzial und Grenzen

Das Beispiel des CaptionBot zeigt, dass Künstliche Intelligenz einerseits, trotz der beschriebenen Mängel, schon recht weit ist. Andererseits wird hieran auch deutlich, wo die Limitierungen und damit auch die vieldiskutierten Gefahren von AI liegen. Wenn Künstliche Intelligenz zur Entscheidungsfindung herangezogen wird, etwa in Fragen der Kreditwürdigkeit oder bei der Unterstützung der Personenfahndung, so müssen derartige Ausfälle absolut ausgeschlossen sein. Geschieht dies nicht, ist digitale Diskriminierung zwangsläufig die Folge. Der Artikel wurde ursprünglich auf nerdwärts.de veröffentlicht.

Predictive Profiling: Mieter und ihre Integrität anhand des Social Media Verhaltens einschätzen

Vermietern steht neuerdings ein Instrument zur Verfügung, um sich bei der Entscheidung, wem man sein Wohneigentum zur Nutzung überlässt, nicht nur auf das Bauchgefühl oder herkömmliche Überprüfungsmechanismen, wie Kreditauskünfte oder ähnliches, zu verlassen. Das britische Startup Tenant Assured bietet an, potenzielle Mieter auf Grundlage ihres Verhaltens und ihrer Stellung innerhalb von Sozialen Medien zu untersuchen und zu „bewerten“.

Analyse von Social Media Profilen

Dazu werden Tweets, Kommentare und Facebook-Likes analysiert, und es wird überprüft, welche Produkte gekauft wurden, an welchen Orten man sich aufgehalten hat und auch mit wem man auf Facebook und anderen Netzwerken befreundet ist. Gezielt soll dabei auch nach spezifischen Keywords gefahndet werden, die das „Untersuchungsobjekt“ auf Facebook, Twitter oder Instagram verwendet hat, beispielsweise etwa Begriffe wie „arm“, „kein Geld“ oder „pleite“.

Predictive Profiling mittels eines „Personality Scores“

Diese „weichen“ Daten werden mit den herkömmlichen „harten“ Daten verknüpft, um auf diese Weise einen „Personality Score“ festzulegen, der Auskunft über die „Eignung“ eines potenziellen Mieters geben soll. Ziel ist es dabei ferner, auch persönliche Eigenschaften wie Hilfsbereitschaft und Konfliktverhalten in Erfahrung zu bringen. Anders als bei traditionellen Überprüfungen, die sich stets auf die Vergangenheit beziehen, verspricht Tenant Assured somit auch Aussagen über das zukünftige Gebaren, gewissermaßen also ein „Predictive Profiling“, der potenziellen Mieter.

Geschäftsmodell wird sehr kritisch aufgenommen

Im Netz stieß das Geschäftsmodell – gelinde gesagt – nicht gerade auf Begeisterung. Zwar muss der jeweilige Mieter, um eine tiefer gehende Untersuchung zuzulassen, aktiv einem Scanning zustimmen. Die Gefahr besteht jedoch – gerade in sehr starken Vermietermärkten, wie in den Metropolen – dass diese „Freiwilligkeit“ durch die Vermieter sehr schnell in eine „Pflicht“ umgedeutet wird, also in Zukunft die Bereitschaft zur Öffnung der Social Media Accounts für die Software vorausgesetzt wird. Das Werbevideo von Tenant Assured: Tenant Assured from Arise Web Design, Dev & SEO on Vimeo.

Der Artikel erschien ursprünglich auf nerdwärts.de

Wenn Daten das neue Öl sind, warum verhalten wir uns dann nicht auch so?

Springer-Chef Matthias Döpfner, BITKOM-Präsident und Datev-Chef Dieter Kempf oder GfK-CEO Matthias Hartmann – um nur einige wenige zu nennen – sie alle haben den Vergleich von Daten mit Gold oder Öl hinsichtlich der ökonomischen Bedeutung bereits bemüht. Doch wie es scheint, überlassen wir es in der praktischen Gegenwart eher den Tech-Konzernen aus den USA, diese immateriellen Bodenschätze zu heben. In Deutschland beschränkt man sich bislang auf die Rolle als Rohstofflieferant – in der Regel gegen Glasperlen. Schlimmer noch: Unvorstellbar, dass ein westlicher, marktwirtschaftlich geprägter Staat auf die Idee gekommen wäre, reichhaltiges Ölvorkommen um jeden Preis von der Vermarktung fernzuhalten, den Verkauf möglichst zu unterbinden, ja sogar unter Strafe zu stellen, anstatt aus diesem Ressourcenglücksfall einen Markt zu schaffen, der das ökonomische System beflügelt, für Wohlstand sorgt und somit über Besteuerung auch der öffentlichen Hand Einnahmen beschert. Würde dazu noch der Rohstoff an andere Staaten verschenkt, würden Konzessionen und unbegrenzte Zugriffsrechte auf die Ressourcen ermöglicht und sogar forciert – die politisch Verantwortlichen dürften normalerweise mit Schimpf und Schande aus dem Amt gejagt werden.

Der Unterschied zwischen Daten und Öl

Beim Öl und beim Gold wäre dieses Szenario schlicht undenkbar. Bei Daten jedoch passiert in Deutschland genau das. Während die inländische Wirtschaft in ein immer engeres Korsett gepresst wird, was die Verwendung von personenbezogenen Daten betrifft, unterliegen gleichzeitig aber deren internationale, vor allem US-amerikanische Konkurrenten aufgrund der internationalen Vernetzung naturgemäß nicht den selben Beschränkungen. Noch viel schlimmer jedoch: Eigentlich besteht die Aufgabe des Staates, ja im Schutz der Bürger und deren Interessen sowie darin, die ökonomische und gesellschaftliche Funktionsweise sicherzustellen. Tatsächlich aber beschränkt er Wirtschaft und Bürger in ihrer Handlungsfreiheit und ihren Rechten, protegiert er konkurrierende Unternehmen aus dem Ausland, wie Google und Facebook, sowie ausländische Geheimdienste wie die NSA im gleichen Maße. Ökonomisch führt dies zu einer Marktverzerrung zu Lasten der Unternehmen im eigenen Land, ja sogar zu staatlich unterstützter Industriespionage. Aus gesellschaftlicher Perspektive ist dies hingegen als Verramschung von Volkssouveränität und Rechtsstaatlichkeit zu werten.

Es bedarf einer Wertediskussion um die „Datenidentität“

Offensichtlich brauchen wir dringend eine Diskussion um den Wert und die Bedeutung von Daten in unserer immer digitaleren Welt: Wem gehören Daten? Wer ist ihr Eigentümer? Und wer hat das Recht diese zu vermarkten – derjenige, der sie erhebt und veredelt oder derjenige, in dessen „Sphäre“ sie angefallen sind? Die Rechtswissenschaft meint gemeinhin zumindest bei Personendaten hier klare Antworten geben zu können. Doch wie verhält es sich bei Maschinen- und Objektdaten im „Internet der Dinge“? Und lässt sich dann noch eine Trennung zwischen dinglichen und „menschlichen“ Daten vollziehen? Auch wenn die Bereitschaft in der Bevölkerung für einen entsprechenden Diskurs derzeit nicht allzu hoch ist und die digitale Kompetenz der politischen Entscheidungsträger in der überwiegenden Zahl der Fälle bei weitem nicht ausreicht, um substanziell an der Diskussion teilzunehmen: mit der Datenfrage berühren wir inzwischen die grundlegenden Prinzipien unserer „Freiheitlich Demokratischen Grundordnung“. Wenn Daten tatsächlich diese eminent hohe Bedeutung zukommt, ist es essentiell für Demokratie und Rechtsstaatlichkeit, dass wir bürgerliche Datenrechte und Selbstverantwortlichkeiten sowie den Schutz vor staatlicher Willkür und Missbrauch verfassungsrechtlich verankern.

Unternehmerisches Versagen bei der Datenwertschöpfung

Der Staat ist letztlich immer nur die Summe seiner Teile. Neben dem Wahlvolk tragen eben auch die Unternehmen ihren Teil der Schuld an diesem Problem bei. Viel zu lax wird mit dem eigenen „Datenvermögen“ umgegangen. Datengetriebene Geschäftsmodelle der Industrie, etwa in den Schlüsselsegmenten Maschinenbau und Automobil, jenseits von bloßer „Prozessoptimierung“ findet man selten. Gerade auch die Medienbranche offenbart hier eklatante Kompetenzprobleme: Im Kampf mit Google haben die deutschen Verleger ein mehr als zweifelhaftes „Leistungsschutzrecht“ mittels massivem Lobbyismus durchgesetzt. Dadurch sollen die Inhalte der Verlage besser geschützt werden. Gleichzeitig – trotz des „Daten-sind-das-neue-Öl“-Mantras – nutzt die überwältigende Mehrheit der deutschen Medienunternehmen Googles AdServer „Double Click“ zur Ausspielung von Werbung auf den eigenen medialen Plattformen. Damit erhält der Datenriese aus Mountain View den kompletten Zugriff auf deren sämtliche Nutzer – und wird dafür von den Verlagshäusern auch noch bezahlt. Während man also auf der einen Seite über das Recht an den Verpackungsmaterialien streitet, bezahlt man auf der anderen Seite noch dafür, Gold und Öl, das eigentliche Produkt, eimerweise verschenken zu dürfen. Paradox? Ja. Aber Realität im deutschen digitalen Klondike.

Der Beitrag erschien ursprünglich auf Nerdwärts.de

Das Internet der Kühe

Ziel dieses Vorstoßes ist es, die Geburtenrate von Rindern zu „optimieren“. Weibliche Rinder werden in der Viehzucht überwacht, um den optimalen Besamungszeitpunkt zu ermitteln. Die Fruchtbarkeitsphase (Östrus) von Kühen scheint aber oft – laut Fujitsu zu 66% – zu nachtschlafender Zeit zu beginnen, daher ist es schwierig, diese allein nur durch das menschliche Auge zu erkennen. Künstliche Befruchtung von Rindern ist also nicht einfach und erfordert oft mehrere Versuche. Wenn der erste Versuch allerdings nicht gelingt, so müssen drei Wochen bis zur nächsten Gelegenheit abgewartet werden. Da Zeit bekanntlich Geld ist, will Fujitsu hier nun Abhilfe schaffen und diese enorme „Last“, wie man sich in einem Werbeclip ausdrückt, von den Schultern der Bauern und Viehzüchter nehmen.

Das Internet der Kühe als Ertragsfaktor in der Landwirtschaft

Ein typischer Indikator zu Beginn des Östrus scheinen verstärkte Beinbewegungen der Kühe zu sein. Ausgestattet mit einem „Pedometer“ – einem Schrittzähler, der an den Läufen befestigt wird, ist es möglich, die erhöhte Bewegungsaktivität der Kühe zu messen und das vermutliche Eintreten des Fruchtbarkeitszyklusses per Funkverbindung an den Eigentümer der Rinder zu übermitteln. Angeblich soll auf diese Weise die Erfolgsquote der künstlichen Befruchtung auf 90% erhöht werden. Wie Fujitsu stolz vermeldet, kann somit die Phase der „Nicht-Schwangerschaft“ von Kühen erheblich reduziert werden, was der Landwirtschaft entsprechend höhere Erträge bescheren könnte. Was dem einen oder anderen wie eine Perversion des industriellen Eingriffs in die Natur vorkommen mag, begründet Fujitsu übrigens mit der Möglichkeit den Welthunger zu bekämpfen. Ganz egal wie man zur Industrialisierung der Landwirtschaft steht, dies ist ein weiteres Beispiel dafür, dass alles was vernetzt und digitalisiert werden kann auch vernetzt und digitalisiert werden wird.   Zum Video auf Youtube:

Der Artikel erschien ursprünglich auf nerdwärts.de