TensorSpace.js: Deep Learning Modelle in 3D


Hat hier jemand eine Blackbox gesehen?

Ein Neuronales Netz steht ja für gewöhnlich in Verruf, eine Blackbox zu sein. Insbesondere die tiefen neuronalen Netze wollen wohl unheimliche Mathematik-Monster sein, die niemand mehr verstehen oder kontrollieren kann.

Nicht nur deshalb haben sich Entwickler auf Github zusammengetan und eine Bibliothek entwickelt, mit der man im Browser tiefe neuronale Modelle visuell erforschen und untersuchen kann: TensorSpace.js!

Mit einer Keras-artigen API kann man via JavaScript ein Modell kreieren und auch vortrainierte Modelle laden, Predictions durchführen und das beste: Layer für Layer anzoomen, rotieren, anklicken und verstehen, was da eigentlich passiert. Hier sehen wir das Modell LeNet von Yann LeCunn in Aktion:

Quelle: tensorspace.org

Auch richtig fette Modelle sind dabei, so dass man schon eine Weile warten muss, um ein halbes Gigabyte an Gewichten für die neuronalen Netze runterzuladen. Richtig schön lassen sich die Convolutional Layer aufsplitten:

Quelle: tensorspace.org

Nagut, man muss zugeben: auch nach dem Reinzoomen erscheinen uns die Dinger noch wie geheimnisumwitterte Blackboxen. Aber für das Verständnis und zum Untersuchen von tiefen neuronalen Netzen ist diese Visualisierungsbibliothek allemal bestens geeignet. Das schöne ist ja: die API ist völlig offen, so dass man eigene Modelle ebenso damit visualisieren kann.

Viel Spaß beim Ausprobieren!

Bizarre GAN-Welten - wenn die KI (Alb-)Träume hat


Die Bildimaginationen von sog. GANs (von engl. Generative Adversarial Networks, auf dtsch. etwa Generative Gegnerische Netzwerke) erzeugen mitunter bizarre Bildwelten, die sich bspw. auf ganbreeder.app erkunden lassen.

Hier sieht man eine Bildreihe, von einem Ausgangsbild zum jeweils nächsten, die auf ganbreeder.app erzeugt wurde.

Bei GANs sind gleich zwei Akteure beteiligt: Ein Netz, das Bilder durch Aktivierung von Neuronen erzeugt, und ein weiteres Netz, das beurteilt, ob diese Imagination aussieht wie ein echtes Bild. Das generierende Netz (Generator) versucht dann, das beurteilende Netz (den Diskriminator) immer besser zu täuschen.

Unter dem Hashtag #ganbreeder kann man sich auf Twitter allerlei lustige Kreationen anderer User anschauen - oder man erzeugt einfach seine eigene.

Das Weihnachtsgeschenk für Data Scientisten


Was schenkt man einem Mathe-Nerd?

Allen Voraussagen zum Trotz kommt Weihnachten doch immer ganz plötzlich, und dann steht man wieder da mit einem kurzen Hemd mitten im Winter: was zur Hölle schenke ich eigentlich XY? Vor allen Dingen, wenn XY eine Data Scientistin oder ein Data Scientist oder sonstwie Matheverrückte/r ist, bleibt das ideale Geschenk mitunter eine ungelöste Variable.

Hier sind ein paar Dinge, die mir persönlich dieses Jahr besonders gut gefallen haben.

Ein Galtonbrett

Ein Galtonbrett zeigt auf spielerische Art und Weise gleich mehrere Aspekte des Alltags eines Data Scientisten: der Zufall bahnt sich seinen Weg, hier in Form von kleinen Stahlkügelchen, die allesamt die gleiche Chance haben, auf ihrem Weg nach unten nach links oder rechts abgelenkt zu werden. Schließlich entsteht eine Form, die sich deutlich als Glockenkurve zu erkennen gibt.

In Aktion sieht das ganze so aus: ist das nicht wunderbar?

In Deutschland ist das Galtonboard derzeit nur beim Mathematikum Gießen erhältlich: https://shop.mathematikum.de - wer das Mathematikum in Gießen nicht kennt, sollte aber zumindestens Prof. Beutelspacher kennen, den Autoren zahlreicher studentenfreundlicher Bücher. Der hat auch das Mathematikum “erfunden”.

Ein Roman: “NSA” von Andreas Eschbach

Das Buch “Nationales Sicherheits-Amt” von Andreas Eschbach, druckfrisch im Oktober 2018, bettet die aktuelle Diskussion um Internetüberwachung, Vorratsdatenspeicherung, Datenanalyse, Cloud-Speicher und mithörende Geräte in die düstere Geschichte des Dritten Reiches ein. Ausgehend von der Frage, was wäre gewesen, wenn der Computer schon im 19. Jahrhundert erfunden worden wäre - und nicht erst zum Ende des Zweiten Weltkrieges - baut Eschbach eine hervorragend in den Kontext der Zeit passende Geschichte, mit mobilen Volkstelefonen und bargeldlosen Geschäften.

Tut mir einen Gefallen und versucht, jedwedem Spoiler zu widerstehen, so dass die Erzählung ihre unmittelbare Kraft entfalten kann.

NSA - Nationales Sicherheits-Amt ist bei Bastei Luebbe erschienen.

Schokolade

Data ScientistInnen haben einen hohen Energiebedarf, gerade in der kalten Jahreszeit. Also, seid so gut, und packt noch einen Riegel Schokolade ins Weihnachtspaket. Wahlweise auch mit Nüssen, sofern diese nicht aufgrund von Allergien kontraindiziert sind.

Bremen kann KI


bremen.ai ging in die 2. Runde

Die gestrige zweite Event aus der Veranstaltungsreihe von bremen.ai war nicht nur überaus gut besucht, sondern auch höchst spannend zu verfolgen. Die Besucher von vielen kleineren und größeren Bremer Unternehmungen, in Form von sowohl etablierten Akteuren als auch Neugründungen, lassen schon erahnen, wie vielfältig KI in Bremen sein kann und auch heute schon ist.

Für mich war Bremen schon immer ein Top-Standort für KI in Deutschland, zum einen durch das DFKI, aber natürlich auch durch die hervorragende Arbeit an der Bremer Universität. Gut, dass bremen.ai das nun auch nach außen tragen möchte.

Als unternehmensübergreifendes Forum wird bremen.ai eine Heimat im Verein “Bremen Digitalmedia e. V.” erhalten und somit auch offiziell in öffentliche Hand gelegt. Unterstützt wird bremen.ai vom Senator für Wirtschaft, Arbeit und Häfen.

Die ersten Pflänzchen verwurzeln sich auch schon: neben Meetups zu speziellen Themen, wie Chatbots oder Deep Learning, werden auch weitere Formate eingeübt, bspw. Erfahrungstausch in Sachen Fördermittel, die in den kommenden Jahren im KI-Bereich zulegen werden, aber auch technische Hands-On Workshops scheinen nicht undenkbar, so dass die KI für viele besser erfahrbar werden kann.

Finger, die auf Zeiger zeigen


Zeige mir, wo der Mauszeiger ist

Auf pointerpointer.com geht das Spiel so: man platziert seinen Mauszeiger, und eine Künstliche Intelligenz findet ein Foto, auf dem eine Person abgebildet ist, die mit ihrem Zeigefinger auf die Position zeigt, die Du am Bildschirm mit Deinem Mauszeiger gezeigt hast.

Eben Zeigefinger, die auf Mauszeiger zeigen - pointerpointer.com - Ein lustiger Spaß für zwischendurch :-)

Humble Bundle: Big Data


Ein großes Paket für Storytelling

Ein neues Humble Bundle zum Thema Big Data & Infographics mit Büchern aus dem Hause Wiley steht zur Verfügung - viele Bücher und Charity für die Ärzte ohne Grenzen, wer kann da schon wiederstehen?

Folgende E-Books sind im großen Paket enthalten, die meisten als PDF und EPUB (einige nur als PDF):

  • “Painting with Numbers: Presenting Financials and Other Numbers So People Will Understand You”
  • “Presenting Data: How to Communicate Your Message Effectively”
  • “Stories that Move Mountains: Storytelling and Visual Design for Persuasive Presentations”
  • “Storytelling with Data: A Data Visualization Guide for Business Professionals (Excerpt)” (enthalten sind Kapitel 1 - 3 des Bestsellers)
  • “101 Design Methods: A Structured Approach for Driving Innovation in Your Organization”
  • “Cool Infographics: Effective Communication with Data Visualization and Design”
  • “The Visual Organization: Data Visualization, Big Data, and the Quest for Better Decisions”
  • “Visualize This: The FlowingData Guide to Design, Visualization, and Statistics”
  • “Data Points: Visualization That Means Something”
  • “Infographics: The Power of Visual Storytelling”
  • “Graph Analysis and Visualization: Discovering Business Opportunity in Linked Data”
  • “Tableau Your Data!: Fast and Easy Visual Analysis with Tableau Software, 2nd Edition”
  • “Visualizing Financial Data”

Die Rache der Neuronen


Ein Schaufenster in das Treiben der Wissenschaft

Warum nicht mal Data Science auf die Publikationen der Wissenschaft anwenden, dachten sich wohl drei französische Wissenschaftler, und zeigen mit ihrem Paper “La revanche des neurones”, wie sich polemisch geführte Diskussionen in der Wissenschaft auf die gesamte Wissenschaftsgemeinde und auf Beschaffung von Forschungsgeldern auswirken - am Beispiel des Aufkommens und Verschwindens von Neuronalen Netzen.

Und dabei ging es ja eigentlich auch nur um das olle XOR-Problem. Und niemand hat ja auch etwas gegen symbolische KI, die auch heute immer noch ihre Kraft entfalten darf. Nichtsdestotrotz gelangte die KI in eine Sackgasse, die erst Ende der 80er Jahren so langsam wieder verlassen wurde.

Source: https://neurovenge.antonomase.fr/ - Illustration by Antoine Mazières, WTFPL public license

Sehr schön finde ich auch die in der Studie enthaltene Analyse eines Text-Korpus, die zeigt, welche Wissenschaftler welche andere zitiert haben - wodurch die zwei historischen Cluster der Symbolisten und der Konnektionisten wieder sichtbar werden. Mehr kann man direkt auf der neurorevenge-Seite in Erfahrung bringen.

Ein wenig traurig ist das Muster ja schon: so wie einst das Verfahren von Bayes wegpolemisiert wurde und heute im Zeitalter der Computer zum defacto-Standard gehört, so wiederholte sich dies mit dem KI-Winter ein ums weitere Mal in der jüngeren wissenschaftlichen Vergangenheit. Ob die Wissenschaft aus diesem Muster etwas lernen wird?

Die Haupterkenntnisse wurden ins Englische übersetzt, das Paper selbst ist in Französisch geschrieben. Et voilà! Merci pour cette belle publication!

KI statt Arbeit


Elektronengehirne

Kaum waren in den 40er Jahren des letzten Jahrhunderts die ersten elektronischen Rechner zusammengelötet, ist auch das Wort “Elektronengehirn” entstanden. Nach anfänglicher Euphorie der Kybernetiker gab es lange Zeit eine Stagnation in der Entwicklung der künstlich intelligenten Systeme.

Die letzten 10 Jahre haben jedoch gezeigt, dass auch für unwahrscheinlich gehaltene Dinge plötzlich möglich sind. Die rasante Entwicklung hat auch jemanden wie mich, der sich schon lange mit KI beschäftigt, in vielerlei Hinsicht überrascht.

Wird es Deinen Beruf bald noch geben?

Wenn heute jemand behauptet, dass in Zukunft viel der menschlichen Arbeit wegfallen wird, ist kaum jemand anderer Meinung. Das World Economic Forum prognostiziert, dass bereits in 7 Jahren die Hälfte der Arbeit von Maschinen übernommen wird (derzeit wird bereits ein Drittel der Arbeit maschinell verrichtet).

Kniffliger wird es, wenn die Frage gestellt wird, wie es denn um den eigenen Beruf bestellt ist. Viele sagen dann: “das lässt sich doch nicht von einer Maschine erledigen”. Wenn ich dann zurückfrage, warum das so ist, höre ich meistens: “hier geht es um den Bauch, um kreative Prozesse, um etwas, das schlicht nicht zu formalisieren ist”. Das mag vielleicht stimmen: schlimmer wäre es jedoch, würde uns schlicht die Phantasie dazu fehlen, dass auch vermeintlich anspruchsvolle Arbeit durch einen Automaten ersetzt werden könnte. Eitelkeit wird niemanden davor bewahren, dass sich auf der Welt ständig wiederholende und selbstähnliche Aufgaben - bspw. auch in der Softwareentwicklung - von Software steuern lassen.

Der australische KI-Forscher Tony Walsh sagte jüngst in einem Interview mit netzpolitik.org:

Jedes Mal, wenn wir dachten, wir seien etwas Besonderes, lagen wir falsch: Die Sonne drehte sich nicht um die Erde. Wir stammten doch vom Affen ab. Wir sind vergleichsweise schlau, aber zu glauben, das sei schon das Maximum, wäre selbstbezogen und wahrscheinlich falsch.

In seinem Buch It’s Alive - Wie künstliche Intelligenz unser Leben verändern wird gibt Prof. Walsh ferner den Mahner, dass die technologische Entwicklung auch in eine gesellschaftliche Entwicklung eingebettet sein sollte.

Machine Learning Flashcards


Ein Paket Lernkarten für Maschinelles Lernen

Schön, wenn Enthusiasten auch etwas zu teilen haben: und mal ganz ehrlich, man kann eigentlich nie genug über das Thema Maschinelles Lernen in Erfahrung bringen. So hat Chris Albon eine ganze Reihe von Lernkarten gepinselt, die man in mehreren Hunderten zu einem Preis von $12 in verschiedenen DRM-freien Formaten erwerben kann - von der mobiltauglichen Auflösung bis zum druckreifen PDF (wobei Chris aber auch gleich einen Tipp gibt, wie man quasi gratis via Twitter an die Grafiken kommen kann).

Ihr findet seine Lernkarten unter machinelearningflashcards.com.

Der Anfang ist nah


Datenschätze im E-Commerce - der Fachtag 2017 bei neuland

Auf dem neuland Fachtag 2017 hatte ich das wunderbare Vergnügen, vor vielen klugen Köpfen einen Vortrag zum Thema Künstliche Intelligenz zu halten. Rahmenthema des Fachtages waren die “Datenschätze im E-Commerce”, und ich hoffe, dass den ZuhörerInnen der Vortrag genauso viel Spaß bereitet hat wie mir bei der Vorbereitung und Durchführung.

http://www.youtube.com/watch?v=ozFvnmnFeK8

Datenschätze im E-Commerce : neuland Fachtag 2017 : Der Anfang ist nah

Im Grunde sind vier der großen fünf Ideen des maschinellen Lernens enthalten:

  • Nächste Nachbarn
  • Lernen durch Verstärken
  • Konnektionismus
  • Evolutionäre Algorithmen

Eine ganz große Methode habe ich ausgelassen:

  • Lernen mit Bayes

Was einfach daran liegt, dass ich bis heute keine einfache, intuitive Erklärung für das Bayes’sche Lernen aus Daten gefunden habe - natürlich kann man über Wirkung und Ursache oder über die inverse Wahrscheinlichkeit sprechen, man kann Anekdoten erzählen über den Glaubenskrieg der alten Statistiker, aber wie die Mechanik des Lernens mit Bayes nun funktioniert, dafür habe ich bisher nur abstrakte oder geometrische Analogien gefunden.