Die Iden­ti­fi­zie­rung und schnelle Umset­zung von Big Data Use Cases ent­schei­det über den Erfolg von Big Data Initia­ti­ven. Busi­ness Know-how, die Bereit­schaft Geschäfts­pro­zesse vom Kun­den her zu den­ken, ana­ly­ti­sche und metho­di­sche Fähig­kei­ten, Prag­ma­tis­mus und Krea­ti­vi­tät sind wich­tige Fak­to­ren auf dem beschwer­li­chen Weg der digi­ta­len Trans­for­ma­tion. Und nicht zu ver­ges­sen, ein biss­chen Inspi­ra­tion. Des­halb möch­ten wir Ihnen aus unse­ren aktu­el­len Pro­jek­ten Use Cases vor­stel­len. In die­sem Blog­bei­trag star­ten wir mit Use Cases aus dem Retail Banking.

Use Case 1: Auto­ma­ti­sierte Erstel­lung eines Digi­ta­len Haushaltsbuchs

Big Data Use Cases im Retail Banking Bild1

Vor der Bewil­li­gung eines Kre­dits müs­sen die Kun­den häu­fig nach­wei­sen, dass sie über genü­gend freie Mit­tel zur Rück­zah­lung des Kre­dits ver­fü­gen. Dazu müs­sen Sie ein Haus­halts­buch über meh­rere Monate füh­ren, in dem sie ihre Aus­ga­ben kate­go­ri­sie­ren (Miete, Ver­si­che­run­gen, Auto, Rei­sen, Lebens­mit­tel, Frei­zeit, Medien, Anschaf­fun­gen etc.). Man­che Ban­ken unter­stüt­zen die­sen Pro­zess, indem sie ihren Kun­den ein digi­ta­les Haus­halts­buch anbie­ten. Aller­dings bleibt dann immer noch für den Kun­den die oft auf­wen­dige Zuord­nung von Ein- und Aus­zah­lun­gen zu Kate­go­rien. Auch wenn durch die Hin­ter­le­gung von Regeln die­ser Pro­zess teil­weise auto­ma­ti­siert wer­den kann, bleibt immer noch ein manu­el­ler Auf­wand. Wenn man z.B. in einer ande­ren Edeka-Filiale ein­ge­kauft hat, ver­sagt die hin­ter­legte Regel. Des­halb hat eine Bank für ihre Kun­den einen Ser­vice geschaf­fen, bei dem die Kun­den für die letz­ten 13 Monate auto­ma­tisch ein Haus­halts­buch erstel­len las­sen kön­nen. Dabei wer­den alle Kon­to­be­we­gung mit Hilfe von Ver­fah­ren des Maschi­nel­len Ler­nens mit sowohl Klas­si­fi­zie­rungs- als auch Clus­te­rungs­al­go­rith­men kate­go­ri­siert und dann für den Kun­den auf­be­rei­tet. Eine beson­dere Her­aus­for­de­rung hier­bei war die Ana­lyse der Ver­wen­dungs­zwe­cke der ein­zel­nen Trans­ak­tio­nen, da wie im oben gen­n­ann­ten Bei­spiel mit Edeka unter­schied­li­che tex­tu­elle Reprä­sen­ta­tio­nen der­sel­ben Kate­go­rie ange­hö­ren kön­nen. Über ver­schie­dene Text­mi­ning-Metho­den konn­ten hier­bei zusätz­li­che Varia­blen abge­lei­tet wer­den, die zur Kate­go­ri­sie­rung der Trans­ak­tio­nen bei­tra­gen konn­ten. Anschlie­ßend wird der Kunde auf­ge­for­dert, den Inhalt des Haus­halts­bu­ches zu prü­fen und, falls alles kor­rekt ist, zu bestä­ti­gen. In die­sem Fall kann schnell über die Gewäh­rung des Kre­dits ent­schie­den wer­den. Der UC wurde u.a. auf Basis der Spark MLlib auf einem Hadoop-Clus­ter rea­li­siert, pro Monat kom­men 50 Mil­lio­nen neue Daten­sätze hinzu. Die Umset­zung die­ses UC hat dazu geführt, dass für viele Kun­den die Cus­to­mer Jour­ney bei der Bean­tra­gung eines Kre­dits ange­neh­mer und schnel­ler gewor­den ist. Die­ses führt dann zu einer erhöh­ten Kun­den­bin­dung auch bei den Kun­den, die kei­nen Kre­dit benö­ti­gen, aber ihre Ein- und Aus­ga­ben zukünf­tig ohne Auf­wand im Blick haben wollen.

Use Case 2: Real­time Moni­to­ring von Geldautomaten

Die Log­ging­da­ten aller Geld­au­to­ma­ten wer­den real­time in einen Data Lake gepumpt, um Reports in nahezu Echt­zeit durch­füh­ren zu kön­nen. So gibt es aktu­elle Infor­ma­tio­nen über den Betrieb­sta­tus der Geld­au­to­ma­ten. Auch kann pro­gnos­ti­ziert wer­den, wann Bank­no­ten im Gerät wie­der auf­ge­füllt wer­den müs­sen. In einer wei­te­ren Aus­bau­stufe sol­len uner­laubte Zugriffe auf die Fest­platte des Bank­au­to­ma­ten pro­to­kol­liert und ana­ly­siert wer­den. Auch könn­ten Bank­kun­den, die ihr Geld nicht aus dem Auto­ma­ten ent­nom­men haben, per SMS infor­miert werden.

Big Data Use Cases im Retail Banking Bild2

Use Case 3: Big Data Anwen­dung für Datenschutzbeauftragten

Big Data Use Cases im Retail Banking Bild3

Die neue Daten­schutz-Regu­lie­rung der EU tritt im Mai 2018 end­gül­tig in Kraft, muss aber vor­her in natio­na­les Recht über­nom­men wer­den. Als ernst­haf­ter Ver­stoß gilt dabei die Nicht­ein­hal­tung der Grund­sätze in Bezug auf die Ver­ar­bei­tung per­so­nen­be­zo­ge­ner Daten (Arti­kel 5) sowie der Bestim­mun­gen zur Ein­wil­li­gung betrof­fe­ner Per­so­nen (Arti­kel 7). Des­halb ist es für Unter­neh­men zur Ver­mei­dung von hohen Straf­zah­lun­gen und eines Shit­s­torms in den Medien wich­ti­ger denn je, genau zu prü­fen und fest­zu­le­gen, wel­che Per­son in wel­cher Funk­tion Zugriff auf wel­che Daten und Infor­ma­tio­nen hat. Aus die­sem Grunde wer­den die Zugriffe der Bank­mit­ar­bei­ter auf Kun­den­da­ten über alle Infor­ma­ti­ons­sys­teme auf der Ana­ly­ti­schen Platt­form zusam­men­ge­führt und für die Com­pli­ance-Abtei­lung ana­ly­sier­bar gemacht. Auf diese Weise sol­len z.B. „ver­däch­tige“ Zugriffe auf Kun­den­da­ten iden­ti­fi­ziert wer­den. Zur Ermitt­lung auf­fäl­li­ger Zugriffe wur­den Algo­rith­men wie Ran­dom For­rest, Neu­ro­nale Netze sowie Sup­port Vec­tor Machine ein­ge­setzt. Die Modelle wur­den auf Basis von R erstellt und für das Deployment.