import pandas as pd
import numpy as np
import plotly.graph_objects as go
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot


node_labels = ['Students', '4th Grade', '5th Grade', 'Girls', 'Boys', 'Aquarium', 'Museum']


node_ids = {y:x for x, y in enumerate(node_labels)}
node_ids

{'Students': 0,
 '4th Grade': 1,
 '5th Grade': 2,
 'Girls': 3,
 'Boys': 4,
 'Aquarium': 5,
 'Museum': 6}


source = ['Students', 'Students', '4th Grade', '4th Grade', '5th Grade', '5th Grade',
          'Girls', 'Girls', 'Boys', 'Boys']


target = ['4th Grade', '5th Grade', 'Girls', 'Boys', 'Girls', 'Boys', 
          'Aquarium', 'Museum', 'Aquarium', 'Museum']


value = [75, 100, 40, 35, 45, 55, 65, 20, 30, 60]


source_node = [node_ids[x] for x in source]
target_node = [node_ids[x] for x in target]


fig = go.Figure( 
    data=[go.Sankey(node = dict(label = node_labels),
        link = dict(
        source = source_node,
        target = target_node,
        value = value
        ))])

fig.show()

{'NRA - n = 845,015': 0,
 'Everytown - n = 259,098': 1,
 'FAIR - n = 415,262': 2,
 'UWD - n = 129,985': 3,
 'NRA - n = 727,032': 4,
 'Everytown - n = 241,981': 5,
 'FAIR - n = 331,946': 6,
 'UWD - n = 125,201': 7,
 'Removed - n = 223,200': 8,
 'NRA - n = 263,021': 9,
 'Everytown - n = 108,975': 10,
 'FAIR - n = 82,955': 11,
 'UWD - n = 56,218': 12,
 'Removed - n = 914,991': 13,
 'NRA - n = 212,558': 14,
 'Everytown - n = 95,397': 15,
 'FAIR - n = 69,818': 16,
 'UWD - n = 49,583': 17,
 'Removed - n = 83,813': 18,
 'NRA - n = 171,618': 19,
 'Everytown - n = 82,218': 20,
 'FAIR - n = 57,687': 21,
 'UWD - n = 43,859': 22,
 'Removed - n = 71,974': 23,
 'Final - n = 313,302': 24,
 'Removed - n = 42,080': 25}


node_labels = ['NRA - n = 845,015', 'Everytown - n = 259,098', 'FAIR - n = 415,262', 'UWD - n = 129,985', 
             'NRA - n = 727,032', 'Everytown - n = 241,981','FAIR - n = 331,946', 'UWD - n = 125,201', 'Removed - n = 223,200',
             'NRA - n = 263,021', 'Everytown - n = 108,975',  'FAIR - n = 82,955', 'UWD - n = 56,218', 'Removed - n = 914,991',
             'NRA - n = 212,558', 'Everytown - n = 95,397',  'FAIR - n = 69,818', 'UWD - n = 49,583', 'Removed - n = 83,813',
             'NRA - n = 171,618', 'Everytown - n = 82,218',  'FAIR - n = 57,687', 'UWD - n = 43,859', 'Removed - n = 71,974',
             'Final - n = 313,302', 'Removed - n = 42,080']

node_ids = {y:x for x, y in enumerate(node_label)}
node_ids

{'NRA - n = 845,015': 0,
 'Everytown - n = 259,098': 1,
 'FAIR - n = 415,262': 2,
 'UWD - n = 129,985': 3,
 'NRA - n = 727,032': 4,
 'Everytown - n = 241,981': 5,
 'FAIR - n = 331,946': 6,
 'UWD - n = 125,201': 7,
 'Removed - n = 223,200': 8,
 'NRA - n = 263,021': 9,
 'Everytown - n = 108,975': 10,
 'FAIR - n = 82,955': 11,
 'UWD - n = 56,218': 12,
 'Removed - n = 914,991': 13,
 'NRA - n = 212,558': 14,
 'Everytown - n = 95,397': 15,
 'FAIR - n = 69,818': 16,
 'UWD - n = 49,583': 17,
 'Removed - n = 83,813': 18,
 'NRA - n = 171,618': 19,
 'Everytown - n = 82,218': 20,
 'FAIR - n = 57,687': 21,
 'UWD - n = 43,859': 22,
 'Removed - n = 71,974': 23,
 'Final - n = 313,302': 24,
 'Removed - n = 42,080': 25}


source = ['NRA - n = 845,015','Everytown - n = 259,098','FAIR - n = 415,262','UWD - n = 129,985',
          'NRA - n = 845,015','Everytown - n = 259,098','FAIR - n = 415,262','UWD - n = 129,985',
          'NRA - n = 727,032','Everytown - n = 241,981','FAIR - n = 331,946','UWD - n = 125,201',
          'NRA - n = 727,032','Everytown - n = 241,981','FAIR - n = 331,946','UWD - n = 125,201',
          'NRA - n = 263,021','Everytown - n = 108,975','FAIR - n = 82,955','UWD - n = 56,218',
          'NRA - n = 263,021','Everytown - n = 108,975','FAIR - n = 82,955','UWD - n = 56,218',
          'NRA - n = 212,558','Everytown - n = 95,397','FAIR - n = 69,818','UWD - n = 49,583',
          'NRA - n = 212,558','Everytown - n = 95,397','FAIR - n = 69,818','UWD - n = 49,583',
          'NRA - n = 171,618','Everytown - n = 82,218','FAIR - n = 57,687','UWD - n = 43,859',
          'NRA - n = 171,618','Everytown - n = 82,218','FAIR - n = 57,687','UWD - n = 43,859']

target = ['NRA - n = 727,032','Everytown - n = 241,981','FAIR - n = 331,946','UWD - n = 125,201',
          'Removed - n = 223,200','Removed - n = 223,200','Removed - n = 223,200','Removed - n = 223,200',
          'NRA - n = 263,021','Everytown - n = 108,975','FAIR - n = 82,955','UWD - n = 56,218',
          'Removed - n = 914,991','Removed - n = 914,991','Removed - n = 914,991','Removed - n = 914,991',
          'NRA - n = 212,558','Everytown - n = 95,397','FAIR - n = 69,818','UWD - n = 49,583', 
          'Removed - n = 83,813','Removed - n = 83,813','Removed - n = 83,813','Removed - n = 83,813',
          'NRA - n = 171,618','Everytown - n = 82,218','FAIR - n = 57,687','UWD - n = 43,859',
          'Removed - n = 71,974','Removed - n = 71,974','Removed - n = 71,974','Removed - n = 71,974',
          'Final - n = 313,302','Final - n = 313,302','Final - n = 313,302','Final - n = 313,302',
          'Removed - n = 42,080','Removed - n = 42,080','Removed - n = 42,080','Removed - n = 42,080']

value = [ 727032, 241981, 331946, 125201, 117983, 17117, 83316, 4784, 
          263021, 108975, 82955, 56218, 464011, 133006, 248991, 68983,
          212558,95397,69818,49583,50463,13578,13137,6635,
          171618,82218,57687,43859,40940,13179,12131,5724,
          158537,73480,44787,36498,13081,8738,12900,7361]


source_node = [node_dict[x] for x in source]
target_node = [node_dict[x] for x in target]


fig = go.Figure( 
    data=[go.Sankey(node = dict(label = node_label),
        link = dict(
        source = source_node,
        target = target_node,
        value = value
        ))])

fig.show();


plot(fig, image_filename='sankey_plot_1', image='png', image_width=1000, image_height=600);

Creating a Sankey Plot to Simplify Flow Processes¶

Intro¶

Getting Started¶