Původně to měla být taková malá prázdninová inventura mých čtenářů...

Při pohledu na současné signaly.cz se zdá, že od července 2013 do konce června 2014 přibyly nové články na 537 blozích. Dohromady to dělá 4867 příspěvků. Úvodní ilustrace se pokouší tyto příspěvky vnímat v jejich vazbách. Nicméně 44 204 kliknutí na "Tohle se mi líbí" slibuje při vyjádření hranami grafu určitou míru nepřehlednosti. Nespekulujme nyní o množství času, který 2069 uživatelů identifikovatelných dle jejich psaní a "lajkování" strávilo na signaly.cz, a zkusme se podívat na nějaký výběr z dat.

Výřez z druhého grafu zachycuje psavce, kteří publikovali v uplynulém roce více než 10 příspěvků. Propojující čáry jsou zobrazeny pouze v případě, že se jednotlivým lidem líbilo 3 či více příspěvků autora na druhém konci čáry. Volně dostupný software Gephi bohužel (při křivkovém zobrazení umožňující zachytit obousměrnost vazby) neumožňuje vykreslit šipky. Se stejnými daty se vypořádal následovně "komerční poskytovatel všeho":

https://www.google.com/fusiontables/embedviz?containerId=googft-gviz-canvas&viz=GVIZ&t=GRAPH&gc=false&gd=true&sdb=1&rmax=100000&q=select+col0%2C+col1%2C+col2+from+1GYAoTew2GyGIru9p_KkrGhGt-oha9PApL2robErM&qrs=+where+col0+%3E%3D+&qre=+and+col0+%3C%3D+&qe=&uiversion=2&state=%7B%22ps%22%3A%221_1_-t_1n_2_4_-7_7_-2_f_o_d_-v_3_-p_r_l_-1w_a_6_r_6_r_-j_-9_h_-1h_-z_5_-k_-17_0_p_t_u_-1w_-i_e_-m_-o_9_-1a_r_b_-6_19_w_-2_-1j_1u_-1o_w_n_-14_-g_1a_-12_d_i_-l_6_k_-13_-1b_x_4_1p_v_1w_g_11_-9_-t_1n_-1f_-2_4_-1d_19_a_-1y_1h_1c_-2p_d_c_-11_-4_g_-10_-t_z_-1f_-j_1l_-2d_8_15_-1p_1s_t_-1h_e_17_1m_-14_q_-21_v_y_-u_-1q_1g_v_20_j_-j_-1n_m_-23_-10_14_a_s_12_f_-1p_p_z_-h_1k_-1m_-1l_8_-5_-15_d_-u_1_s_1j_-d_19_1p_-t_1q_-k_16_1s_-2h_-x_1y_2_-2f_1j_2t_o_1d_-2f_-5_1h_2p_10_16_-38_-2_1f_2w_9_1r_-3q_f_1x_1j_2q_18_2l_-1m_1b_-2i_2a_1e_-j_2k_10_18_-s_13_-11_2t_1i_32_k_1m_2s_-n_1o_-2k_q_1z_-b_-3n_20_1a_-1t_f_-y_-26_1p_-26_2i_1t_30_-1k_1v_-2z_1l_1w_1w_1n_%22%2C%22cx%22%3A-43.95676712378261%2C%22cy%22%3A-15.516094424814744%2C%22sw%22%3A1034.308405654561%2C%22sh%22%3A380.94898068347004%2C%22z%22%3A0.7531156529999512%7D&gco_forceIFrame=false&gco_hasLabelsColumn=true&width=475&height=300

Svět, který se skrývá za termínem "Force-directed graph", je pestrý a vábivý. Pozadu samozřejmě nezůstává ani knihovna D3.js (viz). Pokud byste věděli o nějakém zajímavém a efekt(iv)ním způsobu, jak z velkých dat tohoto typu získávat nečekané informace, podělte se.

"Václav nepřemýšlí, rovnou analyzuje." Nějakou takovou hlášku jsem o sobě slyšel. Ale třeba i na nějakou interpretaci dojde. Zatím se jen poněkud úchylně raduji z dat a možnosti jejich analýzy.