Seminar: Visual Analytics

Any questions? Please use discord.

Einleitung

Die Analyse hochdimensionaler Daten spielt in zahlreichen Bereichen eine zentrale Rolle. Die Anwendungsbeispiele reichen von Finanzdaten (Aktienkurse), Daten von Kreditkartenbewegungen, Genexpressionsdaten bis hin zu epidemiologischen Daten und Patientendaten. Zielgruppen solcher Anwendungen sind Investoren, Sicherheitsabteilungen, Biologen, Statistiker und Mediziner.

Dieses Seminar gibt einen Überblick, wie man derartige große, hochdimensionale, teilweise unzuverlässige und unvollständige Daten mit Hilfe von Datenanalysetechniken und interaktiven Visualisierungen analysiert, die eng miteinander verknüpft sind. Die Teilnehmer sollen einerseits im Erfassen, Auseinandersetzen und Präsentieren von wissenschaftlichen Forschungsarbeiten geschult werden. Andererseits soll ihnen ein grundlegendes Verständnis hinsichtlich der Eigenschaften und Parameter wichtiger Datenanalysemethoden gegeben werden und gezeigt werden, wie diese Methoden in Visual Analytics-Systemen integriert werden können.

Der interdisziplinäre Charakter der Entwicklung und Anwendung von Visual-Analytics-Ansätzen wird betont. Dazu gehören auch Fragen der visuellen Wahrnehmung und kognitiven Verarbeitung visueller Daten und deren Rolle in Entscheidungsprozessen. Besonderes Augenmerk wird auf den Prozess der Wissensgenerierung gelegt, den Prozess, durch den Beobachtungen, Hypothesen, statistische Ergebnisse und andere Artefakte generiert und verwaltet werden.

Material

RECHTLICHER HINWEIS
Dieses Video ist urheberrechtlich geschützt und darf nur im Rahmen von Lehrveranstaltungen der Friedrich-Schiller-Universität Jena verwendet werden. Eine Nutzung durch Verbreitung oder Veröffentlichung dieses Materials – auch in Auszügen – ist strengstens untersagt und wird die Geltendmachung von Unterlassungs- und Schadenersatzansprüchen durch die Friedrich-Schiller-Universität Jena zur Folge haben.

Einführung zum SeminarEinführung.pdf
Video zur EinführungVideo.mp4
Latex VorlageVorlage.zip

Organisation

Für die inhaltliche Bearbeitung des Seminars sind sieben Themenbereiche vorgesehen, wobei für jeden Bereich dazugehörige Literaturangaben bereitgestellt werden. Ein Teilnehmer wählt sich ein Paper aus und bearbeitet dieses. Eine Bearbeitung als Gruppe ist nur dann möglich, wenn das Thema dafür auch entsprechend gekennzeichnet ist. Die Themenvorstellung, -vergabe und entsprechende Terminvereinbarungen erfolgen im ersten Seminartreffen oder Online.

Die Bearbeitung eines Themas erfolgt zunächst durch das inhaltliche Erfassen des Themas aus der bereitgestellten Literatur (meist englische Paper). Die wichtigsten Inhalte müssen dann in Form eines 15-20 minütigen Vortrages präsentiert und anschließend in einer ca. 5-10 minütige Diskussion “verteidigt” werden. Abschließend wird von den präsentierten Inhalten eine schriftliche Ausarbeitung von max. 10 Seiten angefertigt. Hinweise und Beispiele zum Anfertigen des Vortrages sowie der Ausarbeitung sind hier zu finden.

Für einen erfolgreichen Abschluss des Seminars ist neben der oben erwähnten Themenbearbeitung auch die aktive(!) Teilnahme am Seminar erforderlich.

Hinweis: Einige Paper sind auf das ACM-Portal verlinkt, wo man nur einen freien Zugang über das Uninetzwerk und seinen Bibliotheksaccount hat!
Weiterhin sind einige Paper nur über den Seminarleiter zu bekommen, da sie aus rechtlichen Gründen nicht öffentlich verlinkt werden dürfen.

Themengebiete

  • Cluster Analysis
    • Steffen Oeltze, Dirk J. Lehmann, Alexander Kuhn, Gabor Janiga, Holger Theisel, and Bernhard Preim.
      Blood Flow Clustering and Applications in Virtual Stenting of Intracranial Aneurysms. In IEEE Transactions on Visualization and Computer Graphics (
      TVCG), 20(5), pp. 686-701, 2014
    • Nan Cao, David Gotz, Jimeng Sun, Huamin Qu, “DICON: Interactive Visual Analysis of Multidimensional Clusters,” IEEE Transactions on Visualization
      and Computer Graphics (TVCG) Vol. 17(12):2581-2590, 2011
    • Michael Sedlmair, A. Tatu, Tamara Munzner, Melanie Tory: A Taxonomy of Visual Cluster Separation Factors. Comput. Graph. Forum 31(3): 1335-1344 (2012)
    • C. Turkay, J. Parulek, N. Reuter, and H. Hauser. Interactive visual analysis of temporal cluster structures. Comput. Graph. Forum, 30(3):711–720, 2011.
  • Scatterplot-Based Visual Representations
    • Adrian Mayorga and Michael Gleicher. Splatterplots: Overcoming Overdraw in Scatter Plots. In IEEE Transactions on Visualization and Computer Graphics (
      TVCG), Vol. 19, No. 9, 2013.
    • Craig, P., J. Kennedy, A. Cumming. “Animated interval scatter-plot views for the exploratory analysis of large-scale microarray time-course data.”
      Information Visualization 4.3 (2005): 149-163.
    • M. Gleicher, M. Correll, C. Nothelfer, S. Franconeri: „Perception of Average Value in Multiclass Scatterplots“, IEEE Trans. Vis. Comput. Graph.
      19(12): 2316-2325 (2013)
    • Dang Tuan Nhon, L. Wilkinson (2014). “ScagExplorer: Exploring Scatterplots by Their Scagnostics”, Proc. of IEEE PacificVis 2014: 73-80
  • Dimension Reduction and Projection
    • Dong Hyun Jeong, Caroline Ziemkiewicz, Brian Fisher, William Ribarsky, and Remco Chang. iPCA: An Interactive System for PCA-based Visual Analytics.
      Eurographics/ IEEE-VGTC Symposium on Visualization, Volume 28, Number 3, 2009.
    • E. Barshan, A. Ghodsi, Z. Azimifar, M. Z. Jahromi: Supervised principal component analysis: Visuali-zation, classification and regression on subspaces
      and submanifolds. Pattern Recognition 44(7): 1357-1371 (2011)
    • S Ingram, T Munzner, M Olano.„Glimmer: „Multilevel MDS on the GPU“, IEEE Transactions on Visualization and Computer Graphics 15 (2), 249-261, 2009
    • S Johansson, J Johansson. “Interactive dimensionality reduction through user-defined combinations of quality metrics”, IEEE Trans. Vis. Comput. Graph. 15
      (6), 993-1000, 2009
  • Visualization of Decision Trees
    • van den Elzen, S.J.; van Wijk, J.J., BaobabView: Interactive construction and analysis of decision trees. Proceedings IEEE Symposium on Visual Analytics
      Science and Technology, 23-28, 2011.
    • J. Zhang, Le Gruenwald, M. Gertz (2009). „VDM-RS: A visual data mining system for exploring and classifying remotely sensed images“ Computers & Geosciences,
      Volume 35(9): 1827-1836
    • Liu, Y., Salvendy, G. (2007). „Design and evaluation of visualization support to facilitate decision trees classification”, Int. Journal of Man-Machine
      Studies 65(2): 95-110 (2007)
    • O Parisot, Y Didry, T Tamisier, B Otjacques (2013). „Using clustering to improve decision trees visualization“, Proc. of International Conference on
      Information Visualisation (IV), pp. 186-191
  • Visual Analytics with Regression Models
    • Paul Klemm, Kai Lawonn, Sylvia Glaßer, Uli Niemann, Katrin Hegenscheid, Henry Volzke, Bernhard Preim. 3D Regression Heat Map Analysis of Population
      Study Data. IEEE transactions on visualization and computer graphics 22.1 (2015): 81-90.
    • Thomas Mühlbacher, Harald Piringer: “A Partition-Based Framework for Building and Validating Regression Models”, IEEE Trans. Vis. Comput. Graph. 19(12):
      1962-1971 (2013)
    • Harald Piringer, Wolfgang Berger, J. Krasser: „HyperMoVal: Interactive Visual Validation of Regression Models for Real-Time Simulation“, Comput. Graph.
      Forum 29(3): 983-992 (2010)
    • Şeyma Yaşar, A. Kadir Arslan, Cemil Çolak, Saim Yoloğlu. A Developed web-based software can easily fulfill the assumptions of correlation, classification
      and regression tasks in data processing. International Artificial Intelligence and Data Processing Symposium (IDAP) 2019.
  • Visual Analytics in Public Health
    • Mooney, S. J., & Pejaver, V. (2018). Big data in public health: terminology, machine learning, and privacy. Annual review of public health, 39, 95-112.
    • Galetsi, P., Katsaliaki, K., & Kumar, S. (2019). Values, challenges and future directions of big data analytics in healthcare: A systematic review.
      Social Science & Medicine, 112533.
    • DeepthiKrishnan, K., & Kumar, B. S. (2018). A Survey on Disease Prediction by Machine Learning over Big Data from Healthcare Communities. IOSR Journal of
      Engineering, 8(10), P53-59.
    • Ola, O., & Sedig, K. (2014). The challenge of big data in public health: an opportunity for visual analytics. Online journal of public health informatics,
      5(3), 223.
  • Immersive Analytics
    • Cliquet, G., Perreira, M., Picarougne, F., Prié, Y., & Vigier, T. (2017, October). Towards hmd-based immersive analytics.
    • Chandler, T., Cordeil, M., Czauderna, T., Dwyer, T., Glowacki, J., Goncu, C., … & Wilson, E. (2015). Immersive analytics. In 2015 Big Data Visual Analytics
      (BDVA). In IEEE, September (pp. 1-8).
    • Sommer, B., Baaden, M., Krone, M., & Woods, A. (2018). From virtual reality to immersive analytics in bioinformatics. Journal of integrative bioinformatics, 15(2).
    • Itoh, T., Marriott, K., Schreiber, F., & Wössner, U. (2016). Immersive Analytics: A new multidisciplinary initiative to explore future interaction technologies
      for data analytics. Shonan Reports.